4月29日,腾讯云正式发布金融、音视频等多个领域专属语音识别模型。最新发布的模型不仅识别准确率得到大幅提升,同时也增加了对粤语、韩语的支持,后面会陆续开放对上海话等方言以及日语、泰语、印尼语等国外语言的支持。
正式发布金融行业专属模型,字准率业界领先
据了解,语音识别在金融行业应用场景广泛,但是实际场景下,很多用户都是使用方言在和外呼、客服机器人交流,加上金融领域有着大量的专有句式和词汇,市场上目前通用的语音识别模型存在识别不准的情况。
基于这些的痛点,腾讯云AI团队与微信智聆联合打造了金融行业专属语音识别模型,这个模型的推出不仅能够有效解决上述难题,还在识别的准确率上得到大幅提升。目前该模型已经在金融领域的智能外呼、智能客服、电话录音质检等多个场景落地。经客户实测,字准率在业界处于领先水平。
率先打造音视频专属语音识别模型,准确率提升10%
随着互联网直播浪潮的兴起,如何利用智能语音技术快速识别用户的音视频内容、进行精准推荐和不健康内容过滤,已经成为各大直播和内容分享平台在日益激烈的市场竞争中的核心竞争力。但由于音视频背景环境复杂且属于半远场,需要有大量数据积累才能实现准确识别。
凭借自身在音视频领域数据的大量积累,腾讯云在业界率先推出了音视频领域专属语音识别模型,目前已在多家音视频领域直播平台和电商直播平台应用,经客户实测,识别准确率提升近10%。
语种丰富度进一步提升,腾讯云语音识别加速落地