刘聪:科大讯飞直播场景下识别准确率已达85%
时间:2020-10-23 17:20:05
作者:重庆seo小潘
来源:
()10月23日 消息:今天下午,科大讯飞AI研究院常务副院长刘聪发表了关于“构筑AI科技树,焕新美好新生活”的主题演讲。在演讲中,刘聪提到了如何保持AI技术不断突破以及如何实现应用落地的问题。 刘聪认为,在人工智能的应用场景中,最重要的一个就是语音交
()10月23日 消息:今天下午,科大讯飞AI研究院常务副院长刘聪发表了关于“构筑AI科技树,焕新美好新生活”的主题演讲。在演讲中,刘聪提到了如何保持AI技术不断突破以及如何实现应用落地的问题。
刘聪认为,在人工智能的应用场景中,最重要的一个就是语音交互。他称语音识别是讯飞的传统强项。近年来,科大讯飞陆续推出了方言识别、远场交互、多麦克风阵列等相关的功能,将语音听写从简单场景的可用做到了通用。
下一步,科大讯飞将持续深耕语音识别,去挑战更加复杂的场景,去实现从语音到声音,从单纯的文字内容的识别,到音频的全场景解析。例如直播场景这样有游戏、音乐以及笑声、掌声等各种音效嘈杂的背景下,如何有针对性地提取想要的声音。
面对这种复杂的环境,科大讯飞已经有一套全场景音频解析的整体方案。目前,可达讯飞在直播场景下的识别准确率已经从从60%提到了85%。未来,这些相关技术会在科大讯飞的开放平台、讯飞听见等上线。