ICASSP2022收录小米AI实验室6篇论文 多模态语音唤醒挑战赛夺冠

1月22日,全球语音声学顶级会议ICASSP 2022公布入选论文名单,收到小米AI Lab篇学术论文。小米的“自由语音”系统获得了MISP多模态语音觉醒一等奖和多模态语音识别二等奖(基于多模态信息的语音处理)挑战赛,并受邀在今年5月的全球大会上向业界和学术界做方案报告。这也是小米语音方向的第六个世界级比赛冠军。

Icassp(国际声学、语音和信号处理会议)是国际声学、语音和信号处理会议,是国际上由IEEE主办的规模最大、内容最全面的信号处理及其应用顶级会议,在国际上享有较高的声誉和广泛的学术影响力。

小米实验室采用的论文涉及语音识别、语音合成、声学语音质量评价等多个方向。这一次,小米的语音和声学都取得了优异的成绩,这离不开小米工程师在实际业务中扎实的技术积累,实践中总结出来的技术进步将反馈给业界和学术界,共同推动AI技术的繁荣发展。

在演讲领域,小米的演讲团队在2017年的学术峰会上开始发表重要论文,在TTS(语音合成)综合自研以及合成的节奏、个性化、情感等方面取得重大突破。生活助手萧艾学员的语音定制效果、合成流畅性和稳定性、合成情绪化都有了显著提升。

同时,小米对语音唤醒和预训练进行了深入研究,提升了个性化语音唤醒和小米听音的性能,降低了萧艾的误唤醒率,保证了语音唤醒的质量,受到ICASSP评测者的高度评价。

在声学领域,小米声学团队致力于AI声学技术的研究和工程落地,为小米手机和IoT生态硬件产品打造行业领先的音频体验。目前,AI通话降噪、协同唤醒、协同播放、空间音频等技术已应用于手机、电视、小爱、耳机等60余款产品。在过去的四年里,有123项专利被审查。

未来,小米将继续探索科技新高度,为大家带来更多黑科技,让更多人享受科技带来的美好生活。