百度地图推出语音定制功能技术温暖和想象空间的双重突破

文章

2016年,电影《从你的全世界路过》上映,其中一个场景非常令人向往。在去亚丁的路上,稻城,——,毛柴犬,由杨洋扮演,用他自己录制的语音导航包进行导航。包装中所蕴含的强烈的个人风格和饱满的爱心,不仅让每个人都开心、快乐,也让无数人开始想象,当他们能够像电影中的毛一样,用自己的声音为自己所爱、所关心的人导航包装时。当然,向往属于向往,但大家也知道,这是百度地图的电影植入,作为普通大众,我们应该像电影中的毛一样在地图应用中录制自己的语音导航包,这基本上是不可能的事情。

然而,科学技术的进步常常把过去的不可能变成现在的可能。

9月19日,百度地图正式发布了“语音定制功能”,开启了以前针对明星名人到普通用户群的语音定制功能。这使得三年前看似不可能的事情正式进入普通用户社区,这样每个普通人都可以录制自己的语音导航包。

普通用户如何将自己的语音导航包记录为世界上第一个地图语音定制产品?根据百度地图,用户只需在百度地图应用上记录20个句子,并在大约20分钟内生成一个完整的个人语音包。从个人经验来看,整个录音操作可以说非常简单,而且基本上没有使用门槛。在百度地图中,实际上有多条路径记录语音导航包。

首先,最简单的方法是打开百度地图应用,通过语音唤醒“小度”,然后说“录制我的声音”直接跳转到录音选择界面,然后根据界面进行操作升级。就我个人而言,我认为这是最省事的方法。

当然,也有稍微复杂的方法,具体来说:

1.打开百度地图应用,点击百度地图首页的“路线”、“旅行助手”和“个人中心”按钮,然后选择“语音定制”进入相应页面。

2.进入页面后,点击底部的“录制我的声音”按钮,进入录音选择界面进行录音选择。

3.根据规则进行升级,确认后,即可开始独家语音定制。

当然,上述两种方法都要求用户在输入语音文本后等待大约20分钟,以产生专用语音包。

在黑色技术——说话人韵律转换技术Meitron之后,问题出现了,百度地图是如何让这个三年前看似不可能的事情正式进入普通用户社区,让我们普通人可以录制自己的语音导航包的?

它的背后离不开百度最初的说话人韵律转移技术——迈腾,这是一项黑色技术。这项技术可以将语音中的音色、风格、情感和其他元素映射到不同的子空间。使用时,不同的元素可以任意组合,以灵活控制合成语音的风格。作为百度脑5.0在语音技术方面的成果之一,实际上,该技术的诞生是为了解决语音合成技术在现阶段面临的三大挑战:风格转换、音色模拟和情感拟人。据相关数据显示,自2016年以来,百度通过采用基于深度学习的离线参数合成、基于全面深度学习的EMPHASIS声学建模、Tacotron WaveRNN联合训练等新技术,对语音合成产品的落地进行了培训和推广。到目前为止,百度在语音合成产品方面已经逐步取得了行业领先的体验成果。

百度语音的总设计师雷佳说:“百度地图语音定制功能是基于百度的原创风格转移技术——迈创模式。其特点主要体现在三个方面:音色转换、多情感阅读和韵律转换。具体而言,多情感阅读指的是合成语音通过MEITRON技术注入不同情感的事实,韵律传递指的是同一个人的声音可以说出不同风格的文本的事实,音色转换指的是少量语音可以用来合成一个人独有的声音库的事实。这三个优点的祝福也使得语音合成效果更加逼真和丰富,用户体验也得到了改善。的确,从个人经验来看,这句话是对的。

百度为什么要在百度地图上打开“语音定制功能”?在这里,我们还得谈谈这样一个现实问题:百度向1亿用户开放语音定制,这样每个普通用户都可以通过百度的语音合成技术简单快速地生成自己的语音导航包。目的是甚麽?或者它能带来什么?个人浅见,大概有三个目的。

从用户的角度来看,百度地图开放的语音定制功能首先有助于满足用户的个性化需求,实现真正的千人一面。正如我们所见,百度地图作为一个全国性的导航软件,每天被数亿用户用于导航。在此之前,百度地图邀请汤唯、杨洋等明星录制语音导航包,以增加语音导航的人性化和趣味性,满足用户需求。

然而,虽然星星有很强的吸引力,可以吸引爱情豆使用,但它们也有圈的限制。不可能每个人都喜欢明星的语音导航风格。这是事实。

然而,这一次百度向用户开放了语音定制功能,将定制权下放到了用户手中,让每个用户只需简单的几个步骤就可以拥有自己的语音导航包,这对于满足用户的个性化需求,实现真正的千人千面大有裨益。

其次,这是百度实践技术温暖和让用户拥有技术的又一体现。百度一直认为,真正的科技不应该冷冷地存在,而应该融入人文关怀。这一次百度已经在百度地图上开通了语音定制功能。就个人而言,似乎正是如此。

正如我们所见,在语音导航定制包中,我们不仅可以录制自己的语音,还可以录制父母、爱人和孩子的语音导航包。

想象一下,在驾驶过程中,听到父母、爱人或孩子的声音导航,而不是星星的声音导航,会是什么样的心情和体验。可以说,与星空语音导航包相比,自己录制的语音导航包显然可以让更多的人类和温暖的存在更近一步,这可能就是技术包容和赋予所有生物权力的真正含义。当然,这也将进一步缩小用户和产品之间的距离。

同时,百度的地图回放语音定制功能也是其自身语音技术的展示。如上所述,语音识别与合成技术是目前业界的研究热点和研究难点。百度在这个领域已经努力了很长时间,并取得了相当大的成就。

然而,百度在全国导航平台百度地图上开放语音定制功能,可以说是对其自身语音合成技术的前所未有的培训,这显然离不开技术的自信支持。试想一下,如果你对自己的技术能力没有足够的信心,并在如此大的规模上向用户开放,恐怕没有人敢轻易尝试。毕竟,是你的脸被不好的经历推翻了。

通过百度地图,我们可以看到百度原创的说话人韵律转移技术美创带来的技术温暖。在这里,我们不难发现这样一个现实:基于百度大脑5.0的说话人韵律转移技术美创不仅可以登陆百度地图,还可以登陆教育产品、伴侣机器人等产品,这无疑为这项技术带来了更多的想象空间。可以说,百度地图只是开始,未来的空间是不可估量的。

注意:本文中的图片来自互联网。请注明转载文章的来源。

作者:邻近章节[:ZLxgic公开号码:TMT317],主要关注智能手机、人工智能、消费行业互联网等。