人工智能时代来临 输入法如何赢得未来10年

最近,迅飞输入法新版本正式推出,增加了18种翻译和快速翻译功能,使迅飞输入法成为最受欢迎的中外文翻译输入法产品。

我不得不说语音输入已经变得越来越流行了。艾梅《2019-2020中国第三方手机输入法市场监测报告》显示,29%的受访者表示,2019年语音输入的频率将大幅增加,这是增长最快的输入法。

面对输入法的变化,迅飞输入法、百度输入法和搜狗输入法三种输入法也围绕人工智能技术不断给语音输入服务添加代码,使其在准确性上不断实现突破。例如,迅飞输入法的语音识别准确率达到了98%。

在输入法日益智能化的背后,来自不同家庭的人工智能技术的祝福是至关重要的。面对每天数亿甚至数十亿次的需求,今天的输入法产品已经嵌入了意想不到的彩色黑色技术。

输入法的负担

越来越多的智能输入法的代价是背负越来越重的使命。回顾市场上几种主流输入法产品的发展历史,我们可以发现这些产品并不年轻,至少有十年或更长的产品迭代时间。根据这一计算,输入法产品和移动互联网的发展是同步的,可以说是跟随了移动互联网的发展。

最早的输入法,无论是配备了自己的输入法还是第三方输入法,都具有相对简单的功能。例如,它们只支持9键和26键键盘输入、手写输入和其他继承自非智能机器时代的输入方法,主要是为了满足最常见的用户需求。

然而,移动社交的清晰性、移动趋势和智能手机的普及彻底改变了输入法产品的发展路径。个人用户继续在多种情况下产生更多的输入需求,并开始特别关注输入体验的改善,希望获得更快更好的结果,例如他们是否能够根据拼音的首字母快速预测他们想要输入的字符。特别是在移动社交场景中,个人用户使用输入法的频率越来越高。用户对输入法体验的感知非常明显。输入法好坏,效率不高。用户实际上知道它。

这使得输入法的负担越来越重。最初定位为灯光服务工具的输入法不得不开始考虑如何满足不同场景中不同用户的个性化需求。因此,同时为大规模用户提供高质量的输入服务已经成为输入法产品开发的核心目标。

日益通用的输入法

场景和需求的变化不断推动着输入法的发展。因此,输入方法变得更加通用、更加复杂和更加个性化。以当前三种输入法为例。十年前,它们与十年后“完全不同”。

一方面,功能的不断增加使产品能够适应许多输入场景。除了传统的手写和键盘输入,这三种输入方式还包括光学字符识别扫描、智能预测/纠错等功能。其中,OCR扫描是指用户可以通过扫描将图片或手写文本转换成字符,而智能预测功能可以根据输入的拼音预先预测用户想要输入的字符,智能纠错可以根据字库和上下文快速纠正用户的错误。

丰富的各种功能使输入法能够服务于用户的整个输入过程,并在输入之前、期间和之后的每个环节提供相应的服务。

另一方面,产品能力的突破给用户带来了全面的体验。以迅飞输入法为例,它是从语音开始的。目前,迅飞输入法的输入速度达到了每分钟400字,语音识别准确率达到了98%,这意味着整个输入的错误率非常小,给用户带来了快速流畅的综合输入体验。

可以说,这些功能达到的极限颠覆了以前的低效率

无论是功能万能还是经验万能,输入法产品都可以实现质变,甚至可以适应一些极端和极端的输入场景。除了产品本身的创新,持续的技术迭代是核心原因。为什么用户只能花一半的时间来完成整个输入过程,这取决于输入法背后的黑色技术。

迅飞输入法可以说是“科技成果输入法”的最佳代言人。一方面,它有20万小时的训练数据积累在HKUST迅飞的背后,这是20多年的智能语音技术沉淀下来的。另一方面,HKUST迅飞在国际比赛中获得了太多的最高荣誉。例如,在2018年由国际计算语言学协会举办的第12届国际语义评估大赛中,HKUST迅飞在基于常识的机器阅读理解方面获得了世界第一名。在2018年的国际权威英语语音识别大赛“钟声-6”中,科大迅飞获得了两个第一名。在2019年举行的首届VQA视觉问答挑战赛中,科大迅飞获得了三项冠军。2020年初,在德国200亿杰斯特数据集的手势识别评估中,科大迅飞以97.26%的准确率获得冠军,创造了新的世界纪录.荀飞输入法背后的黑色技术可以从四个方面来看。

一、语音输入

语音输入非常精确。迅飞输入法之所以能达到每分钟400字的水平和98%的识别准确率,主要是因为其自主开发的“记忆增强型多通道全端到端语音识别框架”。该技术简单,能够全面深入地学习前端语音处理过程,并使用深度卷积神经网络和后端识别模型进行混合训练,从而大大提高了语音识别的效率。

至于能够使用23种方言进行准确的语音输入,一方面依赖于通过多方言共享训练的多语言多语言建模技术,另一方面依赖于GlobalPhone全局音素集。该技术从声学相似度上统一了各方言的音素定义,进一步细化了方言“语言地图”模型,从而有效提高了方言识别效果。多语言翻译功能对技术提出了更大的挑战。以汉英翻译为例,迅飞输入法在对抗样本训练方法的基础上,提出了一种“高度鲁棒的语音翻译技术”,融合了副语言特征,并结合模型中的具体技术,有效地提高了最终的翻译效果。

第二,拼音输入

在拼音输入方面,迅飞输入法创新性地引入了编解码框架,构建了新一代拼音识别引擎,大大简化了传统的拼音识别模型。同时,在注意机制、长短期记忆网络的门控机制以及变压器等模块的共同作用下,有效提高了长句子输入的识别效果,能够提前预测用户想要输入的内容,有效实现智能纠错。

此外,由于该模型使用了序列建模,建模不再依赖于词典,更容易实现中英文混合建模,从而使得迅飞输入法在中英文混合输入中取得了优异的混合输入性能。值得注意的是,在智能预测和智能纠错的背后,有一百万个词库可以实时更新。

三。手写输入

这也是手写,但体验完全不同,因为迅飞输入法的手写识别可以支持2万多种汉字、52种英文字符、10种阿拉伯数字和100多种特殊符号。这种超级识别能力的背后是迅飞输入法的“HWR手写识别技术”。该技术采用美国有线电视新闻网卷积神经网络技术,支持实时手写轨迹,边写边写,单个字符识别仅需15毫秒,响应速度快,无延时。

四.扫描输入

扫描输入的技术支持是计算机视觉。面对复杂的手写字符和中英文混合字符,“字符识别技术”可以检测任意方向和形状的字符,“字符识别技术”可以检测任意方向和形状的字符

综上所述,基于人工智能和大数据相结合的技术,今天的输入法已经不再死板、生硬,即使面对复杂的输入场景,也能满足不同语言、不同语境、不同语调的不同用户的需求。过去,输入法只能起辅助作用,但现在,在科技的庇佑下,输入法更像是一个“一站式”的输入管家。

输入法的智能普惠

黑色技术已经取得了输入法及其地位。根据相关报道提供的数据,以三种输入法为代表的第三方输入法已经覆盖了90%以上的中国网民。

如果我们扩大到整个输入法行业,我们可以说每个人都是输入法的受益者,无论是移动设备还是个人电脑,日常交流都必须依靠输入法的帮助。可以说,输入法已经成为一种互联网通信基础设施。此外,幸运的是,迅飞输入法等head产品的技术进步使这一基础设施不断发生质的变化,变得越来越智能。

应该说,一直被“技术驱动”输入法困扰的迅飞输入法等输入法是输入法作为工具产品价值飞跃的关键,因为它们利用技术无限提高输入法的价值极限。换句话说,迅飞输入法的“科技法则”在一定程度上提高了整个互联网世界的沟通与合作效率。

技术没有上限,输入法产品也没有上限。对于9.04亿中国互联网用户来说,在黑色技术的不断加持下,输入法工具将继续为每个用户提供独特的使用体验,真正实现全方位智能包容。