人工智能时代即将到来 输入法如何在未来10年获胜
最近,迅飞输入法新版本正式推出,包括日汉翻译、韩汉翻译、泰越西翻译、法德翻译、俄语翻译和中文翻译在内的18种翻译,使迅飞输入法成为中外翻译最多的输入法产品。
必须说,语音输入已经变得越来越流行。据艾媒体《2019-2020中国第三方手机输入法市场监测报告》报道,29%的受访者表示,2019年使用语音输入的频率显著增加,这是增长最快的输入法。
面对输入法的变化,迅飞输入法、百度输入法和搜狗输入法围绕人工智能技术不断增加语音输入服务,从而在准确性上不断实现突破。例如,迅飞输入法的语音识别准确率达到了98%。
在日益智能化的输入法背后,每个家庭的人工智能技术都至关重要。面对每天数亿次甚至数十亿次的使用,今天的输入法产品已经嵌入了意想不到的彩色黑色技术。
输入法的负担
越来越多的智能输入法的代价是要承担越来越多的繁重任务。追溯市场上几种主流输入法产品的发展历史,我们可以发现这些产品并不年轻,而且至少有十年或更长的产品迭代时间。基于这种计算,输入法产品的开发与移动互联网同步,可以说是一直跟随着移动互联网。
最早的输入法,无论是设备自己的输入法还是第三方输入法,通常都有简单的功能。例如,它们只支持9键和26键键盘输入、手写输入和其他在非智能机器时代继承的输入方法,主要是为了满足最常见的用户需求。
然而,移动社会化、清晰的移动趋势和智能手机的普及彻底改变了输入法产品的发展道路。个人用户继续在各种场景中产生更多的输入需求,并开始特别关注输入体验的进展,希望获得更快更好的结果,例如他们是否能够根据拼音的首字母快速预测他们想要输入的单词。特别是在移动社交场景中,个人用户使用输入法的频率越来越高,用户对输入法体验的感知非常明显。输入法好不好,效率不高,所以用户很熟悉。
这使得输入法的负担越来越重。最初被定位为轻量级服务工具的输入法,必须开始考虑如何满足不同场景中不同用户的个性化需求。因此,为大规模用户提供高质量的输入服务已经成为输入法产品开发的核心目标。
更通用的输入法
场景和需求的变化不断推动输入法产品的发展,因此输入法变得越来越通用、越来越精致、越来越个性化。以三种主要输入法产品为例,十年前和十年后它们“完全不同”。
一方面,功能的不断增加使产品适应许多输入场景。除了传统的手写和键盘输入,这三种输入方式还增加了光学字符识别扫描、智能预测/纠错等功能。其中,OCR扫描是指用户可以通过扫描将图片或手写文稿转换成字符,而智能预测功能可以根据输入的拼音预先预测用户想要输入的字符,智能纠错可以根据词库和上下文快速纠正用户的错误。
输入法具有多种功能,可以服务于用户的整个输入过程,并在输入前、输入中和输入后提供相应的服务。
另一方面,产品功能的最终突破给用户带来了全面的体验。以迅飞输入法为例,它是从语音开始的。目前,迅飞输入法的输入速度达到了每分钟400字,语音识别的准确率达到了98%,这意味着整个输入的错误率非常小,给用户带来了一个快速流畅的综合输入体验。
可以说,极限达到了
无论是在功能上无所不能还是在经验上无所不能,输入法产品都可以实现质变,甚至可以适应一些极端和极端的输入场景。除了产品本身的创新,持续的技术迭代是核心原因。为什么用户只能在一半的时间内完成整个输入过程,这取决于输入法背后的黑色技术。
荀飞输入法可以说是“科技成果输入法”的最佳代言人。一方面,它积累了200,000小时的训练数据支持科达迅飞,这是由智能语音技术沉淀了20多年;另一方面,科达讯飞在国际比赛中获得了太多的最高荣誉。例如,在2018年由国际计算语言学协会主办的第12届国际语义评估大赛中,科达迅飞获得了基于常识的机器阅读理解世界第一;在2018年国际权威英语语音识别大赛“磬-6”中,科达迅飞获得两项第一;2019年,在2019年国际田联举办的圣VQA现场文字视觉问答挑战赛中,科达迅飞获得三项冠军;2020年初,在德国200亿杰斯特数据集的手势识别评估中,HKUST迅飞以97.26%的准确率获得冠军,创造了新的世界纪录.荀飞输入法背后的黑色技术可以从四个方面来看。
首先,语音输入
语音输入非常精确。迅飞输入法之所以能达到每分钟400字的水平和98%的识别准确率,主要是因为其自主开发的“记忆增强型多通道全端到端语音识别框架”。该技术简单,能够全面深入地学习前端语音处理过程,并使用深度卷积神经网络和后端识别模型进行混合训练,从而大大提高了语音识别的效率。
至于使用23种方言进行准确语音输入的能力,一方面依赖于通过共享多种方言而训练的多语言多语言建模技术,另一方面依赖于全球电话。该技术从声学相似度上统一了各方言的音素定义,使方言“语言地图”模型进一步细化,从而有效提高了方言识别效果。多语言翻译给这项技术带来了更大的挑战。以汉英翻译为例,迅飞输入法提出了一种基于反样本训练方法的“高鲁棒性语音翻译技术”,并结合模型中的具体技术有效提高最终翻译结果。
第二,拼音输入
在拼音输入方面,迅飞输入法创新性地引入了编解码框架,构建了新一代拼音识别引擎,大大简化了传统的拼音识别模型。同时,在注意机制、长短期记忆网络的门控机制以及变压器等模块的共同作用下,有效提高了长句子输入的识别效果,能够提前预测用户想要输入的内容,有效实现智能纠错。
另外,由于该模型采用顺序建模,建模不再依赖词典,更容易实现汉英混合建模,因此迅飞输入法在汉英混合输入中取得了优异的混合输入性能。值得注意的是,在智能预测和智能纠错的背后,有数百万个词汇可以实时更新。
第三,手写输入
这也是手写,但体验完全不同,因为迅飞输入法的手写识别可以支持2万多种汉字、52种英文字符、10种阿拉伯数字和100多种特殊符号。这种超级识别能力的背后是迅飞输入法的“HWR手写识别技术”。该技术采用美国有线电视新闻网卷积神经网络技术,支持实时手写轨迹,边写边写,单个字符识别仅需15毫秒,响应速度快,无延时。
第四,扫描输入
扫描输入的技术支持是计算机视觉。面对复杂的手写字符和中英文混合字符,“OCR字符检测技术”可以检测任何方向和形状的字符,“OCR字符识别技术”可以有效缓解环境造成的识别效果低的问题
综上所述,基于人工智能和大数据相结合的技术,今天的输入法已经不再死板、生硬,即使面对复杂的输入场景,也能满足不同语言、不同语境、不同语调的不同用户的需求。过去,输入法只能起辅助作用,但现在,科技支持的输入法更像是“一站式”的输入管家。
输入法的智能推广
黑色技术使输入法及其地位。根据相关报道提供的数据,以三大输入法为代表的第三方输入法已经覆盖了90%以上的中国网民。
如果我们把它扩大到整个输入法行业,我们可以说每个人都是输入法的受益者,无论是移动设备还是个人电脑,日常交流都离不开输入法的帮助。可以说输入法已经成为互联网通信的基础设施。幸运的是,迅飞输入法等head产品的技术进步使这一基础设施不断发生质的变化,变得越来越智能。
应该说,像迅飞输入法这样的输入法产品,总是痴迷于“技术驱动”,是输入法作为工具产品价值跨越式提升的关键,因为它们利用技术无限提升输入法产品价值的上限。换句话说,迅飞输入法的“科技法则”在一定程度上提高了整个互联网世界的沟通与合作效率。
技术没有上限,输入法产品也没有上限。对于中国的9.04亿互联网用户来说,在Black Technology的不断祝福下,输入法工具将继续为每个用户提供独特的体验,真正实现全方位的智能化和包容性。