铝满足智能图形 无缝加入虚拟世界

文/周小琦

编辑/单个

“360buy.com拍卖了19.36吨鱿鱼干,成交金额为178.12万英镑。人生有两大悲哀:不如咸鱼,不如鱿鱼。”

在今年的京东双十一全球好东西节期间,六个可爱的卡通虚拟主持人用诙谐的语言准确地播报各种销售数据,还可以与他们实时互动,了解他们想知道的数据。

JD.com并不是第一次使用虚拟锚。它还与杭州心香科技有限公司(以下简称心香科技)合作,后者是该技术的提供者,展示虚拟主持人景小帅和景肖磊的真实图像。

京东人工智能高级产品经理徐俊凯表示,心香科技一直是京东人工智能解决方案的合作伙伴。此次内容升级基于京东的销售数据,卡通虚拟主播播报京东的销售数据,很好地体现了京东的技术创新模式。

全球虚拟现实/现实市场规模,东吴证券报告图片

随着5G浪潮的到来,虚拟现实/现实可能会得到快速发展。根据中国信息通信研究所的数据,2018年全球虚拟现实市场将超过700亿元,同比增长126%。

在各方的有利条件下,相关技术正逐步渗透到消费端。传统图形主要使用数学工具来模拟现实世界,这就是基于物理的方法。它主要解决专业用户如何生成图形供人们观看的问题,即PGC内容。

近年来,图形的发展越来越趋向于普通用户如何能够容易地生成图形内容。计算机图形学结合了计算机视觉、机器学习、人机交互等领域的知识,实现了内容的自动生成和更加自然的交互,形成了智能图形的概念。

新一代图形越来越多地使用数据,并趋向于数据驱动方法,这种方法促进了自动内容生成和自然的交互方式。由于UGC内容制作的推广,其应用场景也扩展到短片、直播和更多应用场景。

相位核心技术成立于2016年,是智能图形技术领域的创新者。该公司专注于人工智能计算机图形。目前,其产品主要包括视频增强现实特效、虚拟图像自动生成、人工智能虚拟主持人、人工智能虚拟助手等。

阶段核心技术3D卡通虚拟锚

如今,成立近四年的心香科技已经服务了近500个终端用户,包括百度、微软萧冰、传音、浙江卫视等。相关技术也广泛应用于许多行业,如智能手机、直播、短视频、在线教育、新零售等。

心香科技凭借其雄厚的技术实力和广阔的市场前景,在成立一年后就实现了盈利,并连续三年实现盈利。但要走到这一步并不容易。

突破瓶颈,在消费者层面打开相机,选择河豚鱼的图像,一个生动的敌意(3D动画表达)出现在屏幕的最后。随着真人张开嘴的动作,屏幕上的阿莫吉吐出了一系列的泡泡,就像他在水里一样。

在陌生人社交应用灵魂的功能中,头像(虚拟3D图像)实时表情捕捉已经成为年轻群体的热门功能。虚拟图像不仅可以还原真实的人的表情,增加社会兴趣,还可以保护自己在与陌生人交流时的安全。

相位核心技术的虚拟图像驱动

实现看似简单的应用程序并不容易。《阿凡达》并不新鲜,已经应用于电影、电视、动画、游戏等领域,但这项技术从未真正进入消费者领域。原因在于《阿凡达》推广中的技术瓶颈和成本问题。

根据锌财经对心香技术的介绍,在消费级设备上实现头像技术的难度主要在于头像的生成和头像驱动的交互。

以前,在生成虚拟形象时,构建一个能够实现所有动态效果(如表情)的真实3D模型需要很长时间,而且成本很高,这直接导致虚拟形象难以在消费领域实现大规模应用。

因此,照片头像(PTA)由照片头像(PHOTO Avatar)创造,这是世界上第一个自动生成虚拟图像的技术。原始的高成本和耗时的头像生成只需要一张照片,即完全动态的头像可以以第二速度自动生成。用户只需要一部智能手机就能实现,从而大大降低了虚拟形象生成的硬件成本。

同时,在头像驱动方面,相位核心技术突破性地使用了智能手机上的普通摄像头,无需使用深度摄像头就能准确捕捉面部表情,使头像的表情始终随着用户的表情实时变化。这大大降低了用户的创建难度,使用户体验更加真实。

目前,心香科技的核心技术人员来自浙江大学、微软亚洲研究院、苹果等公司,在计算机图形学、计算机视觉、虚拟现实/现实等技术领域拥有20多年的研发经验。

经过不断努力,阶段核心技术现已全面开发出头像生成、交互和渲染技术的整体布局,可支持人脸、舌头和眼球等56个表情系数的融合。

在细节方面,阶段核心技术也不含糊。添加了具有物理动态效果的仇恨。当用户实时驾驶时,他们会发现在耳朵、头发等部位,他们会根据物理力学自然摆动,效果更加真实、生动。

与市场上的同类产品相比,心香科技的动漫表现灵活丰富,比同类产品更具规模。

长期以来,让创作更简单、互动更自然、体验更真实已经成为心香科技不断努力的目标。

从互动到“交流”和“中国浙江排名”在今年的京东双十一全球美食节上,工作人员直接询问了京东3D虚拟主播景小帅。

然后,景小帅的脖子微微倾斜,他的眼睛闪烁,他微笑着面对一个专业的主持人。他报告说,2019年京东全球好东西节见证了浙江省消费的强劲增长。从订单数量来看,该省排名前五的城市是杭州、温州和台州。

整个播出过程很顺利,与真正的主持人没有任何区别。由JD.com人工智能和心香技术共同构建的人工智能虚拟锚成为人工智能从交互到交流的重要展示方式。

心香技术与京东人工智能创造的人工智能虚拟锚京小水

在移动互联网时代,智能手机通过其更加自然的交互和灵活的应用方式,不仅承载了一些基于个人电脑的传统互联网应用,还衍生出更加丰富的移动互联网生态。随着5G、云计算等技术的发展,必将提升用户体验,实现人机无缝交流。

这些巨头还通过智能扬声器行业的布局切入了未来一切事物的互联生态。然而,在此之前,大多数产品仍处于语音交互阶段,用户可能需要进行多轮对话来获取所需信息,这无疑降低了获取信息的效率。

屏幕显示正成为智能扬声器升级换代的重要标志。根据市场研究机构Canalys披露的统计数据,2019年第三季度,带屏幕的智能扬声器同比增长高达500%,占智能扬声器总销量的22%。

智能音箱具有屏幕迭代功能,这使得拥有一个可视化人工智能虚拟智能助手成为标准,该助手具有个性化的图像和与用户面对面的交互。

阶段核心技术的人工智能虚拟助手解决方案已经全面铺开。独立开发的语音动画合成技术(sta)将人工智能与计算机图形学结合起来。

在计算机获取语音或文本的内容信息后,STA可以通过计算机图形合成技术驱动和融合虚拟图像的脸部,实现具有逼真感觉的表情恢复。

阶段核心技术开发的STA技术

同时,相位核心技术的STA技术可以与市场上主流的语音识别、自然语言处理和语音合成技术兼容,不仅可以为用户带来视觉虚拟图像的升级,还可以提高用户的视觉体验

目前,PHC还可以根据不同的需求定制自己的图像,包括3D卡通、3D动物、3D数字人、2.5D模拟器、深度学习模拟器等类型,可以应用于医疗、金融、教育、零售等各种应用场景。

从简单的人机交互到交互式人机交互,技术突破带来了不同的体验。只有掌握了这些技术,玩家才能真正扎根于未来,成长为新一代的巨人。

多维应用场景“浙江启动第二号台风应急响应,杭州萧山国际机场目前已取消20个航班,台风乐基马在温岭市东南225公里……”人工智能主持人“范晓”总是宣布超级台风“莱基马”的最新消息。

今年八月,李奇马登陆江苏和浙江沿海地区。为了应对这场超级台风,钱江电视台钱江视频推出了人工智能主持人“范晓”,每天24小时向公众播放李奇马的最新消息。

范晓,心香科技和钱江频道打造的人工智能虚拟主持人

人工智能虚拟主持人并不新鲜,但钱江频道和心香科技联合打造的人工智能主持人成功完成了突发事件的播报任务,标志着人工智能虚拟主持人实际登陆的新突破。

心香科技的登陆场景远远超出了媒体领域,可以在游戏、社交网络、电子商务和教育领域完美匹配。

在视频增强现实特效的应用中,美容化妆功能很受女性欢迎。面部核心技术基于一个人面部的209个关键点,支持粉底、腮红、口红、眼线等10个美容化妆维度。它可以帮助客户轻松打造个性化妆容,而无需重新打造美容化妆材料。

例如,在一个单一的美容化妆维度中,女性需要选择自己的颜色号码,因为有更多的红色口型号码。此时,只要预先预设多个色号的唇膏道具,并在客户端进行加载和切换,就可以实现唇膏的实时测色功能,不仅可以提高顾客的选择效率,还可以实时看到化妆效果。

同时,在在线社交领域,心香科技也能提供完美的解决方案。利用虚拟图像自动生成技术,用户可以定制自己的卡通图像,并进行实时交流。双方可以形成良好的互动,而不用担心暴露隐私。

在使用过程中,用户只需上传一张自画像照片,通过相核技术的虚拟图像自动生成技术,可以生成个性化的3D卡通图像,个性化的3D卡通图像与个人特征高度匹配,增强了用户互动的自然性。

具体来说,阶段核心技术将提取用户的面部特征,如脸型、面部特征、发型、皮肤、胡须等。通过对信息进行风格化处理,它将生成一个具有自己特征的图像,并达到成千上万人和成千上万张面孔的效果。

在这背后的技术应用中,阶段核心技术使用端到端神经网络生成个性化图像,其中神经网络分为纵向网络和风格化网络。人像网络负责综合分析用户上传的照片,提取人脸特征,完成三维人脸重建。风格化网络将重建的人脸模型卡通化。

实现千人千面的阶段核心技术虚拟图像自动生成技术

与此同时,心香科技开发了一系列虚拟图像交互应用场景,并提供了客户端的SDK,用于虚拟图像的进一步个性化定制和交互,这也使得访问各种虚拟现实/现实应用变得容易。

值得注意的是,2018年,心香理工大学和浙江大学还成立了“浙江大学-心香理工大学智能图形计算联合实验室”,加强了其在技术上的探索和突破。智能图形技术的创新和发展也将得到进一步的研究。

目前,心香科技积累的技术壕沟为消费者应用开辟了市场,建立了全方位、多维度的服务体系。未来,万物互联时代的到来将为心香科技带来更大的发展空间和更大的发展空间