亮点和插槽网飞“黑客日”在齐飞4D特效米圈粮食神器会议室突袭机…

科技公司的一个吸引人的特点是,他们可以做任何事情来激发员工的创造力,并找到下一个重大事件。

例如,谷歌著名的“20%的时间”邀请Lady Gaga与员工交谈。微软还将每年在比尔·盖茨的办公室举办两次“科学展览”,为员工的创造性项目打分。HubSpot员工可以在短时间内换工作.

流媒体巨头网飞自然不想落后。每年都有几次内部黑客马拉松,让不同学科的员工聚在一起尝试一些新技术,发现新想法。

5d12c5d7533ee.png

并非黑客日的所有想法都是微妙和实用的。在此之前,他们生来就是要在最初的NES上玩纸牌房子,把目录转换成虚拟现实租赁店,用莫尔斯码创建一个搜索系统,等等……但即使是愚蠢的想法也可能变成拍打着“蝴蝶翅膀”,与有趣的未来经历相碰撞。

今年的网飞工作室黑客日将向你简要介绍齐飞的亮点和时段。

手机版“4D”

我的许多朋友一定在4D、5D、7D等的旗帜下体验过这座城市的动态电影。每当发生爆炸、翻车等情况时。在情节中,电影院的座位会产生各种令人震惊的效果,使人们欢笑和哭泣,试图创造一种身临其境的感觉。

今年的黑客日,网飞的技术人员通过触摸反馈技术将类似的体验转移到了手机电视连续剧上。

项目团队“项目隆隆帕克”使用沉浸公司的技术,使网飞剧集的内容与触觉效果同步。在爆炸、打斗等情况下,手机会收到力反馈并开始振动。工作人员认为这可以增强观众的兴奋感。(对我们的观众有什么误解吗?)

5d12c5d787856.png

你能在不离开家的情况下感受到4D版的大片吗,享受同样的体感效果,并且不用担心你的手机会给你带来惊喜吗?

稻作圈的粮食生产假象

如果你对手机版的4D特效不感兴趣,那么《网飞之声》可能会让许多追逐明星的男孩和女孩捧腹大笑。

网飞的工程师们训练了一个深层神经网络,可以扫描和分割网飞戏剧中的单个单词,然后根据需要将它们重组成新的句子。例如,如果你在搜索栏中输入“这太荒谬了”,网飞会用它最喜欢的角色的声音来发音。

5d12c5d7b622b.png

米圈出产的五谷神器,幽灵动物的好帮手,有木头就有,从此告别了几个结核夹料包。

从大量视频中完成文本分析、韵律分析和声学分析,然后准确地提取和合成演员的声音,然后用情感语调发音。它不仅需要情感大数据,如更自然的发音和更强的表现力,还需要一系列训练有素的语音模型和高性能的语义理解能力。这些地方是网飞真正能够“展示肌肉”的地方。

当然,黑客当天展示的词汇和句子长度仍然相对较浅,但研究人员称实验数据正在积极扩展。将来,这台机器能一起做所有的配音吗?

对演员的“最强支持”

帮助PGC创作的专业工具也正在出现。

在拍摄的早期,影视制作团队往往会在场景、机器位置、构图等方面下大力气。网飞的新软件TerraVision重新想象了创作过程,彻底改变了电影制作人寻找拍摄地点的方式。

作为一种计算机视觉模型,地形视觉可以根据线条画或关键词显示相似的建筑物或场景,并确定和匹配它们的位置。

5d12c5d812e28.png

例如,如果您需要拍摄地块中的城堡,您可以通过输入设计图纸找到符合城市条件的建筑。电影制作人可以将他们最喜欢的外观照片放入界面,并从我们的集中式照片库中找到最接近的视觉匹配。

不给糖就捣蛋会议系统

当然,在——会议上,网飞员工不仅在考虑吃瓜和刷剧,他们也无法逃避社会动物的命运。大概每个工作组都有类似的经历。如果前面的人开会迟到了,那就像老师在课堂上的“拖延”一样令人恼火。大多数人会选择在会议室外面“面带微笑,心带微笑”等待吗?网飞的员工表示,他们决心像魏一样强硬地对待敌对势力。

5d12c5d87e31d.png

一个小组设计了一个简单的网络应用程序,允许员工连接到世界上任何地方的会议室。如果日历上很久以前就应该完成活动的人超时了,他或她会自动召集会议,播放类似奥斯卡的告别音乐,简单而粗暴地立刻让他或她的同事离开!

对此,我只想说,请网飞大力开发这款产品好吗?拯救动物是每个人的责任!

还有一点:流媒体“创新样本”

随着迪斯尼和苹果电视等竞争对手的推出,网飞在拥挤的流媒体轨道下的压力也在增加。可以发现,网飞最初是一家科技公司,为了继续领先,它正在系统地将人工智能融入更广泛的行业领域。

无论是在应用程序中加入未来体验元素,还是内容制作和分发的智能工具,它都或多或少地展示了网飞在探索方面的技术成就和产业方向。

总体而言,主要体现在以下几个方面:

5d12c5d8dd848.png

1.基于视频理解技术增强观看体验

事实上,手机振动功能早在功能机时代就出现了。在触屏手机中,我们可以经常接触到类似的设计,比如系统设置或者应用程序,比如游戏和绘图,并且力反馈经常被加入,让用户更直观地感受到自己的操作效果。触摸技术和应用内容的结合无疑给人机交互带来了新鲜血液。

为了实现触摸、声音和图像的同步,也对视频理解相关算法提出了更高的要求。

目前,视频识别的相关研究大多采用基于图像的卷积神经网络来学习视频特征。该方法仅融合单帧图像的语义特征,但往往忽略相邻连续视频帧之间的联系和视频中的运动信息。

网飞在声音和图像同时感知方面的创新可以被视为流媒体在视频理解技术方面的新尝试,也可以作为一个支点来利用更多的三维视频体验。从某种程度上来说,这也可以被看作是网飞对该行业技术重复的一个信号。

5d12c5d93a69e.png

2.视听技术有助于内容制作

目前,许多流媒体平台正在使用人工智能来辅助视频内容的制作,以支持和吸引创作者。

例如,爱奇艺推出了智能听力和字幕,这有助于后来的人员通过智能语音识别技术缩短从音频到文本的转换时间。百度大脑还引入了“创意大脑”,它可以识别视频剪辑中的关键人物,然后自动生成带有图片和文字介绍的预告片。网飞的新想法告诉我们,人工智能和内容制作的故事绝对不仅仅是这样。从网飞之声和TerraVision的理念中,我们可以看到语音识别与合成、视频语义理解等技术的新进展。

显然,为视频产业寻求更低的生产成本、更丰富的创意材料和更高效的产业效率是网飞关注的技术方向,它确实在重构整个生产过程的内在体系。

3.云视频流进入办公室场景

至于将托唐同事放入奥斯卡的会议系统,网飞员工已经将其放入AWS。

可以看出,网飞的云基础设施正在使稳定、可靠和高度并发的云视频流成为现实,这意味着未来的视频制作和分发可以基于云服务的持续创新。

例如,它与办公场景的处理相集成,实现跨区域的多屏幕交互、全媒体内容融合、会议内容流式传输等。进一步丰富办公场景的互动效果。

5d12c5d981daf.png

自2015年以来,网飞在原创内容的制作和高质量内容的版权购买方面投入了大量资金。到2018年,网飞已经成为好莱坞最大的原创内容制作商,每年花费80亿美元。

巨大的投资和高质量的产品战略使网飞达到了行业的顶峰。全球用户群接近1.5亿,但这也给收入蒙上了阴影。

网飞2019年第一季度的财务报告显示,其现金流不容乐观,比去年同期下降了2.87亿美元。

今年,随着HBO、迪士尼等传统娱乐公司和苹果等硅谷新贵进入流媒体“抢食”,网飞不得不继续添加内容,以巩固其在流媒体领域的领先地位。

但这并不是烧钱的方式。从《黑客日报》展示的内容来看,为了制作出一张漂亮的收入报告单,通过技术创新“开源节流”,打开与不同平台的技术差距,是流媒体平台竞争的重要筹码。

经过许多创新的想法之后,人工智能对于视频娱乐的核心意义其实就在于:用户体验的改善、内容场景的扩展和成本的不断降低。

训练场、创意派对、表演.我们可以用很多词来描述黑客日疯狂的大脑开放创新活动。愚蠢的想法可能点燃未来,无用的功能可能改变世界。

要知道技术将引领行业走向何方,人们只能不断地打开未知的大门。