从“深度伪造”到“深度合成”:为什么人工智能需要“名字修正”?
在世界对人工智能“邪恶”的攻击中,人工智能欺诈可能是现在的第一个原因。
自从2017年深假的出现,人们就惊呼人工智能只是在伪造方面有天赋。此后,“人工智能生成内容”技术,尤其是GAN算法的迅速发展,进一步证实了这一事实。人工智能不仅能改变面貌,还能自动生成所有数字内容,如文本、语音、图像、视频等。
除了人工智能引起的色情视频泛滥之外,人们还担心人工智能产生的内容技术会给隐私侵犯、威胁信息安全和操纵政治选举带来新的挑战。
人们通常认为,如果人工智能生成的内容被允许在互联网上传播,它将进一步破坏互联网世界的真实性边界。
(扎克伯格是人工智能伪造的,他“讽刺”了自己的脸书平台)
深假之后,真相是什么?
如果普通人很难区分哪些是真的,哪些是假的,构成社会基石的真理和信任就会崩溃,但我们似乎还没有准备好生活在一个“不信任的社会”。
在《实践理性批判》,德国哲学家康德论证了“人为什么不能说谎”的规则,揭示了“没有信任的社会”的悖论和荒谬。如果“每个人都可以说谎”是社会上的一条普遍规律,那么每个人都不再相信另一个人说的话,所以说话者的谎言不会成功。在没有任何人相信的情况下撒谎是一种矛盾的情况。相反,“谁也不能说谎”应该是正常社会的普遍规律。
也就是说,只有在一个默认为“每个人都应该诚实”的信任社会中,说谎者才能通过成功欺骗他人来获取利润,而他们的名誉也会因为谎言的暴露而破产。然而,在一个“不信任的社会”,很难判断信息是真是假,所以只能假设一切都是假的,以免被欺骗。然而,相应的代价是根本没有信任,合作难以实现,沟通不再可能,社会最终将分崩离析。
当然,这只是该理论最极端的推论。现实世界总是会在理论世界下形成一个巨大的灰色空间,人性的基石将永远保持不变,技术的进化将继续前进,人性的弱点将永远暴露在两者之间的张力中。除了不断学习和进化,似乎没有更好的方法让每一代新人类适应技术加速带来的新挑战。
回到以“深假”为代表的“人工智能生成内容”技术,它既不会把我们的社会拖入“不信任”的深渊,也不会让我们的人性变得更好或更坏。在一个即将到来的后真相世界里,那就是“真与假是相容的,真与假是无法区分的”,这只会让我们更加复杂和脆弱去适应这种变化。
所以。这个略带“贬义”的技术术语“深度假”需要我们重新塑造成一个技术中性词汇——深度合成。
重命名为“深度合成”:人工智能在技术上是中立的
科学技术的每一次突破都可能带来意想不到的“副产品”。
正如爱因斯坦发现了质量和能量的等式,即使他不想,他也无法阻止原子弹的出现和使用。就在Deepfake在美国新闻网站Reddit上发布后,人工智能的领袖Yann LeCun也在推特上深刻反思:
"说真的,如果我们知道卷积神经网络(美国有线电视新闻网)会产生深假,我们应该出版它吗?"
然后乐村自己回答了这个问题。乐村说,即使我们不先出版,美国有线电视新闻网也会被其他人或组织发明。它在2002年出版后,人们不知道如何使用它。换句话说,有线电视新闻网的价值只能通过技术人员的不断探索才能发现。
现在美国有线电视新闻网正在发展成各种各样的应用,这不仅对世界产生了许多积极的影响,如医疗诊断、自动驾驶、内容过滤和安全监控,而且还可能造成一些负面影响,如侵犯隐私、欺诈、偏见和歧视等。
简单地说,人工智能是无辜的,问题在于使用人工智能技术的人。
鉴于深度伪造技术导致的大量带有人工智能人脸变化的色情视频,人工智能技术应用于色情行业几乎是一个“不可避免”的过程。一方面,现代色情产业一直是科技最新应用的深度阵地;另一方面,人工智能在图像内容生成技术方面的发展刚刚迎来了一个突破性的临界点。最后一步只是名为“深度假货”的用户的最后“灵机一动”。
事实上,深假为“人工智能内容生成”技术的普及做出了贡献,但也带来了不可磨灭的耻辱。鉴于“人工智能内容生成”技术的发展已经超出了人工智能面临变革的范围,技术商业领域正试图用“深度合成”来证明这一技术的合理性。
首先,“深假”一词显然是片面的,它只是“人工智能变脸”技术的早期代表,不足以涵盖“人工智能生成内容”的所有技术。深度合成可以更好地参考所有人工智能生成算法和合成技术,包括自动生成图像、视频、声音、文本、音乐等。
第二,深假并没有得到技术界的广泛认可,而是被大众媒体称为“油嘴滑舌”。此外,深假的“肚子黑”体质将对人工智能技术的应用和推广产生直接的负面影响。
“深度合成”,一个更中性的技术名称,将取代深度假以履行人工智能内容开发的责任。那么,“深度合成”如何支持这一重要任务呢?
“深度合成”的基础:技术加速和商业着陆
事实上,“深度综合”技术是借助于能够独立学习的深度学习算法模型来实现的。使用的两种主要技术是“自动编码器”人工神经网络和“生成对抗网络”人工神经网络。前者用于合成训练数据,后者由生成器和鉴别器组成,一个用于生成新数据,另一个用于鉴别新数据。经过两者的多次对抗,“假”的合成数据最终生成,包括由深假创造的变脸视频。
(甘相关论文出版)
自2014年GAN提出以来,已由CGAN、BigGAN、StyleGAN等进行了更新,相关研究论文也逐年快速增加,显示出学术界对GAN算法的重视和光明的前景。
(BigGAN生成的各种类别的高清图片)
相应地,图像生成的质量也在突飞猛进,不仅可以实现人脸合成,还可以进一步实现图像叠加和融合,或者直接生成全新的高清图片,使得人眼很难分辨真假。
例如,麻省理工学院和IBM沃森联合实验室去年发布的基于GAN的人工智能艺术家可以学习文艺复兴时期画家的绘画风格,并直接将现代人的照片转化为文艺复兴时期的绘画。
其技术优势在于,GAN神经网络将根据所学的技巧重新组合图片,即绘制新图片,而不是通过风格转换来改变原始图片的颜色。
事实上,深度合成技术可以走得更远。除了单一的图像和音频合成,多维内容合成已经成为一种趋势,它可以结合语音识别、人脸识别、嘴唇搜索等。合成面部语言,这样一个人可以自然流畅地说出他从未说过的话。
此外,除了人脸合成,虚拟人技术的全身合成和三维合成也成为当前的应用热点。在过去的两次会议中,搜狗和新华社推出了世界上第一个3D人工智能合成主持人,它已经能够实时驱动面部表情和嘴唇,并在身体动作和超现实细节的呈现方面达到与真人相当的动态效果。
在“深度合成”技术的商业化过程中,许多行业和企业已经看到了它的应用场景和广阔的市场。目前,“深度合成”已经开始在影视娱乐和社会传播等许多行业的场景中发挥作用。
例如,在影视剧的制作中,最直接的帮助是提高音像制作的效率,拓展创造性的想象空间;在某些特殊情况下,也可以通过合成技术为影视剧中迷失的演员合成声音,为死去的演员进行“数字复活”;甚至直接创造虚拟数字人来制作电影和电视剧。
在娱乐应用体验中,最基本的面部特效应用、变脸视频和动画已经多次出现在我们的生活中;随着深度综合技术的成熟,虚拟偶像、虚拟主播和虚拟客服变得更加真实可信。
在社交中,与其担心深度合成技术会暴露个人隐私,不如让深度合成技术帮助我们在社交网络中构建自己的“数字化身”,就像《头号玩家》中每个人创建的虚拟形象一样,成为我们在网络世界的通行证。
此外,在电子商务营销、教育艺术、医学研究等领域。深度合成技术带来的仿真数据和虚拟化内容可以为这些行业带来新的应用场景,或者直接推动该领域的技术进步。
显然,深度合成技术的这些积极价值正在给它带来更有信心的声音和发展前景。然而,自从人工智能技术出现以来,就一直受到人类的质疑和恐惧,它仍然值得我们认真对待它的应用边界和规则。
“深度合成”的治理:如何锁定“虚假内容”之龙
正如一切都必须付出代价一样,如果我们想享受深度合成技术带来的所有便利和精神享受,我们必须承担数字世界完全虚拟化的成本。
深度合成技术带来的“虚假内容”的社会风险将长期存在。首先,深度合成开源技术和软件大大降低了普通人伪造和操纵音频和视频的门槛;其次,这些虚假的音频和视频内容足以欺骗大多数“不知道真相”的人;最后,带有明显色情、危言耸听或侵犯隐私的信息足够吸引人。只要它来自源头,它就会不断传播。
除了少数能辨别真伪的专业人士之外,大多数人很难辨别和抵制这种虚假信息的诱惑。深度合成技术滥用风险需要受到法律、技术、产业、人员等多方面的限制。
首先,法律层面。深入研究人工智能深度合成内容技术滥用的目的、标志、使用范围和处罚,并出台相应的法规,为深度合成的合法使用提供依据。
第二,技术水平。与深度合成技术同步发展的内容识别技术和可追溯技术也应受到重视。只有有效地识别和标记合成内容,我们才能从源头上识别合成内容,防止负面虚假内容的传播。
第三,行业层面。深度合成技术不能与行业自律分开,合成内容技术提供商和平台应承诺标记合成内容或提供有效的检测和标记工具,以确保合成内容得到明确识别。
最后,在公共层面。与权威组织或主流精英对合成内容泛滥的担忧相比,公众可能是这一“虚拟化”浪潮的主要支持者,甚至是虚假信息的推动者。
今天,当我们即将全面进入数字世界,培养合格的“数字素养”应该成为公民从小的必修课。然而,在深度合成技术发展的道路上,该课程的教学内容和教学方法仍需慢慢探索。
正如我们做好准备后没有技术出现一样,人工智能技术也是如此。
从一开始,我们就把人工智能技术的起点定义为尽可能多地学习和模仿人类的能力,这样我们就能最终在那些繁重、重复甚至极其困难的任务中取代人类。
深度合成技术不是实现这一目标的过程。既然我们选择唤醒人工智能,我们就不再担心人工智能变得越来越像人类。
最后,反过来看我们人类,一方面,我们有探索世界因果规律的终极智慧,并且总是探索“真理”;一方面,我们以极大的热情发明了各种工具来从事各种人类工作。
这两种能力也直接有助于我们今天的工业世界和我们未来将进入的数字虚拟世界。
乐观地说,我们不仅不需要太担心“后真相时代”的到来,甚至我们也将很快适应这个完全“虚拟化”的美丽新世界。
对大多数人来说,追求真理远不如追求舒适有吸引力。