从云到终端 谷歌人工智能芯片2.0
赢得筹码的人赢得世界。我们可以把这句话扩展到那些获得人工智能芯片的人将获得未来的世界。
对于智能终端制造商来说,自己开发SoC芯片的能力似乎是顶级实力的象征。众所周知,占据世界三大智能手机市场的三星、华为和苹果都有自己的SoC芯片。
(2020年智能手机芯片运行数据前10名)
如今,在辅助人工智能芯片领域积累了多年经验后,谷歌终于要进入智能终端的核心硬件————微处理器芯片。
根据国外媒体Axois的报道,谷歌在自主开发处理器方面取得了显著进步。最近,其自主开发的SoC芯片已成功流播。
据悉,该芯片由谷歌和三星联合开发,采用5纳米技术制造,采用“2 2 4”三种架构设计的8核中央处理器集群,采用新的ARM公共架构设计的GPU。与此同时,谷歌视觉核心人工智能视觉处理器集成在互联网服务提供商和网络处理器单元。这使得谷歌的终端芯片能够更好地支持人工智能技术,比如大大改善谷歌助手的交互体验。
在上市计划中,谷歌的SoC处理器芯片预计将首先部署在下一代像素手机和谷歌的Chromebook笔记本上。
谷歌的举动被视为更接近苹果的自主研发处理器模式,从“本土系统中最主流的旗舰芯片”转变为“本土系统自主研发芯片”。谷歌的意图绝不仅仅是摆脱高通芯片的限制,更重要的是通过自主研发芯片实现软硬件的更好结合,让安卓系统在自己的硬件上发挥更大的性能优势。
事实上,我们知道自主开发的芯片并不能给谷歌带来更多的硬件利润,最有价值的是谷歌人工智能的优势可以通过软硬件的结合更好的应用到智能终端上。
众所周知,谷歌是第一个进入人工智能芯片的公司,实力雄厚。然而,人工智能芯片技术有多强,人工智能技术与芯片研发之间的相互促进是什么?我相信很多人仍然不明白,这正是我们接下来要讨论的。
谷歌人工智能芯片从云到端的先进之路
在谷歌的TPU(张量处理单元)处理器推出之前,大多数机器学习和图像处理算法都是在GPU和FPGA上运行的。谷歌提出了用于深度学习的开源框架TensorFlow,并专门为TensorFlow算法设计了这样一个特殊的芯片。
TPU就是这样出生的。然而,正是阿尔法戈和李世石的人机围棋比赛让TPU出名。据说谷歌当时实际上为TPU玩了另一个大游戏。在挑战李石师之前,阿尔法围棋在1202中央处理器和176图形处理器上运行,与棋手范辉竞争。这让看过这场比赛的李世石非常自信。然而,在比赛的前几个月,AlphaGo的硬件平台被改成了TPU,这使得AlphaGo的实力迅速增长,而李石师也在接下来的战斗中吃了不少苦头。
(谷歌TPU芯片)
TPU是一个专用集成电路(ASIC)。作为谷歌云中专用的人工智能芯片,其任务是加快谷歌人工智能的登陆速度。在谷歌2017年发布的第二代TPU上,其浮点计算能力高达每秒180万亿次,可用于推理和训练。到2018年,TPU版本3.0的计算性能将是TPU版本2.0的八倍,达到每秒1000万亿次浮点运算。
此后,谷歌的人工智能布局逐渐走向了边缘。在2017年谷歌云服务年会上,其边缘技术正式发布,谷歌边缘TPU发布。
边缘TPU是一个由谷歌设计的专用集成电路芯片,用于在边缘上运行TensorFlow Lite ML模型。边缘TPU可用于越来越多的工业应用场景,如预测维护、异常检测、机器视觉、机器人、语音识别,也可应用于各种领域,如本地部署、医疗保健、零售、智能空间、交通等。
边缘TPU体积小,能耗低,只负责人工智能加速度的判别和计算。它只是加速器和辅助处理器的作用。它可以在边缘部署高精度人工智能,是对在边缘运行人工智能的中央处理器、图形处理器、现场可编程门阵列和其他专用集成电路解决方案的补充。
谷歌去年还推出了一系列基于边缘TPU芯片和本地化人工智能平台Coral的开发硬件,为边缘方提供高质量和易于部署的人工智能解决方案。
尽管TPU和边缘TPU主要是深度学习的辅助服务器,以加速计算和推理,我们仍然可以看到谷歌在人工智能芯片上的布局野心。从云到边缘和手机智能终端,正是为了理解谷歌人工智能芯片的内部逻辑。
(像素视觉核心)
自2017年以来,谷歌在智能手机上相继推出定制相机芯片“像素视觉核心”和“像素神经核心”,并在像素2、像素3和像素4上使用。
像素视觉核心是一个图像处理单元(IPU)和谷歌开发的第一个移动芯片。它是专门用来加速摄像机的HDR计算的。它使用机器学习和计算摄影来智能地修复照片中不完美的部分,并且使图像处理更加平滑和快速。这也是为什么许多人说谷歌手机的照片不是拍摄的而是经过计算的。
去年,谷歌在像素4上用专用处理器取代了像素视觉核心。神经网络算法可以使谷歌手机的摄像头识别出捕获的目标,然后不仅可以将数据给图像处理算法进行优化,还可以将数据输出给谷歌的助手进行识别。同时,像素神经核心还可以让谷歌的助手进行更复杂的人机对话和离线语音文本翻译。
如果谷歌没有人工智能算法和开发软件,如张量流、卤化物和编译器,谷歌人工智能芯片的许多设计显然不能发挥太大作用。软件和硬件的结合使得谷歌的芯片设计更加彻底和冷静。
软硬结合,谷歌人工智能芯片快速迭代硬背景
毫无疑问,谷歌是互联网公司核心建设电路的领跑者。
据报道,早在2006年,谷歌就考虑在其数据中心部署GPU或FPGA或专用集成电路。当时,在专用硬件上运行的应用程序并不多,所以利用谷歌大型数据中心的剩余计算能力可以满足计算能力的要求。
然而,直到2013年,谷歌已经开始在语音搜索中引入基于DNN的语音识别技术。用户的需求使谷歌数据中心的计算需求翻了一番,这使得基于中央处理器的计算特别昂贵。因此,谷歌计划使用现成的图形处理器进行模型训练,同时快速开发一个专用的集成电路芯片进行推理。
后来,我们得知这种特殊定制的芯片是TPU的,而这一快速发展期只有15个月。基于软件核心构建,谷歌并不是唯一一家,但与亚马逊和Facebook相比,谷歌一直在不断推出芯片产品。谷歌能够如此快速、高频率地输出“硬件”,这自然要归功于它的“硬精神”。
首先必须是战略重要性。在此之前,谷歌首席执行官皮查伊曾强调,谷歌从未为硬件制造过硬件。它背后的逻辑必须是人工智能、软件和硬件的集成。这个问题的真正解决方案取决于这三个要素的整合。
第二是强调人才。以谷歌为例。这个项目已经是对外公开的“秘密”。从2017年底开始,谷歌开始从苹果、高通和Avida等公司挖“墙角”,包括苹果A系列处理器的著名R&D工程师John Bruno。然而,直到去年2月,谷歌才正式宣布在印度班加罗尔组建一个“通用芯片”芯片设计团队,致力于谷歌的智能手机和数据中心芯片业务,并将在未来在那里开设一家新的半导体工厂。消费级芯片似乎只有一步之遥。
当然,最重要的因素还在于谷歌在人工智能芯片上的创新优势。我们知道人工智能芯片的研发是一项长期而昂贵的工程。从芯片设计到最终产品的阶段可能赶不上人工智能算法的发展。如何实现人工智能芯片的硬件设计、算法和软件之间的平衡,已经成为谷歌芯片设计的关键优势。
谷歌提出的解决方案更值得称道,那就是用人工智能算法设计人工智能芯片。
具体来说,人工智能芯片设计有以下困难。首先,3D芯片的放置,数百到数千个组件在受限区域的跨级配置,工程师需要手动设计配置,并通过自动化软件进行模拟和性能验证,这通常需要很长时间。其次,芯片的设计架构跟不上机器学习算法或神经网络架构的发展速度,导致这些算法架构在现有人工智能加速器上效果不佳。此外,尽管芯片布局规划的设计过程正在加速,但是在包括芯片功耗、计算性能和面积在内的多个目标的优化能力上仍然存在局限性。
为了应对这些挑战,谷歌的高级研究科学家米罗西尼和团队研究员安娜戈尔迪提出了一种神经网络,将芯片布局建模转化为强化学习。
与典型的深度学习不同,强化学习系统不使用大量的标记数据进行训练。相反,神经网络将通过做来学习,并在成功时根据有效信号调整网络中的参数。在这种情况下,有效信号成为降低功率、提高性能和减少面积组合的替代指标。因此,系统执行的设计越多,结果就越好。
经过足够长时间的芯片设计研究,它可以在不到24小时内完成对谷歌张量处理器的设计,其功耗、性能和面积超过人类专家数周的设计结果。研究人员称,该系统还向人类同胞传授了一些新技能。
最终,谷歌团队希望像这样的人工智能系统能够实现“在相同的时间内设计更多的芯片,以及运行速度更快、功耗更低、制造成本更低、外形更小的芯片”的目标。
面向未来,谷歌SoC芯片集成人工智能雄心
这一次,谷歌自己开发的终端处理器片上系统芯片实质上是谷歌人工智能芯片的延伸。
细心的人应该会发现,这一次SoC芯片并不完全来自谷歌的研发团队,而是选择了与三星合作。从媒体曝光率来看,谷歌的手机主机将使用5纳米工艺、Cortex-A78兆核和一个多达20个核的新图形处理器,这正是三星的Exynos 1000的特点。因此,三星芯片最重要的“谷歌元素”是谷歌自己的人工智能芯片在互联网服务提供商和网络处理器上的应用。
(谷歌像素5间谍照片)
这一选择自然有谷歌的充分考虑和一些明显的优势,但也有一些不利影响。
最直观的优势是加快谷歌移动SoC芯片的开发,减少对高通处理器的依赖,并能快速应用于下一代谷歌像素手机。
另一个优势是,谷歌主导的芯片设计将使谷歌能够像苹果一样构建自己的封闭系统。谷歌的核心在于其庞大的数据和人工智能算法。随着应用层面数据经验和人工智能经验的不断丰富,如飞行模式下的实时语音转录功能,手机的硬件性能和系统的兼容支持可能成为智能手机的性能上限。没有人比谷歌更清楚如何在安卓系统中最大化处理器性能。
毕竟,之前谷歌像素手机的市场表现不冷不热。虽然它们在拍摄算法和人工智能辅助应用方面有很大的优势,但在终端的外观设计、屏幕、摄像头、电池等硬件配置上总是有“短板”,很难与世界上几个主流终端玩家的旗舰机型相提并论。据推测,采用最新一代SoC芯片的新像素模型的定价也将非常“高端”,但硬件方面的“部分分割”仍可能影响其整体市场表现。
此外,因为这是一个全新的“非主流”芯片,它将不再是游戏和软件开发者的首选测试模型。
无论如何,这一集已经成为一个具有深度学习性能的SoC芯片,这将为谷歌未来的人工智能市场做好准备,帮助谷歌最大限度地提高移动终端上语音识别和图像处理等人工智能应用的性能,并提前一步占据真正智能终端的领导地位。
无论如何,谷歌打造“核心”的举措肯定会对上游芯片制造商和智能终端制造商产生积极影响。如果“白教堂”证明了谷歌“核心建设”战略的成功,那么谷歌离苹果还有多远?
自主开发的芯片和安卓系统叠加了最新的人工智能计算能力。如果硬件配置的短板得到补充,谷歌可能会在安卓生态系统中创建一个具有完美软硬件适应性的闭环系统。
最后,我们发现了一个更令人困惑的细节。芯片的代号是“白色教堂”,它被称为“白色教堂”。如果读者熟悉英美戏剧,可能已经看过一部名为《白教堂血案》的英国戏剧。如果我们不必过度解读它,我们可以理解一个重要的开发者喜欢这部惊悚悬疑剧,所以它以它命名。如果我们不得不“过度”解释它,谷歌可能正试图用一个百年未解的“谜”来预示智能终端人工智能应用争议的开始。
当然,答案可能要等到谷歌的新像素手机上市。