从头到尾 谷歌的人工智能芯片2.0

谁得到芯片,谁就得到世界。我们可以把这句话扩展到说人工智能芯片的赢家将赢得未来的世界。

对于智能终端制造商来说,自主开发的SoC芯片似乎是顶级实力的象征。众所周知,三星、华为和苹果是世界上三大智能手机,它们都有自己的SoC芯片。

(2020智能手机芯片运行数据TOP10)

现在,经过多年辅助人工智能芯片的经验,谷歌终于进入了智能终端的核心硬件——单片机芯片。

据国外媒体Axois报道,谷歌在自主开发处理器方面取得了显著进展,其自主开发的SoC芯片最近已成功发布。

据悉,该芯片由谷歌和三星联合开发,采用5纳米工艺制造,采用“2 2 4”三种架构设计的8核CPU集群,配有新的ARM公共架构的GPU。同时,谷歌视觉核心人工智能视觉处理器集成在互联网服务提供商和网络处理器上。这使得谷歌的终端芯片能够更好地支持人工智能技术,比如大大改善谷歌助手的交互体验。

在上市计划中,谷歌的SoC处理器芯片预计将首先部署在下一代像素手机和谷歌笔记本电脑Chromebook上。

谷歌的举动被视为更接近苹果自主开发的处理器模式,从“最主流的本土系统旗舰芯片”转变为“自主开发的本土系统芯片”。谷歌的意图绝不仅仅是摆脱高通芯片的束缚,更重要的是,通过自主开发的芯片实现软硬件的更好结合,让安卓系统能够在自己的硬件上发挥更大的性能优势。

事实上,我们知道自主开发的芯片并不能给谷歌带来更多的硬件利润,最有价值的是谷歌人工智能的优势可以通过软硬件的结合更好的应用到智能终端上。

众所周知,谷歌最早进入人工智能芯片,其实力是强大的。然而,人工智能芯片技术有多强?人工智能技术与芯片研发之间有什么相辅相成的关系?我相信很多人仍然不知道该做什么,这就是我们将要深入探讨的。

从云到末,谷歌人工智能芯片的先进之路

在谷歌的TPU(张量处理单元)处理器推出之前,大多数机器学习和图像处理算法总是运行在GPU和FPGA上。谷歌提出了深度学习开源框架TensorFlow,为TensorFlow算法设计了这样一个特殊的芯片。

TPU就是这样出生的,但正是阿尔法戈和李世石之间的人机围棋游戏让TPU出名。据说谷歌当时实际上为TPU玩了另一个大游戏。因为在挑战李石师之前,阿尔法戈运行了1202个处理器和176个处理器与棋手范辉竞争。这让看过比赛过程的李世石充满信心。然而,就在比赛前几个月,阿尔法戈的硬件平台被TPU取代,这使得阿尔法戈的实力迅速壮大,李石师也在后来的战斗中吃了不少苦头。

(谷歌TPU芯片)

TPU是一个专用集成电路(ASIC)。作为谷歌云中专用的人工智能芯片,它的任务是加快谷歌人工智能的登陆速度。在谷歌2017年宣布的第二代TPU上,其浮点计算能力高达每秒180万亿次,可用于推理和训练。到2018年,3.0版的计算性能比2.0版提高了8倍,达到每秒1000万亿次浮点计算。

此后,谷歌的人工智能布局逐渐走向了边缘。在2017年谷歌云服务年会上,它正式发布了其边缘技术,并推出了谷歌边缘TPU。

边缘TPU是一个由谷歌设计的专用集成电路芯片,运行在边缘。边缘TPU可用于越来越多的工业应用场景,如预测维护、异常检测、机器视觉、机器人、语音识别,也可用于本地部署、医疗保健、零售、智能空间、交通运输等领域。

边缘TPU体积小,能耗低,只负责人工智能加速度判别和加速度计算。它只起到加速器和辅助处理器的作用,可以在边缘部署高精度的人工智能,是对在边缘运行人工智能的CPU、GPU、FPGA等ASIC解决方案的补充。

谷歌去年还推出了一系列基于边缘TPU芯片和本地化人工智能平台Coral的开发硬件,为边缘端提供高质量和易于部署的人工智能解决方案。

尽管TPU和边缘TPU主要是辅助服务器,加速深度学习的计算和推理,我们仍然可以看到谷歌在人工智能芯片上的布局野心。从云,到边缘和移动智能终端,都是为了了解谷歌人工智能芯片的内部逻辑。

(像素视觉核心)

自2017年以来,谷歌已经在智能手机上推出定制相机芯片“像素视觉核心”和“像素神经核心”,并在像素2、像素3和像素4上使用。

像素视觉核心是一个图像处理单元(IPU)和谷歌开发的第一个移动芯片。它专门用于加速摄像机的HDR计算。它使用机器学习和计算摄影,可以智能地修复照片中不完美的部分,使图像处理更加流畅和快速。这就是为什么许多人说谷歌手机的照片不是拍摄的,而是经过计算的。

去年,谷歌在像素4上使用了像素神经核心处理器,而不是像素视觉核心。神经网络算法可以使谷歌手机的摄像头识别出拍摄的物体,然后可以将数据交给图像处理算法进行优化,或者将数据输出给谷歌助手进行识别。与此同时,像素神经核心还能让谷歌助手进行更复杂的人机对话以及离线语音和文本翻译。

如果谷歌没有人工智能算法和开发软件,如张量流,卤化物和编译器,谷歌的人工智能芯片的许多设计显然不能发挥很大作用。软件和硬件的结合使得谷歌的芯片设计更加彻底和勤奋。

软硬兼施,谷歌人工智能芯片快速迭代的硬背景

谷歌无疑是互联网公司核心建设领域的领先公司。

据报道,早在2006年,谷歌就考虑在其数据中心部署图形处理器或FPGA或专用集成电路。当时,在特殊硬件上运行的应用程序并不多,所以利用谷歌大型数据中心的剩余计算能力可以满足计算能力的要求。

直到2013年,谷歌才开始引入基于DNN语音识别的语音搜索技术。用户的需求使谷歌数据中心的计算需求翻了一番,这使得基于中央处理器的计算变得极其昂贵。因此,谷歌计划使用现成的图形处理器进行模型训练,并迅速开发一种特殊的集成电路芯片进行推理。

后来,我们知道这个特别定制的芯片是TPU的,而且快速开发期只有15个月。谷歌不是唯一一家基于软件核心的公司,但与亚马逊和Facebook相比,谷歌一直在不断推出芯片产品。谷歌能够如此快速、高频率地输出“硬件”,这自然有其“勤奋”的原因。

首先,必须从战略上予以重视。此前,谷歌首席执行官皮卡伊曾强调,谷歌从不为硬件做硬件,但其背后的逻辑必须是人工智能、软件和硬件的集成,而这个问题的真正解决方案取决于三位一体。

第二,人才的重要性。以消费者芯片芯片谷歌为例。这个项目长期以来一直是对外公开的“秘密”。从2017年底开始,谷歌开始从苹果、高通、英伟达和其他高薪公司挖“墙角”,包括苹果A系列处理器的著名R&D工程师John Bruno。然而,直到去年2月,谷歌才正式宣布在印度班加罗尔成立一个“通用芯片”芯片设计团队,致力于谷歌的智能手机和数据中心芯片业务,并在未来在那里建立一个新的半导体工厂。消费芯片似乎只有一步之遥。

当然,最重要的因素在于谷歌在人工智能芯片方面的创新优势。众所周知,人工智能芯片本身的研发是一个周期长、成本高的项目。从芯片设计到成品的周期可能跟不上人工智能算法的发展。如何平衡人工智能芯片的硬件设计、算法和软件已经成为谷歌芯片设计的关键优势。

谷歌提出的解决方案更值得称道,那就是用人工智能算法设计人工智能芯片。

具体来说,人工智能芯片设计有以下困难。首先,3D芯片的放置,数百到数千个组件在受限区域的跨级配置,工程师需要手动设计配置,以及通过自动化软件进行模拟和性能验证,这通常需要大量时间。其次,芯片的设计架构跟不上机器学习算法或神经网络架构的发展速度,导致这些算法架构对现有人工智能加速器的影响较差。此外,虽然芯片布局规划的设计过程正在加快,但在芯片功耗、计算性能和面积等多个目标的优化能力方面仍然存在局限性。

为了应对这些挑战,谷歌高级研究科学家米罗西尼(Mirhoseini)和团队研究员安娜戈尔迪(Anna Goldie)提出了一种神经网络,将芯片布局的建模转化为强化学习。

与典型的深度学习不同,强化学习系统不使用大量的标记数据进行训练。相反,神经网络将边做边学,并在成功时根据有效信号调整网络参数。在这种情况下,有效信号成为降低功耗、提高性能和缩小面积的替代指标。因此,系统执行的设计越多,效果就越好。

经过长时间的芯片设计研究,它可以在不到24小时内完成谷歌张量处理器的设计,其功耗、性能和面积都超过了人类专家数周的设计成果。研究人员称,该系统还向人类同行传授了一些新技能。

最后,谷歌团队希望这个人工智能系统能够实现“在同一时间内设计更多运行速度更快、功耗更低、制造成本更低、体积更小的芯片”的目标。

面向未来,谷歌SoC芯片集成的人工智能雄心

这一次,谷歌自己开发的终端处理器片上系统芯片实质上是谷歌人工智能芯片的延伸。

细心的人应该会发现,这款SoC芯片不是来自谷歌R&D团队,而是选择了与三星合作。据媒体披露,谷歌的手机主机将采用一种新的5纳米工艺的图形处理器,Cortex-A78内核和多达20个内核,这正是三星Exynos 1000的特点。因此,三星堆叠芯片的主要“谷歌元素”是谷歌自己的人工智能芯片在互联网服务提供商和网络处理器上的应用。

(谷歌像素5间谍照片)

这一选择自然有谷歌的充分考虑和一些明显的优势,但它也有一些不利影响。

最直观的优势是加快谷歌手机SoC芯片的开发,减少对高通处理器的依赖,并快速将其应用到下一代谷歌像素手机上。

另一个优势是,谷歌主导的芯片设计将使谷歌能够像苹果一样构建自己的封闭系统。谷歌最难的核心在于其庞大的数据和人工智能算法。随着应用层面数据体验和人工智能体验的不断增加,如飞行模式下的实时语音转录功能,手机的硬件性能和系统的兼容支持可能成为智能手机的性能上限。没有人比谷歌更清楚如何在安卓系统中最大化处理器性能。

毕竟,之前谷歌像素手机的市场表现不温不火。尽管他们在拍摄算法和人工智能助手方面有很大优势,但在终端设计、屏幕、相机、电池和其他硬件配置方面总是有“短板”,很难与全球几个主流终端玩家的旗舰机型相抗衡。据推测,采用最新一代SoC芯片的新像素型号的定价也将非常“高端”,但硬件方面的“偏好”仍可能影响其整体市场表现。

此外,因为它是一个全新的“非主流”芯片,它将不再是游戏和软件开发人员首选的“软件开发模型机”测试模型。

无论如何,这款具有深度学习性能的SoC芯片将为谷歌争夺未来的人工智能市场做好准备,帮助谷歌最大限度地提高移动终端上语音识别和图像处理等人工智能应用的性能,并提前一步占据真正智能终端的领先地位。

无论如何,谷歌的“核心”举措肯定会给上游芯片制造商和智能终端制造商带来积极影响。如果“白教堂”证明了谷歌“核心建设”战略的成功,那么谷歌离苹果还有多远?

自主开发的芯片和安卓系统叠加了最新的人工智能计算能力。如果硬件配置的缺点得到补充,谷歌很有可能在安卓生态系统中构建一个软硬件完美匹配的闭环系统。

最后,我们发现了一个相当令人困惑的细节。这种芯片的代号是“白色教堂”,它被称为“白色教堂”。熟悉英美戏剧的读者可能已经看过一部名为《白教堂血案》的英国戏剧。如果我们不必过度解读它,我们可以理解一个重要的开发者喜欢这部惊悚片,所以它以它命名。如果我们不得不“过度解读”它,谷歌可能想用一个百年未解的“谜”来预示智能终端人工智能应用之争的开始。

当然,这个答案可能要到谷歌新的像素手机上市后才会揭晓。