Nvidia 黄仁勋撰文反击 Google，P40 比 TPU 速度快 2 倍、带宽是 10 倍 01月19日更新

前不久 Google 释出关于 TPU 细节的论文，称“TPU 处理速度比目前 GPU 和 CPU 要快 15~30 倍”。当时就有人对此“比较”表示质疑，因其拿来的比较对象并非市场中效能最好的。

而美国时间 4 月 10 日，辉达（Nvidia） CEO 黄仁勋亲自撰文回应，文章第一段就以 Google TPU 开头，炮击意图十分明显，随后更扔出 Tesla P40 GPU 与 TPU 的效能对比图，可谓针锋相对。

不过 P40 和 TPU 的售价差距很大（P40 24GB 版本售价 5 千多美元，TPU 成本估计在几百美元），大小和制程也不一样，也有人觉得这样的比较未免也不恰当。但黄仁勋不惜亲自撰写长文，摆事实摆资料，意在表明辉达在 AI 芯片领域的强势姿态和技术领先的骄傲。

当时 TPU 论文一发布，雷锋网就论文中的比较问题咨询 AI 人士意见，感兴趣的读者可看《Google 公布 TPU 细节后，AI 界怎么看？》。

以下则为黄仁勋全文，原文标题为《AI 驱动资料中心加速计算的崛起》（AI Drives the Rise of Accelerated Computing in Data Centers）。

AI 驱动资料中心加速计算的崛起

Google 最近的 TPU 论文给了一个十分明确的结论：如果没有高速运算能力，大规模 AI 实现根本不可能。

如今的世界经济在全球资料中心上执行，而资料中心也在急剧改变。不久之前，资料中心服务支援网页、广告和影片。现在，它们能够从视讯流里辨识声音、侦测图片，还能随时让我们获得想要的资讯。

以上提到的各种能力，都愈来愈依靠深度学习。深度学习是一种算法，从大量资料里学习形成软件，来处理诸多高难度挑战，包括翻译、癌症诊断、自动驾驶等。这场由 AI 引发的变革，正在以一种前所未有的速度影响各种产业。

深度学习的开拓者 Geoffrey Hinton 最近接受《纽约客》采访时说：“凡是任何一个有很多资料的分类问题，都可以用深度学习的方法来解决。深度学习有几千种应用。”

不可思议的效果

以 Google 为例。Google 在深度学习里突破性的工作引发全球关注：Google Now 语音互动系统令人吃惊的精确性、AlphaGo 在围棋领域历史性的胜利、Google 翻译应用于 100 种语言。

深度学习已经达到不可思议的效果。但是深度学习的方法，要求电脑在摩尔定律放缓的时代背景下，精确处理海量资料。深度学习是一种全新的计算模型，也需要一种全新计算架构的诞生。

一段时间以来，这种 AI 计算模型都是在辉达芯片上执行。2010 年，研究员 Dan Ciresan 当时在瑞士 Juergen Schmidhuber 教授的 AI 实验室工作，他发现辉达 GPU 芯片可用来训练深度神经网络，比 CPU 的速度快 50 倍。一年之后，Schmidhuber 教授的实验室又使用 GPU 开发了世界上首个纯深度神经网络，一举赢得国际手写辨识和电脑视觉比赛的冠军。接着 2012 年，多伦多大学的硕士生 Alex Krizhevsky 使用了两个 GPU，赢得如今蜚声国际的 ImageNet 影像辨识竞赛。（Schmidhuber 教授曾经写过一篇文章，全面梳理了于 GPU 上执行的深度学习对于当代电脑视觉的影响。）

深度学习最佳化

全球 AI 研究员都发现了，辉达为电脑图形和超级计算应用设计的 GPU 加速计算模型，是深度学习的理想之选。深度学习应用，比如 3D 图形、医疗成像、分子动力学、量子化学和气象模拟等，都是一种线性代数算法，需要进行大规模并列张量或多维向量计算。诞生于 2009 年的辉达 Kepler GPU 架构，虽然帮助唤醒了世界在深度学习中使用 GPU 加速计算，但其诞生之初并非为深度学习量身订做。

所以，我们必须开发出新一代 GPU 架构，首先是 Maxwell，接着是 Pascal，这两种架构都对深度学习进行特定最佳化。在 Kepler Tesla K80 之后 4 年，基于 Pascal 架构的 Tesla P40 推理加速器诞生了，它的推理效能是前者的 26 倍，远远超过摩尔定律的预期。

在这时期，Google 也设计了一款自订化的加速器芯片，名为“张量处理单元”，即 TPU。具体针对资料推理，于 2015 年部署。

上周 Google 团队释出了关于 TPU 优越性的一些资讯，称 TPU 比 K80 的推理效能高出 13 倍。但是，Google并没有拿 TPU 与如今最新一代的 Pascal P40 比较。

Nvidia 黄仁勋撰文反击 Google，P40 比 TPU 速度快 2 倍、带宽是 10 倍

AI 驱动资料中心加速计算的崛起

不可思议的效果

深度学习最佳化

最新对比

延伸阅读：

热门推荐

日本尺度超大的综艺节目连主持人都大喊“玩这么大可以吗”

2015下半年DMM最强AV女优排名出炉波多野结衣排名仅第三

Facebook、MessengerApp发生大规模闪退故障现象请暂停更新（内有简易修复法）

科学家大乱斗，一起打爆爱因斯坦、霍金、达尔文、图灵、居里夫人与牛顿吧

最新内容

十年后全球锂电池产能高达 1.3TWh，亚太地区仍是生产重地

小脑其实并不小，研究：只有可丽饼厚，皱褶拉平长达 90 公分

全球最快！荣总团队 7 天就能找出新生儿听损原因

心诚镁结盟台耀、台新药！攻全球呼吸治疗药 CDMO 商机

高龄者打疫苗送 500 元内赠品！网传打三剂返台免隔离为假讯息

英国、香港疫情大爆发！没打疫苗致死率高 31 倍

重训比有氧运动更能改善睡眠品质

国光生技 2 月营收年增 2,489.91%，选株百分百预判 WHO 流感病毒株

聚焦电动车散热工程方案，高柏科技推出一条龙散热对策服务

废弃火箭应已撞向月球，NASA 绕月飞行器预计 3 月中进行成像

关于我们

新闻资讯

意见反馈

网站地图