聚量集团

行业资讯

聚量观察 | Graphcore新一代AI芯片亮相，芯片世界从GPU正式迈入IPU时代？

2020.07.24

导言：AI芯片竞赛进入白热化状态。7月15日，AI芯片初创企业Graphcore正式发布该公司新一代AI芯片Mk2，亦称GC200 IPU。该芯片号称比芯片巨头英伟达在刚刚过去的5月发布的芯片更复杂，比Graphcore发布的上一代芯片性能更高。Mk2究竟有多先进？CPU、GPU和IPU各有何特长，谁将主沉浮？在数据处理方面，IPU能带来哪些变化？本期聚量观察，将与您一起探讨这些问题。

桂冠轮流戴

今年5月，英伟达发布首款基于安培架构的GPU（Graphics Processing Unit，即图形处理器）类型的AI芯片A100，凭借540亿个晶体管，成为当时世界上最复杂的芯片。此前，Graphcore在2018年发布的第一代IPU Mk1凭借236亿个晶体管夺冠。可是，英伟达没料到，变化太快就像龙卷风，刚到手的桂冠还没有暖热，就已经被Graphcore的Mk2抢走了。

Graphcore第二代IPU芯片：Mk2

Graphcore本次发布的Mk2，有594亿个晶体管，1472个独立IPU（Intelligence Processing Unit,即智能处理器）内核，能执行8832个独立并行计算线程，均由内置900MB 随机存取器(RAM)支撑。

AI时代的到来对芯片提出更高要求，AI复杂的模型需要更高性能的并行处理器芯片。迄今为止，英伟达主导着AI芯片市场。英伟达最初为加速游戏图像呈现而设计的GPU，通过时间证明非常适合AI运算。如今，Graphcore作为后起之秀，正试图对英伟达的领袖地位发起挑战。Graphcore创始人兼CEO Nigel Toon认为，IPU方式相比于英伟达采取的GPU路径更高效和先进。他表示，Graphcore正在尝试生产易于用于现有计算基础设施的产品，这意味着可以扩展到几千个IPU芯片，IPU方式成本可降低10到20倍。

有趣的是，Graphcore与英伟达现在看起来是竞争关系，以前却曾是卖家和买家的关系。2002年，Toon和另一位Graphcore联合创立人兼CTO Simon Knowles在英国布里斯托尔创立了Icera，打造3G modem芯片。九年后，该公司被以3.7亿美元卖给了英伟达。到了2016年，两人再次在布里斯托尔创业，成立了Graphcore，当时正值深度学习起飞。正因为此，Graphcore认为自身的最大优势就在于自己设计的芯片从一开始就思考如何将AI融入其间。

Graphcore吸金能力突出，资本市场对其青睐有加。今年早些时候，Graphcore获得最新一轮融资1.5亿美元，估值接近20亿美元。目前，Graphcore融资总计达到4.5亿美元，投资者包括微软、保时捷、宝马等。

深度学习性能哪家强

英国半导体之父、ARM联合创始人Hermann说过这样一句话：在计算机历史上只出现过三次革命，第一次是20世纪70年代的CP，第二次是20世纪90年代的GPU，第三次就是IPU。如果将来Graphcore最终独步天下，这句话或许可以作为脚注。当然这只是一家之家，可能有点夸张，仅供参考，但可以在一定程度上看出Graphcore的IPU的历史地位。

深度学习算法对芯片性能在高速通信、专用计算能力、海量数据处理等方面提出要求。所谓深度学习，是指利用人工智能通过模仿人脑运作原理来处理数据和创立模型以用于决策。我们不妨对CPU、GPU和IPU三者在深度学习方面的性能做一个对比：

GPU属于大规模并行计算架构，专为同时处理多重任务而设计。由于矩阵计算能力和并行计算优势良好，GPU最早用于AI计算，并大量应用于云端。Toon认为可编程处理器市场目前仍是GPU的天下，但Graphcore隶属于这个市场，未来将产生非常多的应用场景，通过持续创新赢得更多市场份额。

赋能交易信用风险指标

根据介绍，GC200现在不单卖，与同时发布的运营该芯片的大规模系统级产品IPU-Machine：M2000(IPU-M2000)一起销售。IPU-M2000有披萨盒子大小，运行4个GC200芯片，专注于AI算法处理，每秒钟能进行1千兆次的浮点运算；即插即用，可连接64000个IPU，每秒钟可进行16000千兆次的浮点运算。1U机架IPU-M2000售价32450美元，每秒2.8TB网络连接，内存高达450GB。目前，已知的用户包括摩根大通、牛津大学、美国劳伦斯伯克利国家实验室、法国数字化转型公司Atos等。预计年底，金融服务、医疗卫生、技术等领域更多的客户可以用到。此前发布的Mk1，客户有许多对冲基金和银行机构，微软Azure数据中心也是客户之一。

大规模系统级产品IPU-Machine：M2000（IPU-M2000）

Mk2和IPU-M2000专为处理对算力要求比较高的大的机器学习模型，比如图像处理、语言处理等，特点是算力强、速度快、延迟低。产业数字金融在获取和处理数据以及建立数据中心时，对芯片的要求同样是算力强、速度快、延迟低。因此，Mk2和IPU-M2000在产业数字金融中有望发挥作用。

产业数字金融利用数字化赋能实现资产的数字化穿透、数字化验真和数字化风控预警，为金融机构打造一套基于实时数据的智能数字风控管理平台，提供交易信用风险模型，使银行建立起主体信用和交易信用相结合的更完善的风险评估体系。交易信用风险指标要求数据更实时、更高频、更细颗粒度：对实时要求高，因此延迟不能不低；对计算要求高，因此速度不能不快；对数据需求大，因此算力不能不强。

人工智能深入发展，对芯片的要求越来越高，芯片日益智能化将成为一种趋势。数据成为一种重要的生产要素，AI芯片将会对数据开采、加工和利用与数据中心的建立发挥积极作用。

文章作者: 李万林（聚均科技综合管理中心）

图片编制: 曹蕾（聚量集团办公室）

版面编辑: 乔嘉男（聚量集团办公室）

上一篇：聚量观察 | Mobileye：视觉感知技术从自动驾驶到产业数...

下一篇：聚量观察 | 售价堪比特斯拉Model S，这款机器人何以成为...

←返回列表

在线留言