一文看懂AI芯片最新格局

2018-10-23 09:23

用于自动驾驶的边缘推断芯片：一片蓝海，新竞争者有望突围

除了智能手机，安防外，自动驾驶汽车也是人工智能的落地场景之一。车用半导体强大需求已经使供给端产能开始吃紧，而用于自动驾驶的推断芯片需求，同样有望在未来 5年内实现高速增长。我们预计，其市场规模将从 2017 年的 8．5 亿美元，增长至 2022 年的 52 亿美元，CAGR～44％。若想使车辆实现真正的自动驾驶，要经历在感知－建模－决策三个阶段，每个阶段都离不开终端推断芯片的计算。

应用场景1：自动驾驶芯片助力环境感知

在车辆感知周围环境的过程中，融合各路传感器的数据并进行分析是一项艰巨的工作，推断芯片在其中起到了关键性作用。我们首先要对各路获得的“图像”数据进行分类，在此基础之上，以包围盒的（bounding box）形式辨别出图像中的目标具体在什么位置。

但这并不能满足需求：车辆必须要辨别目标到底是其他车辆，是标志物，是信号灯，还是人等等，因为不同目标的行为方式各异，其位置、状态变化，会影响到车辆最终的决策，因而我们要对图像进行语义分割（segmantation，自动驾驶的核心算法技术）。语义分割的快慢和推断芯片计算能力直接相关，时延大的芯片很显然存在安全隐患，不符合自动驾驶的要求。

自动驾驶推断芯片＋算法实现视频的像素级语义分割

应用场景2：自动驾驶芯片助力避障规划

避障规划是车辆主要探测障碍物，并对障碍物的移动轨迹跟踪（Moving object detection and tracking，即 MODAT）做出下一步可能位臵的推算，最终绘制出一幅含有现存、及潜在风险障碍物地图的行为。出于安全的要求，这个风险提示的时延应该被控制在 50ms级。

随着车速越来越快，无人车可行驶的路况越来越复杂，该数值在未来需要进一步缩短，对算法效率及推断芯片的算力都是极大的挑战。例如，在复杂的城区路况下，所需算力可能超过 30TOPS。未来 V2X 地图的加入，将基本上确保了无人车的主动安全性，但同样对推断芯片的性能提出了更高的要求。

自动驾驶推断芯片＋算法实现自动驾驶避障规划

从以上应用场景不难看出，自动驾驶对芯片算力提出了很高的要求，而受限于时延及可靠性，有关自动驾驶的计算不能在云端进行，因此边缘推断芯片升级势在必行。根据丰田公司的统计数据，实现 L5 级完全自动驾驶，至少需要 12TOPS 的推断算力，按现行先进的 Nvidia PX2 自动驾驶平台测算，差不多需要 15 块 PX2 车载计算机，才能满足完全自动驾驶的需求。

自动驾驶算力需求加速芯片升级

传统车载半导体厂商积极布局自动驾驶。近些年来，各传统车载半导体供应商纷纷涉猎自动驾驶业务，推出了各自的自动驾驶，或辅助驾驶平台，如 TI 推出了面向于 L1／2 级的平价产品，而 Renesas 和 NXP 步入中高端市场。 V3M 与 Bluebox 分别是两家的代表性产品，均满足客户 L3 级自动驾驶需求。目前 NXP 的 Bluebox 2．0 也在测试中。

老牌厂商中Mobileye（被 Intel 收购）在自动驾驶边缘推断芯片上表现最为抢眼，其 EyeQ3 芯片已经被集成于新一代量产 Audi A8 中的 zFAS 平台上，而 A8 也因此成为第一款支持 L3 级自动驾驶的车型。

下一代产品中， Mobileye 和新秀 Nvidia 有望实现领先。 Mobileye 更注重算法端，强调软硬件结合带来的效率提升，其开发的最新 EyeQ5 芯片在 10W 的功耗下就能达到 24TOPS的算力。英伟达作为传统硬件厂商，借助于 GPU 图形处理的优势，也在自动驾驶市场取得了相应的领先地位，其芯片更注重绝对算力表现。将于今年三季度流片， 2019 年三季度量产的“算力怪兽” Pegasus 平台，搭载了两块 Nvidia 下一代的 GPU，将实现 320TOPS的超强计算能力，完全覆盖 L5 级别应用的需求。

自动驾驶平台对比

对比其他终端应用场景，自动驾驶不仅计算复杂程度最高，车规级要求也为芯片设立了更高的准入门槛，其硬件升级落地相对缓慢。目前各厂商下一代的自动驾驶平台最早计划于 2019 年量产，现今上市平台中，芯片大多只支持 L2／3 级。之前 Uber 的无人车事故，也对整个行业的发展造成了拖累。

下一代自动驾驶 AI 芯片流片及投产时间预估

自动驾驶芯片市场仍处于初期起步阶段。虽然 NXP 等传统半导体厂商深耕于汽车电子多年，获得了一定的客户粘性，但在自动驾驶业务上，整个市场还未形成非常明显的竞争格局。客户也在不断测试芯片厂商的产品，来实现最优选择。根据各公司披露的数据，目前各大芯片厂商与整车厂（OEM）及 Tier 1 厂商都开展了紧密的合作，但客户数量不相上下。

从客户的偏好来看，传统大厂愿意自行搭建平台，再采购所需芯片，而新车厂偏向于直接购买自动驾驶平台。介于实现完全自动驾驶非常复杂，目前还在起步阶段，我们认为初创公司在整个行业的发展中是有机会的，并看好技术领先，能与车厂达成密切合作的初创公司。

各芯片厂商合作方比较

主要中国 AI 芯片公司介绍

中国大陆目前有超 20 家企业投入 AI 芯片的研发中来。除了像华为海思、紫光展锐这种深耕于芯片设计多年的企业之外，也有不少初创公司表现抢眼，如寒武纪、比特大陆等。此外，台湾地区的 GUC（创意电子）是一家 IC 后端设计公司，凭借 20 年的行业经验，和投资方晶圆制造巨头台积电的鼎力支持，在 AI 芯片高速发展的大环境下也有望受益。

中国大陆主要 AI 芯片设计公司至少有 20 家

以下企业值得关注：

海思半导体（Hisilicon）

海思半导体成立于 2004 年 10 月，是华为集团的全资子公司。海思的芯片产品覆盖无线网络、固网及数字媒体等多个领域，其 AI 芯片为 Kirin 970 手机 SoC 及安防芯片 Hi3559A V100。 Kirin 970 集成 NPU 神经处理单元，是全球第一款手机 AI 芯片，它在处理静态神经网络模型方面有得天独厚的优势。而 Hi3559A V100 是一款性能领先的支持 8k 视频的 AI芯片。

清华紫光展锐（Tsinghua UNISOC）

清华紫光集团于 2013 年、 2014 年先后完成对展讯及锐迪科微电子的收购， 2016 年再将二者合并，成立紫光展锐。紫光展锐是全球第三大手机基带芯片设计公司，是中国领先的 5G 通信芯片企业。 Gartner 的数据显示，紫光展锐手机基带芯片 2017 年出货量的全球占比为 11％。除此之外，展锐还拥有手机 AI 芯片业务，推出了采用 8 核 ARM A55 处理器的人工智能 SoC 芯片 SC9863，支持基于深度神经网络的人脸识别技术， AI 处理能力比上一代提升 6 倍。

GUC（台湾创意电子， 3443 TT）

公司介绍： GUC 是弹性客制化 IC 领导厂商（The Flexible ASIC LeaderTM），主要从事 IC 后端设计。后端设计工作以布局布线为起点，以生成可以送交晶圆厂进行流片的 GDS2 文件为终点，需要很多的经验，是芯片实现流片的重要一环。初创公司同时完成前后端设计难度较大。在 AI 芯片设计发展的大环境下，加上大股东台积电的支持， GUC 有望获得大的后端订单。公司已在台湾证券交易所挂牌上市，股票代号为 3443。

以下为初创公司：

寒武纪科技（Cambricon Technologies）

寒武纪创立于 2016 年 3 月，是中科院孵化的高科技企业，主要投资人为国投创业和阿里巴巴等。公司产品分为终端 AI 芯片及云端 AI 芯片。终端 AI 芯片采用 IP 授权模式，其产品 Cambricon－1A 是全球首个实现商用的深度学习处理器 IP。去年年底公司新发布了第三代机器学习专用 IP Cambricon－1M，采用 7nm 工艺，性能差不多高出 1A 达 10 倍。云端产品上，寒武纪开发了 MLU 100 AI 芯片，支持训练和推断，单位功耗算力表现突出。

比特大陆（Bitmain）

比特大陆成立于 2013 年 10 月，是全球第一大比特币矿机公司，目前占领了全球比特币矿机 60％以上的市场。由于 AI 行业发展迅速及公司发展需要，公司将业务拓展至 AI 领域，并于与 2017 年推出云端 AI 芯片 BM1680，支持训练和推断。目前公司已推出第二代产品BM1682，相较上一代性能提升 5 倍以上。

地平线机器人（Horizon Robotics）

成立于 2015 年 7 月，地平线是一家注重软硬件结合的 AI 初创公司，由 Intel、嘉实资本、高瓴资本领投。公司主攻安防和自动驾驶两个应用场景，产品为征程 1．0 芯片（支持 L2自动驾驶）和旭日 1．0（用于安防智能摄像头），具有高性能（实时处理 1080P＠30 帧，并对每帧中的 200 个目标进行检测、跟踪、识别）、低功耗（典型功耗在 1．5W）、和低延迟的优势（延迟小于 30 毫秒）。公司二代自动驾驶芯片将于 1Q19 流片，实现语义建模。

云天励飞（Intellifusion）

公司创立于 2014 年 8 月，由山水从容传媒、松禾资本领投，主攻安防 AI 芯片。其自研IPU 芯片是低功耗的深度学习专用处理器，内含专用图像处理加速引擎，通过级联扩展最多可处理 64 路视频。能耗比突出，超过 2Tops／Watt。

异构智能（NovuMind）

异构智能创立于 2015 年 8 月，由洪泰基金、宽带资本、真格基金和英诺天使投资。 2018年公司展示了其首款云端 AI 芯片 NovuTensor，基于 FPGA 实现，性能已达到目前最先进的桌面服务器 GPU 的一半以上，而耗电量仅有 1／20。公司即将推出的第二款 ASIC 芯片，能耗不超 5W，计算性能达 15 TOPs，将被用于安防和自动驾驶应用中。

龙加智（Dinoplus）

创立于 2017 年 7 月龙加智是专注于云端芯片的 AI 初创公司，由挚信资本和翊翎资本领投。其产品 Dino－TPU 在 75W 功耗下，计算能力超过除最新款 Nvidia Volta 之外的所有 GPU，时延仅为 Volta V100 的 1／10。同时， Dino－TPU 提供市场上独一无二的冗余备份和数据安全保障。公司计划于 2018 年底完成第一款芯片的流片。

<上一页 1 2 3