AI微电路最新情势深入分析【凤凰彩票登陆】

2019-08-29 作者:凤凰彩票登陆   |   浏览(176)

整体而言,目前市场呈现的态势是 Nvidia 一家独大,但 GPU 的昂贵和部署难度大,对于专事学术的研究院或许不成问题,对于极为琐碎、繁杂的安防行业则问题重重,优势越来越小,ASIC 解决方案在逐步赢得市场的验证。

英飞凌对各自动驾驶等级中半导体价值的预测

英特尔进入自动驾驶芯片市场虽然较晚,但通过一系列大手笔收购确立了其在自动驾驶市场上的龙头地位。2016 年,公司出资 167 亿美元收购了 FPGA 龙头 Altera;2017 年 3 月以 153 亿美元天价收购以色列 ADAS 公司 Mobileye,该公司凭借着 EyeQ 系列芯片占据了全球 ADAS 70%左右的市场,为英特尔切入自动驾驶市场创造了条件。收购完成之后,英特尔形成了完整的自动驾驶云到端的算力方案——英特尔凌动/至强 Mobileye EyeQ Altera FPGA。英特尔收购 Mobileye 之后,后者也直接推出了 EyeQ5,支持 L4-L5 自动驾驶,预计在 2020 年量产。

第一,受到中美关系的影响,安防行业也在随时准备调整,“中国芯”和“自主可控”被频繁提及,安防产业链上的企业也在纷纷“国产化”。 但在芯片这个高度全球化的领域内,谈国产化和自主可控不易,这条路将艰辛且漫长。但是大国关系的不稳定因素,极易引起产品研发和市场的波动,因此选择开源架构如RISC-V或许将成为各大厂商的共识。

凤凰彩票登陆 1

凤凰彩票登陆 2

纵观目前的安防AI芯片厂商来说,海思依靠华为广阔的海外市场,或许会得到更多机会。比特大陆在区块链芯片领域占据全球70%以上的市场份额,海外销售也是其优势,借此积累将AI芯片带出海也是顺势而为。近期,比特大陆参加了在圣克拉拉会议中心举行的 RISC-V 峰会和在旧金山举行的边缘人工智能峰会,向与会者展示了边缘人工智能产品的规划,并详细介绍了BM1880 的功能和特点,相信这只是比特大陆的第一步。

► 云端训练芯片市场规模在 2022 年将达到 172 亿美元, CAGR~54%。

算力强劲。由于 FPGA 可以同时进行数据并行和任务并行计算,在处理特定应用时效果更加明显,对于某一个特定的运算,FPGA 可以通过编辑重组电路,生成专用电路,大幅压缩计算周期。从赛灵思推出的 FPGA 产品看,其吞吐量和时延指标都好于 CPU 和 GPU 产品。

转:中国安防协会

凤凰彩票登陆 3

CPU与GPU架构对比

从产品角度来说,各厂商将会更加聚焦和专注在自身擅长的领域。算法厂商专注算法,芯片厂商专注算力,集成商专注于项目落地。几方关系将化竞争为合作,共同为安防行业提供更好的产品和解决方案。具体到安防AI芯片,竞争的加剧不言而喻,但最终的胜利需要靠产品说话,也需要靠产品背后的运维来说话。

3)自动驾驶方面,针对丰田公司提出的算力需求,我们看到当下芯片算力与 L5 级自动驾驶还有较大差距。 英飞凌公司给出了各自动驾驶等级中的半导体价值预测, 可以为我们的 TAM 估算提供参考。

GPU(Graphics Processing Unit)是一种由大量核心组成的大规模并行计算架构,专为同时处理多重任务而设计的芯片。正是由于其具备良好的矩阵计算能力和并行计算优势,最早被用于 AI 计算,并在云端获得大量应用。GPU 中超过 80%部分为运算单元,而 CPU 仅有 20%,因此 GPU更擅长于大规模并行运算。以英伟达的 GPU TITAN X 为例,该产品在深度学习中所需训练时间只有CPU 的 1/10 不到。但 GPU 用于云端训练也有短板,GPU 需要同 CPU 进行异构,通过 CPU 调用才能工作,而且本身功耗非常高。同时,GPU 在推理方面需要对单项输入进行处理时,并行计算的优势未必能够得到很好的发挥,会出现较多的资源浪费。

从整体的竞争合作关系上,我们大体可以看到安防厂商们的选择。就安防所用的芯片而言,2018年可以看到三个大方向。

应用场景:安防边缘推断芯片实现结构化数据提取,减轻云端压力

地平线成立于 2015 年,主要从事边缘人工智能芯片和计算平台业务,场景聚焦于智能驾驶和 AIoT边缘计算。2018 年起,公司逐渐实现产品化落地。2019 年 2 月,公司官方宣布已获得 6 亿美元 B轮融资,SK 中国、SK Hynix 以及数家中国一线汽车集团联合领投。B 轮融资后,地平线估值达 30 亿美元。

第三,算法厂商和芯片厂商的合作将更为密切。面对竞争越来越激烈,外部环境不确定性的增加,算法厂商和芯片厂商合作是一个大趋势,各自将最擅长的领域做好,实现共赢。以比特大陆为例,比特大陆作为芯片厂商,以提供底层算力为目标,目前和深瞐科技、千视通等算法厂商紧密合作,共同打造解决方案,为安防行业的客户解决问题。

云天励飞(Intellifusion)

凤凰彩票登陆 4

AI安防企业必须啃下安防芯片这块硬骨头

凤凰彩票登陆 5

凤凰彩票登陆 6

三、芯片发展展望

训练是指通过大量的数据样本,代入神经网络模型运算并反复迭代,来获得各神经元“正确”权重参数的过程。 CPU 由于计算单元少,并行计算能力较弱,不适合直接执行训练任务,因此训练一般采用“CPU 加速芯片”的异构计算模式。目前 Nvidia 的 GPU CUDA计算平台是最成熟的 AI 训练方案,除此还有:

正因为存在上述优势,FPGA 被广泛用于 AI 云端和终端的推理。国外包括亚马逊、微软都推出了基于 FPGA 的云计算服务,而国内包括腾讯云、阿里云均在 2017 年推出了基于 FPGA 的服务,百度大脑也使用了 FPGA 芯片。

与此同时,相比 GPU 的通用,其他几家厂家都针对该场景的特殊情况做了优化。比如比特大陆的云端AI芯片BM168X系列,通过快速迭代推出了两代产品,分别是BM1680和BM1682,后者的特点包括可脱离 X86 CPU 单独存在,支持客户二次开发,拥有单芯片八路H.264、H.265解码能力,支持视频图像后处理硬件加速,支持以太网、PCIE的多芯片互联,易于横向扩展,并基于该芯片研发了专门用于视频结构化的智能服务器 SA3 和嵌入式 AI 迷你机 SE3,可覆盖平安城市、智慧园区等不同落地场景,并且有专门的团队予以支持。

应用场景#1:自动驾驶芯片助力环境感知

但是,ASIC 一旦制造完成以后就不能修改了,且研发周期较长、商业应用风险较大,目前只有大企业或背靠大企业的团队愿意投入到它的完整开发中。国外主要是谷歌在主导,国内企业寒武纪开发的 Cambricon 系列处理器也广泛受到关注。其中,华为海思的麒麟 980 处理器所搭载的 NPU 就是寒武纪的处理器 IP。

一、格局与竞合

凤凰彩票登陆 7

凤凰彩票登陆 8

安防作为 AI 最大的落地场景,吸引 AI 芯片厂商竞相角逐,几乎所有提供 AI 芯片的厂商都加入了战局。我们可以从地域、行业细分两个维度来作为关注点,简单地了解一下整体竟合格局。

芯片成本持续上涨有望带动垂直模式厂商整机售价走高,在出货量相同的情况下为现有芯片厂商贡献更多的营业收入。高通、联发科、展锐等独立芯片供应商则会受益于芯片本身 ASP 的提升。

凤凰彩票登陆 9

从地域维度来看,国外的 Nvidia 作为第三次人工智能浪潮的最大受惠者,理所当然地成为了安防行业的首选,无论是视频结构化服务器,还是安防智能终端,大部分算法训练和推理跑在 Nvidia 的 GPU 上。Intel 花费巨资收购的 ASIC 芯片设计厂商 Movidius 来势汹汹布局安防,老牌低功耗影像处理半导体企业安霸也在2018年一季度推出了CV2和CV22,依然不容小视。国内的厂商海思、比特大陆、寒武纪等在2018年纷纷推出了最新的 AI 芯片,比如海思的Hi3559AV100,比特大陆的第二代云端AI芯片BM1682和终端AI芯片BM1880,寒武纪的MLU100,此外地平线、深鉴科技、灵汐、肇观等初创型企业也都各有动作。

随着车速越来越快,无人车可行驶的路况越来越复杂,该数值在未来需要进一步缩短,对算法效率及推断芯片的算力都是极大的挑战。 例如,在复杂的城区路况下,所需算力可能超过 30TOPS。未来 V2X 地图的加入,将基本上确保了无人车的主动安全性,但同样对推断芯片的性能提出了更高的要求。

机器人尤其是国内产业规模的快速扩大,将大幅带动国内机器人相关智能芯片产业的发展。机器人由控制、传感、驱动和电源四大装置构成,其中控制装置是机器人的“大脑”,核心是 AI 芯片。机器人芯片需要具备强大的数据计算、自主判断思考和执行能力,国外厂商如高通、英特尔、英伟达都在积极部署该领域,国内企业目前处于追赶状态,相关企业包括瑞芯微、珠海全志、炬力等。

凤凰彩票登陆 10

2)安防芯片受益于现有设备的智能化升级,芯片需求扩大。

目前,自动驾驶所使用的芯片主要基于 GPU、FPGA 和 ASIC 三条技术路线。但由于自动驾驶算法仍在快速更迭和进化,因此大多自动驾驶芯片使用 GPU FPGA 的解决方案。未来算法稳定后,ASIC将成为主流。

二、方向与选择

1)手机 SoC 价格不断上升、 AI 向中端机型渗透都将为行业创造更广阔的市场空间。

比特大陆:区块链矿机霸主进军AI领域

在安防智能化如火如荼的发展中,AI芯片作为智能化的核心要素备受瞩目。如果面向最终客户的厂商是这个行业的“面子”,那么安防AI芯片无疑是“里子”。面子感受冷暖,里子冲锋陷阵。大环境如此的情况下,高成本的 AI 芯片企业可以说是顶着寒风在行走。虽然稍显悲壮,但安防这个场景或许是每一家涉足其中的企业必须啃下来的硬骨头,否则就意味着出局。

中国大陆主要 AI 芯片设计公司至少有 20 家

阿里巴巴在自研 AI 芯片之前,主要在通过投资的方式布局 AI 芯片领域。目前,寒武纪、深鉴科技、杭州中天微等都有阿里巴巴的入股,其中 2016 年 1 月份还成为了 AI 芯片设计企业杭州中天微的第一大股东。

从行业细分的角度来看,云端AI芯片的主要厂家有 Nvidia、海思、比特大陆、寒武纪等。终端AI芯片则有老牌企业安霸、Intel 收购的 Movidius 、海思、比特大陆等。值得一提的是,比特大陆在连续推出两款云端AI芯片的同时,也在2018年年中推出第一代终端AI芯片BM1880,专注边缘计算,可以提供1TOPS的算力@INT8,在Winograd卷积加速运算下,提供高达2TOPS的算力。

凤凰彩票登陆 11

凤凰彩票登陆 12

从市场角度来说,国内受限于地方债务和竞争加剧的问题,安防行业的上下游厂商将会把更多的目光转向海外,中国安防产业链相关厂商或将迎来再次出海热潮。

相比训练芯片,推断芯片考虑的因素更加综合:单位功耗算力,时延,成本等等。初期推断也采用 GPU 进行加速,但由于应用场景的特殊性,依据具体神经网络算法优化会带来更高的效率, FPGA/ASIC 的表现可能更突出。除了 Nvidia、 Google、 Xilinx、 Altera(Intel)等传统芯片大厂涉足云端推断芯片以外, Wave computing、 Groq 等初创公司也加入竞争。中国公司里,寒武纪、比特大陆同样积极布局云端芯片业务。

我们简要测算16nm制程工艺下,不同产量不同面积的芯片单位成本,可以看出芯片单位硬件成本随芯片面积、产量上升逐渐下降。因此,一款芯片能否获得广大的市场认可,并拥有较长的产品生命周期,实现芯片产品的规模销售和生产显着决定了企业的盈亏情况。

第二,2018年呈现出的另外一个特点就是边缘计算的布局,这一点无论是海大宇等传统安防厂商、依图云从等新晋安防厂商、旷视商汤这些算法厂商,抑或海思、比特大陆等芯片厂商,都推出了针对边缘计算的方案。在人工智能时代,越来越多的芯片厂商开始布局边缘计算,尤其是在安防这个场景中,云端AI芯片很难满足客户需求,优秀的边缘计算产品与方案将更便利于行业客户。

目前, 人工智能产业链中,包括提供 AI 加速核的 IP 授权商,各种 AI 芯片设计公司,以及晶圆代工企业。

从2012年开始,英伟达将其GPU产品应用于AI并行运算应用中,人们意识到了AI芯片的巨大潜力,传统半导体行业巨头、科技巨头和众多创业团队纷纷加入到该领域的产品研发中来。国内创业公司多成立于15年以后,从2017年开始大量的AI计算芯片产品陆续发布,产品逐步开始实现落地。

凤凰彩票登陆 13

同时,谷歌对 TPU 的态度也更为开放,之前主要是自用,目前也在对用户开放租赁业务,但没有提供给系统商。

历代 Apple 手机芯片成本趋势

自动驾驶汽车装备了大量的传感器、摄像头、雷达、激光雷达等车辆自主运行需要的部件,每秒都会产生大量的数据,对芯片算力有很高的要求, 但受限于时延及可靠性,有关车辆控制的计算不能再依托云端进行,高算力、快速响应的车辆端人工智能推理芯片必不可少。

我们认为, 云端推断芯片在未来会呈现百花齐放的态势。 具体情况如下:

在项目落地方面,嘉楠科技提供的无感门禁系统已经得到了软通动力总部大楼(共有集团员工5万人)的采用,目前已实现每个监控点日均2000次的识别数量。嘉楠科技提供的智能电表解决方案也被亚洲最大的社区——贵阳南明花果园社区采用,实现了对社区10万多个传统电气表的智能化升级改造,解决传统人工入户抄表模式的“高成本、低效率、难入户”等问题。在治理林业病虫害的业务场景中,嘉楠与百度、林业大学合作,将搭载8通道高性能麦克风阵列的音频处理硬件插入树中,以虫子嗑咬树植的声音为音源,判断害虫的位置。同时,还可利用K210芯片的视觉能力,将芯片置入40mm见方的智能盒子,通过图像分类和检测的方法判断视野内是否有害虫存在。这种视听综合判断的方法有效提升了判断的效率与精度,在林业、农田都有广泛的应用场景。同时,该智能盒子不需要外接供电设备,只需要电池供电即可,相比传统的设备更为轻量化,使用成本更低廉。

凤凰彩票登陆 14

2017 年 12 月,地平线发布中国首款全球领先的嵌入式人工智能视觉芯片征程系列和旭日系列。旭日 1.0 处理器面向智能摄像头等应用场景,具备在前端实现大规模人脸检测跟踪、视频结构化的处理能力,可广泛用于智慧城市、智慧零售等场景。征程 1.0 处理器面向智能驾驶,具备同时对行人、机动车、非机动车、车道线、交通标志牌、红绿灯等多类目标进行精准的实时检测与识别的处理能力,同时满足车载严苛的环境要求以及不同环境下的视觉感知需求,可用于高性能 L2 级别的高级驾驶辅助系统 ADAS 。

寒武纪创立于 2016 年 3 月,是中科院孵化的高科技企业,主要投资人为国投创业和阿里巴巴等。公司产品分为终端 AI 芯片及云端 AI 芯片。终端 AI 芯片采用 IP 授权模式,其产品 Cambricon-1A 是全球首个实现商用的深度学习处理器 IP。去年年底公司新发布了第三代机器学习专用 IP Cambricon-1M,采用 7nm 工艺,性能差不多高出 1A 达 10 倍。云端产品上,寒武纪开发了 MLU 100 AI 芯片,支持训练和推断,单位功耗算力表现突出。

百度:通过自研、合作以及投资等多种方式布局 AI 芯片

凤凰彩票登陆 15

目前国内人工智能芯片市场呈现出百花齐放的态势。AI 芯片的应用领域广泛分布在金融证券、商品推荐、安防、消费机器人、智能驾驶、智能家居等众多领域,催生了大量的人工智能创业企业,如地平线、深鉴科技、寒武纪、云知声、云天励飞等。我们认为,未来随着国内人工智能市场的快速发展,生态建设的完善,国内 AI 芯片企业将有着更大的发展空间,未来 5 年的市场规模增速将超过全球平均水平。

主要中国 AI 芯片公司介绍

FPGA 应用于 AI 有以下优势:

而同时我们也注意到:

半导体行业产业链从上游到下游大体可分为:设计软件、设备、材料、IC设计、代工、封装等。

寒武纪在 2017 年 11 月发布云端芯片 MLU 100,同时支持训练和推断,但更侧重于推断。MLU 100 在 80W 的功耗下就可以达到 128 TOPS(对应 INT 8)的运算能力。

从市场格局上看,全球 FPGA 长期被 Xilinx、Intel、Lattice、Microsemi四大巨头垄断。其中,赛灵思和英特尔合计占到市场的 90%左右,赛灵思的市场份额超过 50%,国内厂商刚刚起步,差距较大。

智能音箱通过云端推断芯片工作

Tesla 系列是专门针对 AI 深度学习算法加速设计 GPU 芯片,DGX 则主要是面向 AI 研究开发人员设计的工作站或者超算系统。2018 年,公司包含这两款产品的数据中心业务收入大幅增长 52%,其中Tesla V100 的强劲销售是其收入的主要来源。

比特大陆的计算芯片 BM 1680,集成了深度学习算法硬件加速模块(NPUs),应用于云端计算与推理。 BM1680 还提供了 4 个独立的 DDR4 通道,用于高速数据缓存读取,以提高系统的执行速度。其典型功耗只有 25W,在单位能耗推断效率上有一定优势。

谷歌:TPU 芯片已经实现从云到端,物联网 TPU Edge 是当前布局重点

AI 芯片助力结构化分析实现工作效率提升

FPGA 芯片算力强、灵活度高,但技术难度大国内差距较为明显

AI 芯片设计是人工智能产业链的重要一环。 自 2017 年 5 月以来,各 AI 芯片厂商的新品竞相发布,经过一年多的发展,各环节分工逐渐明显。 AI 芯片的应用场景不再局限于云端,部署于智能手机、 安防摄像头、及自动驾驶汽车等终端的各项产品日趋丰富。 除了追求性能提升外, AI 芯片也逐渐专注于特殊场景的优化。

凤凰彩票登陆 16

AI 芯片投资地图

云端训练芯片市场较为集中,而推理市场云、边两端均有大量企业参与

视频结构化数据提取实例

综合来看,公司在 AI 芯片方面竞争力较强。公司拥有自己的处理器架构和指令集,而且通过硬件神经元虚拟化、开发通用指令集、运用稀疏化处理器架构解决了 ASIC 用于深度学习时存在的云端算力的挑战、能效瓶颈、手机端和云端超大规模计算场景应用问题。

对这些厂商来说,我们认为 AI 化的主要作用是提升芯片附加价值与产品单价。根据 IHS的数据,随着硬件性能的增强及针对于 AI 的运算结构不断渗透,苹果 A11 芯片的成本已达到 27.5 美元。

凤凰彩票登陆 17

责任编辑:

英特尔作为传统的 CPU 设计制造企业,在传统 PC、服务器市场有着绝对的统治力。随着互联网时代的到来以及个人电脑市场的饱和,公司也在开始加快向数字公司转型。尤其在人工智能兴起之后,英特尔凭借着技术和生态优势,打造算力平台,形成全栈式解决方案。

文章来源:半导体行业观察 手机技术资讯

1)加强同芯片设计及 IP 企业合作。2017 年 3 月,百度发布了 DuerOS 智慧芯片,并与紫光展锐、ARM、上海汉枫达成战略合作。这款芯片搭载了对话式人工智能操作系统,可以赋予设备可对话的能力,能广泛用于智能玩具、蓝牙音箱、智能家居等多种设备。2017 年 8 月,百度又与赛思灵发布了 XPU,这是一款 256 核、基于 FPGA 的云计算加速芯片。同在 2017 年,百度同华为达成合作,推动终端 AI 芯片的落地。

手机 AI 芯片对比

国内大量的AI芯片创业公司都是在2015-2017年成立,2018年新增企业数量减少。资本方面,受到宏观经济影响虽然行业内投融资事件相比2017年同比增长了32%,但行业整体投融资金额骤减,但头部企业在2018年依然持续获得投资人青睐,多家企业创造了估值新高。

► 2017 年全球安防摄像头 AI 芯片市场规模 3.3 亿美元。

凤凰彩票登陆 18

► Intel

2、芯片企业

凤凰彩票登陆 19

按照谷歌的规划,Edge TPU 将提供给系统商,开放程度将进一步提升。如果 Edge TPU 推广顺利,支持的系统伙伴将进一步增多,谷歌将尽快推出下一代 Edge TPU 产品。即使推广不顺利,Google也可能自行推出 Edge 网关、Edge 设备等产品。

从以上应用场景不难看出, 自动驾驶对芯片算力提出了很高的要求, 而受限于时延及可靠性,有关自动驾驶的计算不能在云端进行,因此边缘推断芯片升级势在必行。根据丰田公司的统计数据,实现 L5 级完全自动驾驶,至少需要 12TOPS 的推断算力,按现行先进的 Nvidia PX2 自动驾驶平台测算,差不多需要 15 块 PX2 车载计算机,才能满足完全自动驾驶的需求。

根据美国汽车工程师协会将自动驾驶按照车辆行驶对于系统依赖程度分为L0~L5六个级别,L0为车辆行驶完全依赖驾驶员操纵,L3级以上系统即可在特定情况下实现驾驶员脱手操作,而L5级则是在全场景下车辆行驶完全实现对系统的依赖。目前商业化乘用车车型中仅有Audi A8、Tesla、凯迪拉克等部分车型可实现L2、3级ADAS。预计在2020年左右,随着传感器、车载处理器等产品的进一步完善,将会有更多的L3级车型出现。而L4、5级自动驾驶预计将会率先在封闭园区中的商用车平台上实现应用落地,更广泛的乘用车平台高级别自动驾驶,需要伴随着技术、政策、基础设施建设的进一步完善,预计至少在2025年~2030年以后才会出现在一般道路上。

自动驾驶平台对比

芯片设计企业依然是当前 AI 芯片市场的主要力量,包括英伟达、英特尔、AMD、高通、三星、恩智浦、博通、华为海思、联发科、Marvell、赛灵思等,另外,还包括不直接参与芯片设计,只做芯片 IP 授权的 ARM 公司。其中,英伟达、英特尔竞争力最为强劲。

异构智能(NovuMind)

2019 年 3 月,英伟达宣称将斥资 69 亿美元收购 Mellanox。Mellanox 是超算互联技术的早期研发和参与者。通过与 Mellanox 的结合,英伟达将具备优化数据中心网络负载能力的能力,其 GPU 加速解决方案在超算或者数据中心领域的竞争力也将得到显着提升。

AI 芯片工作流程

凤凰彩票登陆 20

龙加智(Dinoplus)

摘要:经历了 60 多年的起起伏伏之后,人工智能终于迎来了第三次爆发。第三次爆发的核心引爆点是深度学习算法的出现,但其背后的支撑是数据和算力。

TPU RankBrain 在推断正确率上获得提高

凤凰彩票登陆 21

公司介绍: GUC 是弹性客制化 IC 领导厂商(The Flexible ASIC LeaderTM),主要从事 IC 后端设计。后端设计工作以布局布线为起点,以生成可以送交晶圆厂进行流片的 GDS2 文件为终点,需要很多的经验,是芯片实现流片的重要一环。初创公司同时完成前后端设计难度较大。在 AI 芯片设计发展的大环境下,加上大股东台积电的支持, GUC 有望获得大的后端订单。 公司已在台湾证券交易所挂牌上市,股票代号为 3443。

6、机器人

以下企业值得关注:

AI 芯片用于自动驾驶之后,对传统的汽车电子市场冲击较大,传统的汽车电子巨头(恩智浦、英飞凌、意法半导体、瑞萨)虽然在自动驾驶芯片市场有所斩获,但风头远不及英特尔、英伟达、高通甚至是特斯拉。国内初创企业如地平线、眼擎科技、寒武纪也都在积极参与。在自动驾驶芯片领域进展最快以及竞争力最强的是英特尔和英伟达,英特尔强在能耗,英伟达则在算力和算法平台方面优势明显。

凤凰彩票登陆 22

凤凰彩票登陆 23

自动驾驶芯片市场仍处于初期起步阶段。 虽然 NXP 等传统半导体厂商深耕于汽车电子多年,获得了一定的客户粘性,但在自动驾驶业务上,整个市场还未形成非常明显的竞争格局。客户也在不断测试芯片厂商的产品,来实现最优选择。根据各公司披露的数据,目前各大芯片厂商与整车厂(OEM)及 Tier 1 厂商都开展了紧密的合作,但客户数量不相上下。

2017 年,阿里巴巴成立阿里达摩院,研究领域之一就是 AI 芯片技术。2018 年 4 月,阿里达摩院对外宣布正研发一款 Ali-NPU 神经网络芯片,预计将在 2019 年下半年问世。这款芯片将主要应用于图像视频分析、机器学习等 AI 推理计算。

我们认为,目前整个安防 AI 芯片市场竞争格局稳定,现有厂商凭借与下游客户长期的合作,有望继续受益于安防智能化的升级,属于新进入者的市场空间有限。 安防 AI 芯片下游客户稳定,为海康威视、大华股份等视频监控解决方案提供商。客户与传统视频解码芯片厂商的长期合作具有粘性,同样推出新产品,初创公司的竞争优势弱一些,尤其是在安防 AI 芯片性能差异化很难做到很大的情况下。

凤凰彩票登陆 24

凤凰彩票登陆 25

当前,无论是智能音箱还是其他智能家居设备,智能功能都是在云端来实现,但云端存在着语音交互时延的问题,对网络的需求限制了设备的使用空间,而且由此还带来了数据与隐私危机。为了让设备使用场景不受局限,用户体验更好,端侧智能已成为一种趋势,语音 AI 芯片也随之切入端侧市场。国内主要语音技术公司凭借自身在语音识别、自然语言处理、语音交互设计等技术上的积累,开始转型做 AI 语音芯片集成及提供语音交互解决方案,包括云知声、出门问问、思必驰以及 Rokid。

► Wave Computing

凤凰彩票登陆 26

成立于 2015 年 7 月,地平线是一家注重软硬件结合的 AI 初创公司,由 Intel、嘉实资本、高瓴资本领投。公司主攻安防和自动驾驶两个应用场景,产品为征程 1.0 芯片(支持 L2自动驾驶)和旭日 1.0(用于安防智能摄像头),具有高性能(实时处理 1080P@30 帧,并对每帧中的 200 个目标进行检测、跟踪、识别)、低功耗(典型功耗在 1.5W)、和低延迟的优势(延迟小于 30 毫秒)。公司二代自动驾驶芯片将于 1Q19 流片,实现语义建模。

经历了 60 多年的起起伏伏之后,人工智能终于迎来了第三次爆发。第三次爆发的核心引爆点是深度学习算法的出现,但其背后的支撑是数据和算力。对整个 AI 行业来讲,算法、数据和算力三大基本要素中,数据尤其是海量数据的获取和处理难度在下降,算法也在深度学习模型的基础上不断优化,而负责将数据和深度算法统一协调起来的芯片能否获得大的飞跃,成为市场关注的焦点。

凤凰彩票登陆 27

公司云端芯片也取得较大突破。云端芯片一直是英特尔、英伟达等公司的领地,国内企业很难进入。2018 年 5 月,寒武纪推出算力达到 128Tops 的 MLU 100 云端智能芯片,可用于训练和推理。MLU100相比传统的 GPU 和 CPU 芯片,MLU 芯片拥有显着的性能功耗比和性能价格比优势,适用范围覆盖了图像识别、安防监控、智能驾驶等多个重点应用领域。

► 第三方异构计算平台 OpenCL AMD GPU 或 OpenCL Intel/Xilinx 的 FPGA。

在云端推理市场上,由于芯片更加贴近应用,市场更多关注的是响应时间,需求也更加的细分。除了主流的 CPU GPU 异构之外,还可通过 CPU FPGA/ASIC 进行异构。目前英伟达在该市场依然保持着领军位置。主要原因是:GPU强大的并行计算能力、通用性以及成熟的开发环境。但是GPU也并非是完美无缺的解决方案,明显的缺点如:高能耗以及高昂的价格。

在车辆感知周围环境的过程中,融合各路传感器的数据并进行分析是一项艰巨的工作,推断芯片在其中起到了关键性作用。 我们首先要对各路获得的“图像”数据进行分类,在此基础之上,以包围盒的(bounding box) 形式辨别出图像中的目标具体在什么位置。

在英特尔收购的这些企业中,除了前面已经提到的 Altera、Mobileye 之外,Nervana 也非常值得关注。2016 年 8 月,英特尔斥资超过 3.5 亿美元收购这家员工人数不超过 50 人的创业公司,但是经过不到三年的成长,这家公司已经成为英特尔 AI 事业部的主体。依托 Nervana,英特尔成功在 2017年 10 月推出了专门针对机器学习的神经网络系列芯片,目前该芯片已经升级至第二代,预计 2019年下半年将正式量产上市,该芯片在云端上预计能和英伟达的 GPU 产品一较高下。

RankBrain 是 Google 众多搜索算法的一部分,它是一套计算机程序,能把知识库中上十亿个页面进行排序,然后找到与特定查询最相关的结果。 目前, Google 每天要处理 30 亿条搜索,而其中 15%的词语是 Google 没有见过的。 RankBrain 可以观察到看似无关复杂搜索之间的模式,并理解它们实际上是如何彼此关联的, 实现了对输入的语义理解。 这种能力离不开 Google 云端推断芯片 TPU 的辅助。

ASIC 与 GPU、FPGA 不同,GPU、FPGA 除了是一种技术路线之外,还是实实在在的确定产品,而 ASIC 只是一种技术路线或者方案,其呈现出的最终形态与功能也是多种多样的。近年来,越来越多的公司开始采用 ASIC 芯片进行深度学习算法加速,其中表现最为突出的 ASIC 就是 Google 的TPU。

先前,在没有深度学习情况下,单纯依靠 PageRanking 及 InvertedIndex, Google 也能实现一定程度的对搜索词条排序的优化,但准确率不够。 TPU 利用 RankBrain 中的深度学习模型,在 80%的情况下计算出的置顶词条,均是人们最想要的结果。

寒武纪:同时发力终端和云端芯片,技术综合实力较强

► 按承担的任务来分,可以被分为用于构建神经网络模型的训练芯片,与利用神经网络模型进行推断的推断芯片。 训练芯片注重绝对的计算能力,而推断芯片更注重综合指标, 单位能耗算力、时延、成本等都要考虑。

GPU 擅长云端训练,但需与 CPU 异构、功耗高且推理效率一般

► 云计算服务商自研加速芯片(如 Google 的 TPU) 这两种方案。各芯片厂商基于不同方案,都推出了针对于云端训练的 AI 芯片。

在全部的边缘计算场景中,用于自动驾驶的计算芯片设计难度最大,这主要体现在:1)算力要求高, L3级以上自动驾驶需要复数种类的传感器实现传感器冗余,包括:6~12颗单目摄像头、3~12台毫米波雷达、5台以内的激光雷达等(不同方案配置侧重不同),因此产生的数据量极大( 估计L5级一天可产生数据量4000GB),在车辆高速行驶的情况下系统需要能够快速对数据进行处理;2)汽车平台同样是由电池供电,因此对于计算单元功耗有较高的要求,早期计算平台功耗大、产热也较大,对于系统的续航及稳定性都有较大的印象;3)汽车电子需要满足ASIL-D车规级电子产品设计标准,而使自动驾驶所需要的中央处理器达到ASIL-D级设计标准难度更大。

异构智能创立于 2015 年 8 月,由洪泰基金、宽带资本、真格基金和英诺天使投资。 2018年公司展示了其首款云端 AI 芯片 NovuTensor,基于 FPGA 实现,性能已达到目前最先进的桌面服务器 GPU 的一半以上,而耗电量仅有 1/20。公司即将推出的第二款 ASIC 芯片,能耗不超 5W, 计算性能达 15 TOPs,将被用于安防和自动驾驶应用中。

英特尔主要产品为 CPU、FPGA 以及相关的芯片模组。虽然 CPU 产品在训练端的应用效率不及英伟达,但推理端优势较为明显。英特尔认为,未来 AI 工作周期中,推理的时长将是训练时长的 5 倍甚至 10 倍,推理端的芯片需求也会放量。同时,即使是云端训练,GPU 也需要同 CPU 进行异构。

AI 芯片市场规模: 未来五年有接近 10 倍的增长, 2022 年将达到 352 亿美元。根据我们对相关上市 AI 芯片公司的收入统计,及对 AI 在各场景中渗透率的估算, 2017年 AI 芯片市场规模已达到 39.1 亿美元,具体情况如下:

目前,英特尔在人工智能芯片领域主要通过三条路径:1)通过并购快速积累人工智能芯片相关的技术和人才,并迅速完成整合。英特尔在收购了 Altera 后,还先后收购了 Nervana、Movidius 与 Mobileye等初创企业。在完成上述一系列并购之后,英特尔设立了 AI 事业群,整合了 Xeon、Xeon Phi、Nervana、Altera、Movidius 等业务和产品,同时将原有的自动驾驶业务板块并入 Mobileye。2)建立多元的产品线。目前,英特尔正建构满足高性能、低功耗、低延迟等差异化芯片解决方案,除了 Xeon 外,包括可支持云端服务 Azure 的 Movidius VPU 与 FPGA。3)通过计算平台等产品,提供强大的整合能力,优化 AI 计算系统的负载,提供整体解决方案。

► 由于 AI芯片对单位能耗算力要求较高,一般采用 14nm/12nm/10nm等先进工艺生产。台积电目前和 Nvidia、 Xilinx 等多家芯片厂商展开合作,攻坚 7nm AI 芯片。

地平线机器人:公司AI芯片和计算平台在嵌入式及智能驾驶领域具备优势

3)人脸结构的识别也离不开边缘推断芯片,芯片性能的提升直接导致了 AI 美颜、 3D 光效等特殊效果变得更加自然。 如果缺少终端芯片的支持,一旦运行高负载的 AI 任务手机就需要呼唤云端。而云端的相应速度不够,导致 AI 摄影的识别率和准确率下降,用户体验将大打折扣。

百度作为搜索企业,其对 AI 芯片的需求更为明确。早在 2011 年,百度就在 FPGA 和 GPU 进行了大规模部署,也开始在 FPGA 的基础上研发 AI 加速器来满足深度学习运算的需要。此后,百度就不断通过合作、投资和自研的方式来推进该业务。

凤凰彩票登陆 28

FPGA(Field-Programmable Gate Array)即现场可编程门阵列,该芯片集成了大量的基本门电路以及存储器,其灵活性介于 CPU、GPU 等通用处理器和专用集成电路 ASIC 之间,在硬件固定之前,允许使用者灵活使用软件进行编程。FPGA 在出厂时是“万能芯片”,用户可根据自身需求,用硬件描述语言对 FPGA 的硬件电路进行设计;每完成一次烧录,FPGA 内部的硬件电路就有了确定的连接方式,具有了一定的功能;输入的数据只需要依次经过各个门电路,就可以得到输出结果。

地平线机器人(Horizon Robotics)

其中,人力成本占研发成本主要部分,项目开发效率与资深工程师数量正相关,国内资深芯片设计工程师年薪一般在50~100万元之间。EDA工具是芯片设计工具,是发展超大型集成电路的基石,EDA工具可有效提升产品良率。目前,该领域被海外厂商高度垄断,CR3大于70%。EDA厂商主要是通过向IC设计公司进行软件授权获取盈利,根据调研,20人的研发团队设计一款芯片所需要的EDA工具采购费用在100万美元/年左右(包括EDA和LPDDR等IP购买成本)。英伟达开发Xavier,动用了2000个工程师,开发费用共计20以美金,Xlinix ACAP动用了1500个工程师,开发费用总共10亿美金。

海思半导体(Hisilicon)

FPGA 未来在垂直行业有着较大的空间。由于在灵活性方面的优势,FPGA 对于部分市场变化迅速的行业最为实用。同时,FPGA 的高端器件中也可以逐渐增加 DSP、ARM 核等高级模块,以实现较为复杂的算法。随着 FPGA 应用生态的逐步成熟,FPGA 的优势也会逐渐为更多用户所认可,并得以广泛应用。

自 2017 年 5 月以来发布的 AI 芯片一览

智能手机在经历了近10年的高速增长后,市场已趋于饱和,出货增速趋近于0,行业逐渐转为存量市场。近年来,一批国产厂商在产品质量上逐渐达到了第一梯队的水平,进一步加剧了头部市场的竞争。为实现差异化竞争,各厂商加大手机AI功能的开发,通过在手机SoC芯片中加入AI引擎,调配现有计算单元来实现AI计算,或者直接加入AI协处理器,实现在低功耗情况下AI功能的高效运行。

Nvidia 云端推断芯片提升语音识别速度

英伟达创立于 1993 年,最初的主业为显卡和主板芯片组。其主板芯片组主要客户以前是 AMD,但是在 AMD 收购 ATI 推出自研芯片组之后,英伟达在该领域的优势就荡然无存。于是,公司全面转向到 GPU 技术研发,同时进入人工智能领域。2012 年,公司神经网络技术在其 GPU 产品的支持下取得重大进展,并在计算机视觉、语音识别、自然语言处理等方面得到广泛应用。

结合以上观点,及我们对 AI 在各应用场景下渗透率的分析,我们预测:

谷歌可谓是 AI 芯片行业的一匹黑马,但是竞争力强劲。谷歌拥有大规模的数据中心,起初同其他厂商的数据中心一样,都采用 CPU GPU 等异构架构进行计算加速,用来完成图像识别、语音搜索等计算服务。但是,随着业务量的快速增长,传统的异构模式也很难支撑庞大的算力需求,需要探索新的高效计算架构。同时,谷歌也需要通过研发芯片来拓展 AI 平台 TensorFlow 的生态。因此,2016年,Google 正式发布了 TPU 芯片。

应用场景#1:云端推断芯片助力智能语音识别

在项目落地方面,比特大陆基于云端AI芯片的人脸闸机助力福建618展会与厦门98投洽会成功举办,累计通行超过30万人次,通道表现稳定可靠,状况良好。在第二届数字中国峰会安保系统中,搭载比特大陆自研芯片的算丰人工智能服务器与海康威视人脸识别算法相融合,全程应用于峰会安全保障工作,3D人脸轨迹系统为日均6万余人次、累计150余万张人脸图片的海量分析提供算力支持。

以下为初创公司:

凤凰彩票登陆 29

Nvidia 在 2017 年时指出,到 2020 年,全球云端训练芯片的市场规模将达到 110 亿美元,而推断芯片(云端 边缘) 的市场规模将达到 150 亿美元。 Intel 在刚刚结束的 2018 DCI峰会上,也重申了数据业务驱动硬件市场增长的观点。 Intel 将 2022 年与用于数据中心执行 AI 加速的 FPGA 的 TAM 预测,由 70 亿美元调高至 80 亿美元。

凤凰彩票登陆 30

云端训练芯片: TPU 很难撼动 Nvidia GPU 的垄断地位

近年来,各类势力均在发力 AI 芯片,参与者包括传统芯片设计、IT 厂商、技术公司、互联网以及初创企业等,产品覆盖了 CPU、GPU、FPGA 、ASIC 等。在市场调研机构 Compass Intelligence 2018年发布的 AI Chipset Index TOP24 榜单中,前十依然是欧美韩日企业,国内芯片企业如华为海思、联发科、Imagination(2017 年被中国资本收购)、寒武纪、地平线机器人等企业进入该榜单,其中华为海思排 12 位,寒武纪排 23 位,地平线机器人排 24 位。

Google TPU 1.0 为云端推断而生,其运算单元对神经网络中的乘加运算进行了优化,并采用整数运算。 TPU 1.0 单位功耗算力在量产云端推端芯片中最强,达 1.2TOPS/Watt,优于主流 Nvidia GPU。 TPU 2.0 在推断表现上相比于 1 代并没有本质提升,主要进步是引入对浮点数运算的支持,及更高的片上内存。正如前文所述,支持训练的 TPU 功耗也会变得更高。

通常情况下,安防视频监控模拟摄像机的核心部件包括一颗图像传感器和一颗 ISP 芯片,安防视频监控网络摄像机的核心部件包括一颗图像传感器和一颗 IPC SoC 芯片。单从国内来看,未来国内视频监控行业增速仍将保持 12%-15%左右的水平增长,其中网络监控设备增长更为迅速,相关芯片产品需求十分旺盛。

► 2017 年全球数据中心 AI 芯片规模合计 23.6 亿美元,其中云端训练芯片市场规模 20.2亿美元,云端推断芯片 3.4 亿美元。

FPGA 是短期内 AI 芯片市场上的重要增长点,FPGA 的最大优势在于可编程带来的配置灵活性,在当前技术与运用都在快速更迭的时期,FPGA 具有明显的实用性。企业通过 FPGA 可以有效降低研发调试成本,提高市场响应能力,推出差异化产品。在专业芯片发展得足够完善之前,FPGA 是最好的过渡产品,正因为如此,科技巨头纷纷布局云计算 FPGA 的平台。随着 FPGA 的开发者生态逐渐丰富,适用的编程语言增加,FPGA 运用会更加广泛。因此短期内,FPGA 作为兼顾效率和灵活性的硬件选择仍将是热点所在。

► 用于智能手机的边缘推断芯片市场规模 2022 年将达到 38 亿美元, CAGR~59%。

流片生产模式虽然前期投入较大,但一款成功的产品将会使公司获得丰厚的利润,一般芯片产品定价采取8:20原则,即硬件成本:最终产品售价=8:20。该比率可能会随厂商对市场话语权不同而上下波动,因此一款成功的芯片销售毛利应在60%以上。但公司是否能够最终实现盈利,还需要在毛利中进一步扣除前期研发费用。

原标题:AI芯片最新格局分析

综合来看,训练芯片由于对算力的特殊要求,只适合在云端部署,而且多采用的是“CPU 加速芯片”类似的异构模式,加速芯片可以是 GPU,也可以是 FPGA 或者是 ASIC 专用芯片。AI 训练芯片市场集中度高,英伟达和谷歌领先,英特尔和 AMD 正在积极切入。推理在云端和终端都可进行,市场门槛相对较低,市场参与者较多。云端推理芯片除了传统的英伟达、谷歌、赛灵思等芯片大厂外,Groq等国际新兴力量也在加入竞争,国内寒武纪、比特大陆也有不错表现;终端推理芯片市场较为分散,场景各异,参与者除了英伟达、英特尔、ARM 和高通之外,国内企业如寒武纪、地平线、云知声、云天励飞等在各自细分领域均有所建树。

凤凰彩票登陆 31

2、GPU、FPGA 以及 ASIC 各有优劣,成为当前 AI 芯片行业的主流

自动驾驶算力需求加速芯片升级

1、数据中心

► Nvidia

四、国内外AI芯片企业融资概况

清华紫光集团于 2013 年、 2014 年先后完成对展讯及锐迪科微电子的收购, 2016 年再将二者合并,成立紫光展锐。紫光展锐是全球第三大手机基带芯片设计公司,是中国领先的 5G 通信芯片企业。 Gartner 的数据显示,紫光展锐手机基带芯片 2017 年出货量的全球占比为 11%。除此之外,展锐还拥有手机 AI 芯片业务,推出了采用 8 核 ARM A55 处理器的人工智能 SoC 芯片 SC9863,支持基于深度神经网络的人脸识别技术, AI 处理能力比上一代提升 6 倍。

相比之下中金公司研究部公布的一组数据则更为乐观,该数据显示,2017年,整体AI芯片市场规模达到62.7亿美元,其中云端训练AI芯片20.2亿美元,云端推理芯片3.4亿美元,边缘计算AI芯片39.1亿美元;到2022年,整体AI芯片市场规模将会达到596.2亿美元,CAGR57%,其中云端训练AI芯片172.1亿美元,CAGR 53.5%,云端推断芯片71.9亿美元,CAGR 84.1%,边缘计算AI芯片352.2亿美元,CAGR 55.2%。

2)手机推断芯片中 GPU、 NPU 等单元的协同工作,实现了对边缘虚化更准确的处理,使小尺寸感光元件的手机获得“单反” 级的景深效果,增加相片的层次感。

传统的半导体巨头和科技巨头也在布局AI芯片领域,除自主研发以外,基于资金优势通过对外投资收购优质资产及创业团队等手段加速自身的AI芯片业务发展,典型代表如Intel,大手笔收购了包括Altera、Nervana、Movidius以及Mobileye在内的多家AI芯片企业,阿里巴巴也通过先后投资、收购布局AI芯片的开发。

AMD 虽未单独拆分数据中心收入,但从其计算和图像业务的收入增长情况来看, GPU 销量向好。目前 AMD GPU 也开始切入深度学习训练任务,但市场规模落后于 Nvidia。

凤凰彩票登陆 32

凤凰彩票登陆 33

凤凰彩票登陆 34

► 2017 年全球自动驾驶 AI 芯片的市场规模在 8.5 亿美元。

TPU 是谷歌为提升 AI 计算能力同时大幅降低功耗而专门设计的芯片。该芯片正式发布于 2016 年 5月。TPU 之所以称为 AI 专用芯片,是因为它是专门针对 TensorFlow 等机器学习平台而打造,该芯片可以在相同时间内处理更复杂、更强大的机器学习模型。谷歌通过数据中心测试显示,TPU 平均比当时的 GPU 或 CPU 快 15-30 倍,性能功耗比(TFOPS/Watt)高出约 30-80 倍。

凤凰彩票登陆 35

凤凰彩票登陆 36

1)从整个场景识别,到特殊优化过程中,推断芯片为算法运行提供硬件支持。

嘉楠科技在2016年实现了16nm芯片量产,一举通过国家高新技术企业认定。并于2017年被正式评定为杭州市高科技独角兽企业。2018年,嘉楠科技连获两项全球重大技术突破,实现量产全球首个基于自研的7nm芯片,以及量产全球首款基于RISC-V 自研商用边缘智能计算芯片。

用于安防边缘推断芯片: 海思、安霸与 Nvidia、 Mobileye 形成有力竞争

嘉楠科技于2013年发布了全球首款基于ASIC芯片的区块链计算设备,引领行业进入ASIC时代。2015年,嘉楠科技获清华长三角研究院投资,并作为重点项目被引进至科技重镇杭州。同年,嘉楠科技成功实现28nm制程工艺芯片的量产,迈出了AI芯片量产的第一步。

应用场景#2:自动驾驶芯片助力避障规划

2019年6月20日,寒武纪正式推出了第二代云端AI芯片——思元270及板卡产品。思元270采用的是寒武纪自主研发的MLUv02指令集,可支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用,更为视觉应用集成了充裕的视频和图像编解码硬件单元。具体性能指标方面,思元270芯片处理非稀疏深度学习模型的理论峰值性能提升至上一代MLU100的4倍,达到了128TOPS;同时在定点训练领域取得关键性突破,兼容INT4和INT16运算,理论峰值分别达到256TOPS和64TOPS;支持浮点运算和混合精度运算。

凤凰彩票登陆 37

智能家居近年来也成为人工智能重要的落地场景。从技术应用上讲,人类 90%的信息输出是通过语音,80%的是通过视觉,智能家居领域应用最多的就是智能语音交互技术。近年来,正是看到语音交互技术与智能家居深度融合的潜力,谷歌、苹果、微软均将其作为进入智能家居领域的重要切入口,发布了多款软硬件平台,如亚马逊推出的智能音箱设备。国内智能语音龙头企业科大讯飞较早就切入了该领域,联合地产商推出了硬件平台魔飞平台,电视、咖啡机、电灯、空调、热水器等产品都能通过融入相关平台实现智能化。

AI 芯片市场规模及竞争格局

长期来看 GPU、FPGA 以及 ASIC 三大类技术路线将并存

老牌厂商中Mobileye(被 Intel 收购) 在自动驾驶边缘推断芯片上表现最为抢眼,其 EyeQ3 芯片已经被集成于新一代量产 Audi A8 中的 zFAS 平台上,而 A8 也因此成为第一款支持 L3 级自动驾驶的车型。

嘉楠科技:转型AI芯片厂商

凤凰彩票登陆 38

按照承担的任务分,AI 芯片可以划分为训练芯片和推理芯片。训练是指通过大量标记过的数据在平台上进行“学习”,并形成具备特定功能的神经网络模型;推理则是利用已经训练好的模型输入新数据通过计算得到各种结论。训练芯片对算力、精度要求非常之高,而且还需要具备一定的通用性,以适应多种算法的训练;推理芯片更加注重综合能力,包括算力能耗、时延、成本等因素。

下一代产品中, Mobileye 和新秀 Nvidia 有望实现领先。 Mobileye 更注重算法端, 强调软硬件结合带来的效率提升,其开发的最新 EyeQ5 芯片在 10W 的功耗下就能达到 24TOPS的算力。 英伟达作为传统硬件厂商,借助于 GPU 图形处理的优势,也在自动驾驶市场取得了相应的领先地位,其芯片更注重绝对算力表现。将于今年三季度流片, 2019 年三季度量产的“算力怪兽” Pegasus 平台,搭载了两块 Nvidia 下一代的 GPU,将实现 320TOPS的超强计算能力,完全覆盖 L5 级别应用的需求。

凤凰彩票登陆 39

各芯片厂商合作方比较

凤凰彩票登陆 40

► 按部署的位置来分, AI 芯片可以部署在数据中心(云端),和手机,安防摄像头,汽车等终端上。

英特尔加速向数字公司转型,通过并购 生态优势发力人工智能

中国大陆目前有超 20 家企业投入 AI 芯片的研发中来。 除了像华为海思、紫光展锐这种深耕于芯片设计多年的企业之外,也有不少初创公司表现抢眼,如寒武纪、比特大陆等。此外,台湾地区的 GUC(创意电子)是一家 IC 后端设计公司,凭借 20 年的行业经验,和投资方晶圆制造巨头台积电的鼎力支持,在 AI 芯片高速发展的大环境下也有望受益。

此外,比特大陆基于其芯片,在云端还研发了加速卡、服务器等产品,在终端推出了计算棒、模组、开发板等产品,为不同行业的客户提供适应多种应用场景的产品。

智能手机通过 AI 算法 终端推断芯片,可实现对于现实世界图像的智能识别,并在此基础上进行实时优化:

值得关注的是,英伟达还正在通过投资和并购方式继续加强在超算或者数据中心方面的业务能力。

虽然深度学习任务主要由 GPU 承担,但 CPU 目前仍是云计算芯片的主体。 Intel 于 2015年底年收购全球第二大 FPGA 厂商 Altera 以后,也积极布局 CPU FPGA 异构计算助力 AI,并持续优化 Xeon CPU 结构。 2017 年 Intel 发布了用于 Xeon 服务器的,新一代标准化的加速卡,使用户可以 AI 领域进行定制计算加速。得益于庞大的云计算市场支撑, Intel 数据中心组业务收入规模一直位于全球首位, 2016-17 年单季保持同比中高个位数增长。 2017年 4 季度起,收入同比增速开始爬坡至 20%左右,但相比 Nvidia 的强劲增长态势仍有差距。

分工模式(Fabless-Foundry)的出现主要是由于芯片制程工艺的不断发展,工艺研发费用及产线投资升级费用大幅上升导致一般芯片厂商难以覆盖成本,而 Foundry厂商则是统一对Fabless和IDM的委外订单进行流片,形成规模化生产优势,保证盈利的同时不断投资研发新的制程工艺,是摩尔定律的主要推动者。当前在半导体产业链中,我国在上游软件、设备、高端原材料以及代工制造与全球一线厂商差距较大,而在封装环节拥有长电、华天、通富微等行业前十企业,今年来在IC设计领域也逐渐涌现了以海思为代表的一批优秀企业。

对比其他终端应用场景,自动驾驶不仅计算复杂程度最高,车规级要求也为芯片设立了更高的准入门槛, 其硬件升级落地相对缓慢。 目前各厂商下一代的自动驾驶平台最早计划于 2019 年量产,现今上市平台中,芯片大多只支持 L2/3 级。之前 Uber 的无人车事故,也对整个行业的发展造成了拖累。

相比之下,FPGA的低延迟、低功耗、可编程性优势(适用于传感器数据预处理工作以及小型开发试错升级迭代阶段)和 ASIC 的特定优化和效能优势(适用于在确定性执行模型)也正在凸显,赛灵思、谷歌、Wave Computing、Groq、寒武纪、比特大陆等企业市场空间也在扩大。

来源:内容来自中金公司,作者黄乐平、何玫与杨俊杰,谢谢。

深度学习算法对芯片性能需求主要表现在三个方面:一、海量数据在计算和存储单元之间的高速通信需求。这不但需要芯片具备强大的缓存和片上存储能力,而且还需要计算和存储单元之间有较大的通信带宽。二、专用计算能力需求高。深度学习算法中有大量卷积、残差网络、全连接等特殊计算需要处理,还需要提升运算速度,降低功耗。三、海量数据自身处理同样也对芯片提出了新的要求,尤其是非结构化数据的增多,对传统芯片结构造成了较大的压力。

手机 AI 芯片辅助图片渲染优化

凤凰彩票登陆 41

从“听清”到“听懂”,自然语言理解能力提升与推断芯片硬件的支持分不开:多麦克风方案的普及解决了“听清”的问题,而到“听懂”的跨越中自然语言理解能力是关键。这不仅对云端训练好的模型质量有很高要求,也必须用到推断芯片大量的计算。随着对话式 AI 算法的发展,手机 AI 芯片性能的提升,语音助手在识别语音模式、分辨模糊语音、剔除环境噪声干扰等方面能力得到了优化,可以接受理解更加复杂的语音命令。

凤凰彩票登陆 42

智能手机 SoC 市占率分析(2017)

安防 AI 芯片市场上,除了传统芯片以及安防厂商,还有大量的创业企业在涌入。国外芯片厂商主要有英伟达、英特尔、安霸、TI、索尼、特威、三星、谷歌等;国内厂商主要有海思、国科微、中星微、北京君正、富瀚微、景嘉微、寒武纪、深鉴科技、云天励飞、中科曙光等。英伟达、英特尔等企业凭借着通用处理器以及物联网解决方案的优势,长期与安防巨头如海康、大华、博世等保持紧密联系;国内寒武纪、地平线、云天励飞等企业,都有 AI 芯片产品面世,海思本身就有安防摄像机 SoC 芯片,在新加入 AI 模块之后,竞争力进一步提升。

凤凰彩票登陆 43

阿里巴巴:推出自研神经网络处理芯片,同时加速对 AI 企业投资布局

云端推断芯片提升语音识别速度。 语音识别是推断芯片的工作场景之一,如 Amazon 的语音助手 Alexa,其“智能”来自于 AWS 云中的推断芯片。 Alexa 是预装在亚马逊 Echo内的个人虚拟助手,可以接收及相应语音命令。通过将语音数据上传到云端,输入推断芯片进行计算,再返回结果至本地来达到与人实现交互的目的。原先云端采用 CPU 进行推断工作,由于算力低,识别中会有 300-400ms 的延迟,影响用户体验。

伴随人工智能技术在视觉领域的应用,基于视觉技术的自动驾驶方案逐渐变为可能,这需要在传统行车电脑平台上添加用于视觉算法处理的AI芯片。自动驾驶汽车计算单元设计需要考虑算力、功耗体积等问题,出于硬件资源最优化应用,往往采取异构计算平台设计方案,及“CPU XPU”(XPU包括:DSP/GPU/FPGA/ASIC),其中可采取DSP用于图像特征提取任务、GPU/FPGA/ASIC等计算单元用于目标识别、追踪任务等,而CPU则会用于定位、决策等逻辑运算任务。

凤凰彩票登陆 44

数据中心是 AI 训练芯片应用的最主要场景,主要涉及芯片是 GPU 和专用芯片。如前所述,GPU 在云端训练过程中得到广泛应用。目前,全球主流的硬件平台都在使用英伟达的 GPU 进行加速,AMD 也在积极参与。亚马逊网络服务 AWS EC2、Google Cloud Engine、IBM Softlayer、Hetzner、Paperspace 、LeaderGPU、阿里云、平安云等计算平台都使用了英伟达的 GPU 产品提供深度学习算法训练服务。

云端训练芯片对比

AI 兴起之后,互联网及 IT 企业凭借着在各大应用场景上技术和生态积累,也在积极拓展 AI 相关市场,其中 AI 芯片是部署重点之一。相较而言,互联网企业凭借着数据和场景先天优势,在 AI 算法和芯片领域优势更为明显,如美国谷歌、国内的 BAT。IT 企业如 IBM,在人工智能领域较早开始研究,2018 年年中曾经推出专门针对深度学习算法的原型芯片。

凤凰彩票登陆 45

凤凰彩票登陆 46

但这并不能满足需求:车辆必须要辨别目标到底是其他车辆,是标志物,是信号灯,还是人等等,因为不同目标的行为方式各异,其位置、状态变化,会影响到车辆最终的决策,因而我们要对图像进行语义分割(segmantation,自动驾驶的核心算法技术)。语义分割的快慢和推断芯片计算能力直接相关,时延大的芯片很显然存在安全隐患,不符合自动驾驶的要求。

二、 AI 芯片主要应用场景

► Groq

随着云物移大智等信息及智能化技术的发展,机器人在某些领域的工作效率高于人类,并在工业和服务场景中得到了大量应用。据国际机器人联盟统计,2017 年,全球工业机器人产量达到 38.1 万台,同比增长 30%,预计 2018-2021 年全球工业机器人产量将保持 10%以上增速增长,2021 年产量预计将达到 63.0 万台。中国是全球最大的工业机器人生产国,2017 年产量达到 13.79 万台,同比大幅增长 60%。服务机器人主要用于物流、防务、公共服务、医疗等领域,虽然规模不大,但是增长迅速。2017 年全球产量为 10.95 万台,同比大幅增长 85%。预计 2018 年全球专业服务机器人产量将达到 16.53 万台,同比增长 32%,2019-2021 年平均增速将保持在 21%左右。

在 GPU 之外,云端训练的新入竞争者是 TPU。 Google 在去年正式发布了其 TPU 芯片,并在二代产品中开始提供对训练的支持,但比较下来, GPU 仍然拥有最强大的带宽(900GB/s,保证数据吞吐量)和极高的深度学习计算能力(120 TFLOPS vs. TPUv2 45 TFLOPS),在功耗上也并没有太大劣势(TPU 进行训练时,引入浮点数计算,需要逾 200W 的功耗,远不及推断操作节能)。目前 TPU 只提供按时长付费使用的方式,并不对外直接销售,市占率暂时也难以和 Nvidia GPU 匹敌。

目前自动驾驶市场尚处于发展早期,市场环境不够成熟,但以英伟达、Intel(Mobileye、Altera)等科技巨头为代表的厂商已经投入巨资在该领域开发出了相关的硬件产品及配套软件技术。人工智能芯片创业公司应该加强与OEMs、Tier1或产业联盟合作为其提供AI芯片 软件工具链的全套解决方案。

► AMD

4、创业企业

► 用于安防摄像头的边缘推断芯片市场规模 2022 年将达到 18 亿美元, CAGR~41%。

从安防行业发展的趋势来看,随着 5G 和物联网的快速落地,“云边结合”将是行业最大的趋势,云端芯片国内企业预计很难有所突破,但是边缘侧尤其是视频处理相关 AI 芯片还是有较大潜力,国产化替代将加速。但也看到,AI 芯片离在安防领域实现大规模快速落地仍有距离。除了功耗和算力约束外,工程化难度大也是困扰行业的重要因素,尤其是在安防这种产业链长而高度碎片化的产业,新技术落地需要长时间的积累与打磨,以及人力资源的不断投入。

推断是指借助现有神经网络模型进行运算, 利用新的输入数据来一次性获得正确结论的过程。 推断过程对响应速度一般有较高要求, 因此会采用 AI 芯片(搭载训练完成的神经网络模型)进行加速。

在生态合作方面,2019年5月29日,嘉楠联合百度大脑发布PaddlePi-K210。该产品作为一款AI开发板,尺寸仅为3 X3cm,相当于一个火柴盒大小,具有1Tops的澎湃算力,同时兼具300mw的极低功耗,即使加上摄像头和屏幕也只有1w的功耗,充分适配边缘侧设备对于极低功耗的业务场景需求。同时,该产品打通PaddlePaddle模型设备端部署解决方案。开发者不需要硬件更改,使用公版模具就可以一直支持用户做到产品小样阶段,对开发者十分友好。2018年9月21日,嘉楠科技还与天津市西青区人工智能产业基地签约AI项目。此次人工智能产业集中签约重点项目有平台类、芯片设计、软件研发类、应用类。涉及智能网联车、智慧医疗、智慧城市、智能制造多个人工智能领域。

安防 AI 芯片对比

2018 年 2 月,地平线自主研发的高清智能人脸识别网络摄像机,搭载地平线旭日人工智能芯片,提供基于深度学习算法的人脸抓拍、特征抽取、人脸特征值比对等功能。可以在摄像机端实现人脸库最大规模为 5 万的高性能人脸识别功能,适用于智慧城市、智慧零售等多种行业。

即便采用 H.265 编码,目前每日从摄像机传输到云端的数据也在 20G 左右,不仅给存储造成了很大的压力,也增加了数据的传输时间。 边缘推断芯片在安防端的主要应用,基于将视频流在本地转化为结构化数据。 这样既节省云端存储空间, 也提升系统工作效率。“视频结构化”,简言之即从视频中结构化提取关键目标,包括车辆、人及其特征等。虽然这种对数据的有效压缩要通过算法实现,但硬件的支持不可或缺。

自动驾驶方面。英伟达针对自动驾驶等场景,推出了 Tegra 处理器,并提供了自动驾驶相关的工具包。2018 年,基于 Tegra 处理器,英伟达推出了 NVIDIA DRIVE AutoPilot Level 2 ,并赢得了丰田、戴姆勒等车企的自动驾驶订单。同时,2018 年,公司也正在积极推动 Xavier 自动驾驶芯片的量产。

► 用于自动驾驶汽车的边缘推断芯片市场规模 2022 年将达到 52 亿美元, CAGR~44%。

阿里巴巴作为国内 AI 领域的领军企业,在底层算力、算法技术以及应用平台方面都有较强积累。同Google 类似原因,阿里巴巴也在近年来开始开发 AI 芯片,同时加大对相关领域的投资布局。

海思半导体成立于 2004 年 10 月,是华为集团的全资子公司。海思的芯片产品覆盖无线网络、固网及数字媒体等多个领域,其 AI 芯片为 Kirin 970 手机 SoC 及安防芯片 Hi3559A V100。 Kirin 970 集成 NPU 神经处理单元,是全球第一款手机 AI 芯片, 它在处理静态神经网络模型方面有得天独厚的优势。而 Hi3559A V100 是一款性能领先的支持 8k 视频的 AI芯片。

寒武纪发源于中科院,是目前全球领先的智能芯片公司,由陈天石、陈云霁兄弟联合创办,团队成员主要人员构成也来自于中科院,其中还有部分参与龙芯项目的成员。2018 年 6 月公司,公司获得数亿美元投资,此轮融资之后,寒武纪科技估值从上年的 10 亿美金大幅上升至 25 亿美元。公司是目前国内为数不多的同时具备云端和终端 AI 芯片设计能力的企业。

云端推断芯片:百家争鸣,各有千秋

英伟达:AI 芯片市场的领导者,计算加速平台广泛用于数据中心、自动驾驶等场景

历代 Apple 手机芯片成本趋势

半导体行业产业链长,具有资本和技术壁垒双高的行业特点

凤凰彩票登陆 47

凤凰彩票登陆 48

根据海康威视提供传统视频解码芯片厂商积极布局 AI 升级。 华为海思、安霸(Ambarella)都在近一年内推出了支持 AI 的安防边缘推断芯片。海思的 HI3559A 配备了双核神经网络加速引擎,并成为第一款支持 8k 视频的芯片;安霸也通过集成 Cvflows 张量处理器到最新的 CV2S 芯片中,以实现对 CNN/DNN 算法的支持。

正因为 CPU 在 AI 计算上的弱点,给了可以实现海量并行计算且能够对进行计算加速的 AI 芯片留下了市场空间。从广义上讲,面向 AI 计算的芯片都可以称为 AI 芯片,包括基于传统架构的 GPU、FPGA以及 ASIC,也包括正在研究但离商用还有较大差距的类脑芯片、可重构 AI 芯片等。

► 比特大陆

凤凰彩票登陆 49

凤凰彩票登陆 50

芯片设计需要厂商承担昂贵的EDA费用及高昂的人力成本

比特大陆成立于 2013 年 10 月, 是全球第一大比特币矿机公司,目前占领了全球比特币矿机 60%以上的市场。由于 AI 行业发展迅速及公司发展需要,公司将业务拓展至 AI 领域,并于与 2017 年推出云端 AI 芯片 BM1680,支持训练和推断。目前公司已推出第二代产品BM1682,相较上一代性能提升 5 倍以上。

由于语音芯片市场过于细碎,需要企业根据场景和商业模式需要设计出芯片产品,这对传统的通用芯片企业的商业模式是一种颠覆,以致于在 2018 年以前都很少有芯片巨头进入该领域,这也给了国内语音芯片企业较大的施展空间。而对算法公司来说,通过进入芯片市场,进而通过解决方案直接面向客户和应用场景,通过实战数据来训练和优化算法。

应用场景#2:推断芯片应用于智能搜索

综合自:平安证券、艾瑞咨询等机构研报及相关网络资料

免责声明:本文系网络转载,版权归原作者所有。但因转载众多,无法确认真正的原始作者,故仅标注来源。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将根据您提供的证明材料确认版权并按国家标准支付稿酬或立即删除内容!本文内容为原作者观点,并不代表本公众号赞同其观点和对其真实性负责。返回搜狐,查看更多

3、短期内 GPU 仍将是 AI 芯片主导,长期看三大技术路线将呈现并行态势

凤凰彩票登陆 51

凤凰彩票登陆 52

自动驾驶推断芯片 算法实现自动驾驶避障规划

行业主要存在两种商业模式IP授权和流片模式。其中在IP授权模式中,IP设计公司将自己设计的芯片功能单元,如:CPU、GPU、DSP、NPU等,授权给其他的IC设计公司,如华为海思麒麟970、980芯片获得了寒武纪NPU的IP授权。被授权方将会向授权方支付一笔授权费来获得IP,并在最终芯片产品销售中,以芯片最终售价的1%~3%向授权方支付版税。授权费用实现IP开发成本的覆盖,而版税作为IP设计公司的盈利。但正如手机芯片市场,优质的IP资源往往集中在科技巨头手中,拥有单一或少量IP的创业公司往往因为自身IP竞争力不足、或是难以提供具有综合竞争力的完整解决方案而最终落得被收购或退出市场的境地。

在云端推断芯片领域, Nvidia 主打产品为 P40 和 P4, 二者均采用 TSMC 16nm 制程。 TeslaP4 拥有 2560 个流处理器,每秒可进行 22 万亿次(TOPS) 计算(对应 INT 8)。而性能更强的 Tesla P40 拥有 3840 个流处理器,每秒可进行 47 万亿次(TOPS)计算(对应 INT 8)。从单位功耗推断能力来看, P4/P40 虽然有进步,但仍逊于 TPU。 GPU 在推断上的优势是带宽。

近年来,伴随着全球 AI 产业的快速增长,AI 芯片需求大幅上升。按照 Gartner 最新数据,2018 年全球 AI 芯片市场规模达到 42.7 亿美元。未来几年,全球各大芯片企业、互联网巨头、初创企业都将在该市场上进行角逐,预计到 2023 年全球市场规模将达到 323 亿美元。未来五年(2019-2023年)平均增速约为 50%,其中数据中心、个人终端、物联网芯片均是增长的重点。

打入视频监控解决方案龙头海康威视,实现前装的 Nvidia,Movidius 同样不甘示弱, Movidius 发布的最新产品 Myriad X 搭载神经计算引擎,在 2W的功耗下可实现 1TOPS 的算力。Nvidia TX2 是 TX1 的升级产品,算力更强,达到 1.5TFLOPS,存储能力也有提升。

公司最早发力的是终端芯片,主要为 1A 系列,包括 1A、1H8 和 1H16,公司通过 IP 授权的模式赋能终端或者芯片设计企业,目前主要合作伙伴包括华为,其中麒麟 970 就采用其 1A 处理器。另外,公司还推出了面向低功耗场景视觉应用的寒武纪 1H8,高性能且拥有广泛通用性的寒武纪 1H16,以及用于终端人工智能产品的寒武纪 1M。2018 年 9 月,华为发布的麒麟 980 依然集成了优化版的寒武纪 1H 新一代智能处理器。

主要云端推断芯片对比

目前手机芯片市场存在以下情况:1)、AI应用场景、功能有限;2)、AI芯片厂商一般向SoC厂提供IP并收取授权费,需要AI-IP与整块SoC进行良好的匹配,而创业公司缺少与SoC厂商合作经验;3)、传统手机SoC厂商和IP厂商都在开发自己的AI加速器,传统IP巨头可以采取IP打包销售的方式推广其AI-IP产品。相比之下新进厂商在成本、功能、产品线、匹配度等都不占优的情况下很难在该领域存活。新进厂商应加强其软件方面优势,并加深与手机厂商合作共同进行手机AI功能开发。

GUC(台湾创意电子, 3443 TT)

凤凰彩票登陆 53

自动驾驶推断芯片 算法实现视频的像素级语义分割

随着未来竞争进一步加剧,以及产量上升所带来的成本下降,预计AI芯片将会进一步渗透进入到中等机型市场,市场空间广阔。移动端AI芯片市场不止于智能手机,潜在市场还包括:智能手环/手表、VR/AR眼镜等市场。AI芯片在图像及语音方面的能力可能会带来未来人机交互方式的改变并进一步提升显示屏、摄像头的能力,有可能在未来改变移动端产品。

应用场景#1:推断芯片为 AI 拍照技术提供硬件支持

通用 CPU 在深度学习中可用但效率较低。比如在图像处理领域,主要用到的是 CNN,在自然语言识别、语音处理等领域,主要用到的是 RNN,虽然这两种算法模型有着较大的区别,但本质上都是向量和矩阵运算,主要是加法和乘法,辅助一些除法和指数运算。传统 CPU 可用于做上述运算,但是 CPU 还有大量的计算逻辑控制单元,这些单元在 AI 计算中是用不上的,造成了 CPU 在 AI 计算中的性价比较低。

除了智能手机, 安防外, 自动驾驶汽车也是人工智能的落地场景之一。 车用半导体强大需求已经使供给端产能开始吃紧,而用于自动驾驶的推断芯片需求,同样有望在未来 5年内实现高速增长。我们预计,其市场规模将从 2017 年的 8.5 亿美元,增长至 2022 年的 52 亿美元,CAGR~44%。若想使车辆实现真正的自动驾驶,要经历在感知-建模-决策三个阶段,每个阶段都离不开终端推断芯片的计算。

3、IT 及互联网企业

手机芯片市场目前包括:(1)苹果,三星,华为这类采用芯片 整机垂直商业模式的厂商,以及(2)高通,联发科,展锐等独立芯片供应商和(3) ARM, Synopsys、 Cadence 等向芯片企业提供独立 IP 授权的供应商。 采用垂直商业模式厂商的芯片不对外发售,只服务于自身品牌的整机,性能针对自身软件做出了特殊优化,靠效率取胜。独立芯片供应商以相对更强的性能指标,来获得剩余厂商的市场份额。

三、AI芯片行业产业链及商业模式

► 云端推断芯片市场规模在 2022 年将达到 72 亿美元, CAGR~84%。

半导体行业商业模式主要可分为:IP授权与流片生产模式

► 训练芯片受算力约束,一般只在云端部署。推断芯片按照不同应用场景,分为手机边缘推断芯片、安防边缘推断芯片、自动驾驶边缘推断芯片。为方便起见,我们也称它们为手机 AI 芯片、安防 AI 芯片和汽车 AI 芯片。

1、深度学习算法对芯片要求更为苛刻,通用 CPU 性价比相对较差

下一代自动驾驶 AI 芯片流片及投产时间预估

机器人是人工智能行业最早的落地形态,也是现在和将来重要的应用方向。机器人主要包括两类——制造环境下的工业机器人和非制造环境下的服务机器人。工业机器人主要是面向工业领域的多关节机械手或多自由度机器人。服务机器人则是除工业机器人之外的、用于非制造业并服务于人类的各种先进机器人。

用于自动驾驶的边缘推断芯片:一片蓝海,新竞争者有望突围

市场上主流的 AI 语音芯片,一般都内置了为语音识别而优化的深度神经网络加速方案,以实现语音离线识别。随着算法的精进,部分企业的语音识别能力得到了较快提升,尤其是在远场识别、语音分析和语义理解等方面都取得了重要进展。云知声在 2018 年 5 月,推出语音 AI 芯片雨燕,并在研发多模态芯片,以适应物联网场景,目前公司芯片产品已经广泛用于智能家电如空调之中;出门问问也在 2018 年推出了 AI 语音芯片模组“问芯”MobvoiA1;Rokid 也发在 2018 年发布了 AI 语音芯片 KAMINO18;思必驰利用其声纹识别等技术优势,2019 年初推出基于双 DSP 架构的语音处理专用芯片 TH1520,具有完整语音交互功能,能实现语音处理、语音识别、语音播报等功能。

手机 AI 芯片辅助 Vivo Jovi 处理复杂命令

从谷歌 TPU 的本质来看,它是一款 ASIC,针对 TensorFlow 进行了特殊优化,因此该产品在其他平台上无法使用。第一代 Cloud TPU 仅用于自家云端机房,且已对多种 Google 官方云端服务带来加速效果,例如 Google 街景图服务的文字处理、Google 相簿的照片分析、甚至 Google搜寻引擎服务等。Cloud TPU 也在快速改版,2017 年推出第二代,2018 年推出第三代芯片 TPU 3.0。

Groq 是由 Google TPU 初始团队离职创建的 AI 芯片公司,计划在 2018 年发布第一代 AI芯片产品,对标英伟达的 GPU。其算力可达 400 TOPs(INT 8),单位能耗效率表现抢眼。

在IP授权和流片生产两大类商业模式中,IP授权由于不涉及芯片制造,仅需要考虑研发费用,资金占用相对小、风险较低。流片除前期的研发投入以外,还需要向代工厂支付巨额的代工费用,对资金占用极大,需要芯片销售达到一定量级才能分摊掉前期巨额投入实现盈利,若期间出现流片失败(即流片未达设计期望性能指标)或者市场推广失利等情况,芯片设计厂商需要承担前期巨额的研发和制造投入、费用损失。芯片单位硬件成本主要包含掩膜、封装、测试和晶圆成本,并受到制程工艺、产量、芯片面积等多因素的影响。

自动驾驶算力需求加速芯片升级

3、自动驾驶

公司创立于 2014 年 8 月,由山水从容传媒、松禾资本领投,主攻安防 AI 芯片。其自研IPU 芯片是低功耗的深度学习专用处理器,内含专用图像处理加速引擎,通过级联扩展最多可处理 64 路视频。能耗比突出,超过 2Tops/Watt。

4、国内外 AI 芯片市场需求将保持较快增长势头,云端、边缘均具备潜力

Wave computing 于 2010 年 12 月成立于加州,目前累计融资 1.2 亿美元,是专注于云端深度学习训练和推理的初创公司。Wave computing 的一代 DPU 深度学习算力达 180 TOPS,且无需 CPU 来管理工作流。目前公司正与 Broadcomm 合作在开发二代芯片,将采用 7nm制程。

芯片整体设计制造流程大体包括:1)IC设计公司进行芯片架构设计,2)将设计完成的芯片“图纸”文件交由Foundry厂商进行流片,3)裸片将会交由OSAT厂商进行封装,4)产品销售。研发费用主要包括:研发团队人力成本、EDA软件及IP授权费用及其他场地租金、水电费用等。

► 寒武纪科技

4、安防

应用场景#2:推断芯片助力语音助手处理复杂命令

凤凰彩票登陆 54

传统车载半导体厂商积极布局自动驾驶。 近些年来,各传统车载半导体供应商纷纷涉猎自动驾驶业务,推出了各自的自动驾驶,或辅助驾驶平台,如 TI 推出了面向于 L1/2 级的平价产品,而 Renesas 和 NXP 步入中高端市场。 V3M 与 Bluebox 分别是两家的代表性产品,均满足客户 L3 级自动驾驶需求。目前 NXP 的 Bluebox 2.0 也在测试中。

目前,比特大陆的产品主要应用于区块链和人工智能两个领域,区块链矿机的市场份额高达74.5%。2017年,比特大陆正式发布了面向人工智能领域的子品牌——“算丰”,并推出了针对深度学习推理的第一代云端AI芯片BM1680。2018年3月,比特大陆快速推出了第二代云端人工智能芯片BM1682,2018年9月份推出了面向终端的AI芯片产品BM1880,并计划于2019年推出其第三代云端AI芯片BM1684。

创立于 2017 年 7 月龙加智是专注于云端芯片的 AI 初创公司,由挚信资本和翊翎资本领投。其产品 Dino-TPU 在 75W 功耗下,计算能力超过除最新款 Nvidia Volta 之外的所有 GPU,时延仅为 Volta V100 的 1/10。同时, Dino-TPU 提供市场上独一无二的冗余备份和数据安全保障。 公司计划于 2018 年底完成第一款芯片的流片。

GPU 主要方向是高级复杂算法和通用型人工智能平台。高端复杂算法实现方向。由于 GPU 本身就具备高性能计算优势,同时对于指令的逻辑控制上可以做的更复杂,在面向复杂 AI 计算的应用方面具有较大优势。通用型的人工智能平台方向。GPU 由于通用性强,性能较高,可以应用于大型人工智能平台够高效地完成不同种类的调用需求。

避障规划是车辆主要探测障碍物, 并对障碍物的移动轨迹跟踪(Moving object detection and tracking,即 MODAT)做出下一步可能位臵的推算,最终绘制出一幅含有现存、及潜在风险障碍物地图的行为。出于安全的要求,这个风险提示的时延应该被控制在 50ms级。

2016 年,全球人工智能发展加速,英伟达迅速推出了第一个专为深度学习优化的 Pascal GPU。2017年,英伟达又推出了性能相比 Pascal 提升 5 倍的新 GPU 架构 Volta,同时推出神经网络推理加速器TensorRT 3。至此,英伟达完成了算力、AI 构建平台的部署,也理所当然成为这一波人工智能热潮的最大受益者和领导者。公司的战略方向包括人工智能和自动驾驶。

► Google

Fabless与IDM厂商负责芯片设计工作,其中IDM厂商是指集成了设计、制造、封装、销售等全流程的厂商,一般是一些科技巨头公司,Fabless厂商相比IDM规模更小,一般只负责芯片设计工作。

► Google

3)自研芯片也正在加速部署。2018 年 7 月,百度正式发布了自研的 AI 芯片“昆仑”,这是当时国内第一款云端全功能 AI 芯片,其中包含训练芯片昆仑 818-300,推理芯片昆仑 818-100。昆仑 AI 芯片是基于百度 CPU、GPU、FPGA 的 AI 加速器研发,能够在 100W 左右的功耗下,提供高达 260 万亿次/秒的运算速度,算力处于业界领先水平。

清华紫光展锐 (Tsinghua UNISOC)

凤凰彩票登陆 55

推断芯片助力深度学习实现语义识别

凤凰彩票登陆 56

► 2017 年全球手机 AI 芯片市场规模 3.7 亿美元。

目前最典型的产品如英伟达的DRIVE PX系列及后续的Xavier、Pegasus等。除硬件计算平台外,英伟达为客户提供配套的软件平台及开放的上层传感器布局和自定义模块使得客户能够根据自身需要进行二次开发,其还为客户提供感知、制图以及行驶策略等解决方案。目前其产品已经被包括ZF、Bosch、Audi、Benz以及Tesla等Tier1s、OEMs厂商及诸多自动驾驶创业公司采用作为其处理器方案所使用。

用于智能手机的边缘推断芯片:竞争格局稳定,传统厂商持续受益

凤凰彩票登陆 57

凤凰彩票登陆 58

凤凰彩票登陆 59

而现今 AWS 云中采用了 Nvidia 的 P40 推断芯片,结合 Tensor RT 高性能神经网络推理引擎(一个 C 库),可以将延迟缩减到 7ms。 此外, AI 芯片支持深度学习,降低了语音识别错误率。 目前, 借助云端芯片的良好推断能力,百度语音助手的语音识别准确度已达到 97%之高。

2018 年 4 月,公司发布地平线 Matrix1.0 自动驾驶计算平台。目前已经更新到性能更强的升级版本,地平线 Matrix 自动驾驶计算平台结合深度学习感知技术,具备强大的感知计算能力,能够为 L3 和 L4 级别自动驾驶提供高性能的感知系统。地平线 Matrix 自动驾驶计算平台已向世界顶级Robotaxi 厂商大规模供货,成功开创了中国自动驾驶芯片产品出海和商业化的先河。

从 2017 年开始,苹果,华为海思,高通,联发科等主要芯片厂商相继发布支持 AI 加速功能的新一代芯片(如下图), AI 芯片逐渐向中端产品渗透。由于手机空间有限, 独立的AI 芯片很难被手机厂采用。在 AI 加速芯片设计能力上有先发优势的企业(如寒武纪)一般通过 IP 授权的方式切入。

专用芯片深度学习算法加速应用增多,可提供更高能效表现和计算效率

寒武纪科技(Cambricon Technologies)

比特大陆是全球领先的算力芯片设计企业,其致力于开发高性能、低功耗、全定制的算力芯片,是全球少数几家掌握最先进7nm制程设计能力并可规模量产7nm芯片的公司之一。

凤凰彩票登陆 60

凤凰彩票登陆 61

视频监控行业在过去十几年主要经历了“高清化”、“网络化”的两次换代,而随着 2016年以来 AI 在视频分析领域的突破,目前视频监控行业正处于第三次重要升级周期——“智能化”的开始阶段。 前端摄像头装备终端推断芯片,可以实时对视频数据进行结构化处理,“云 边缘”的边缘计算解决方案逐渐渗透。 我们预计, 应用安防摄像头的推断芯片市场规模,将从 2017 年的 3.3 亿美元,增长至 2022 年的 18 亿美元, CAGR~41%。

功耗优势明显。FPGA 能耗比是CPU的10倍以上、GPU的3倍。由于在 FPGA 中没有取指令与指令译码操作,没有这部分功耗;而在复杂指令集的 CPU 中仅仅译码就占整个芯片能耗的约 50%,在 GPU 里取指与译码也会消耗 10%至 20%的能耗。

比特大陆(Bitmain)

GPU 短期将延续 AI 芯片的领导地位。GPU 作为市场上 AI 计算最成熟、应用最广泛的通用型芯片,应用潜力较大。凭借其强大的计算能力、较高的通用性,GPU 将继续占领 AI 芯片的主要市场份额。

从客户的偏好来看,传统大厂愿意自行搭建平台, 再采购所需芯片,而新车厂偏向于直接购买自动驾驶平台。 介于实现完全自动驾驶非常复杂,目前还在起步阶段,我们认为初创公司在整个行业的发展中是有机会的,并看好技术领先,能与车厂达成密切合作的初创公司。

安防市场是全球及国内 AI 最为确定以及最大的市场,尤其是 AI 中的图像识别和视频处理技术正在全面影响安防产业。其中,在安防产品中,摄像头、交换机、IPC、硬盘刻录机、各类服务器等设备都需要芯片,这些芯片也决定了整个安防系统的整体功能、技术指标、能耗以及成本。在安防芯片中,最为关注的还是四类与监控相关的芯片(ISP 芯片、DVR SoC 芯片、IPC SoC芯片、NVR SoC 芯片)。

2018年9月,嘉楠科技推出了第一代边缘侧AI芯片勘智K210,通过完全自主研发的神经网络加速器IP,同时具备机器视觉和语音识别能力,可以在超低功耗下进行高速卷积神经网络计算。随后勘智K210很快在无感门禁、智能门锁、病虫害防治等领域得到应用。

一、人工智能芯片发展现状及趋势

凤凰彩票登陆 62

当前,两大 GPU 厂商都还在不断升级架构并推出新品,深度学习性能提升明显,未来应用的场景将更为丰富。英伟达凭借着其在矩阵运算上的优势,率先推出了专为深度学习优化的 Pascal GPU,而且针对 GPU 在深度学习上的短板,2018 年推出了 Volta 架构,正在完成加速-运算-AI 构建的闭环;AMD 针对深度学习,2018 年推出 Radeon Instinct 系列,未来将应用于数据中心、超算等 AI 基础设施上。我们预计,在效率和场景应用要求大幅提升之前,作为数据中心和大型计算力支撑的主力军,GPU 仍具有很大的优势。

凤凰彩票登陆 63

以往通过云数据中心做手机端AI推理任务面临网络带宽延迟瓶颈的问题,严重影响用户使用体验,而CPU适合逻辑运算,但并不适合AI并行运算任务,目前市场上流行在SoC中增加协处理器或专用加速单元来执行AI任务。以智能手机为代表的移动互联网终端是一个多传感器融合的综合数据处理平台,AI芯片需要具备通用性,能够处理多类型任务能力。由于移动终端依靠电池驱动,而受制于电池仓大小和电池能量密度限制,芯片设计在追求算力的同时对功耗有着严格的限制,可以开发专用的ASIC芯片或者是使用功耗较低的DSP作为AI处理单元。

5、智能家居

2)参与 AI 芯片企业投资。2018 年 2 月 5 日,美国初创公司 Lightelligence 宣布获得了 1000 万美元种子轮融资,由百度风投和美国半导体高管财团领投。Lightelligence主要利用基于光学的新技术,来加速人工智能的工作负载,通过光子电路的新兴技术来加速信息处理。

按照部署位置划分,AI 芯片可以分为云端芯片和边缘端芯片。云端芯片部署位置包括公有云、私有云或者混合云等基础设施,主要用于处理海量数据和大规模计算,而且还要能够支持语音、图片、视频等非结构化应用的计算和传输,一般情况下都是用多个处理器并行完成相关任务;边缘端 AI 芯片主要应用于嵌入式、移动终端等领域,如摄像头、智能手机、边缘服务器、工控设备等,此类芯片一般体积小、耗电低,性能要求略低,一般只需具备一两种 AI 能力。

目前汽车电子控制系统是分布式ECU架构,不同的信息娱乐、车身、车辆运动和动力总成系统及其细分功能分别由不同独立的ECU单元进行独立控制,部分高档车型上的ECU数量超过100个。未来随着汽车进入L3级以上的高级别自动驾驶时代,随着车载传感器数量及其所产生的数据量剧增,分布式电子系统难以满足对大量、多元的传感器数据进行高效融合处理,并综合所有传感器数据做出车辆控制决策等一系列操作需求。要满足以上功能需求,汽车电子系统由需要向着域控制器、多域控制器等集中化方向发展,未来,汽车电子操控系统将会进一步向着集中化、软硬件解耦及平台化方向发展,汽车将会由统一的超算平台对传感器数据进行处理、融合、决策最终实现高级别的自动驾驶功能。

ASIC(Application Specific Integrated Circuits),即专用芯片,是一种为特定目的、面向特定用户需求设计的定制芯片,具备性能更强、体积小、功耗低、可靠性更高等优点。在大规模量产的情况下,还具备成本低的特点。

五、国内外 AI 芯片厂商概览

凤凰彩票登陆 64

凤凰彩票登陆 65

短期内 GPU 仍将主导 AI 芯片市场,FPGA 的使用将更为广泛

国内人工智能芯片行业发展仍处在起步阶段。长期以来,我国在 CPU、GPU 和 DSP 设计上一直处于追赶状态,绝大多数芯片依靠国外的 IP 核进行设计,自主创新能力不足。但我们也看到,国内人工智能产业的快速发展,也为国内芯片产业实现换道超车创造了机会。由于国内外在芯片生态上并未形成垄断,国内芯片设计厂商尤其是专用芯片设计厂商,同国外竞争对手还处在同一起跑线上。

编辑:芯智讯-浪客剑

凤凰彩票登陆 66

芯片设计技术积累 市场洞察力=芯片产品市场推广成功与否

作为仅次于比特大陆的全球第二大比特币矿机厂商,近几年以来,嘉楠科技也开始积极转型AI芯片厂商,目前已掌握集AI芯片研发、AI算法、结构、SoC集成及流程实现一体化等综合技术,以AI芯片为核心建立AI生态链,以生态伙伴需求为依归,为生态伙伴提供一揽子AI服务方案。

ASIC 长远来看非常适用于人工智能,尤其是应对未来爆发的面向应用场景的定制化芯片需求。ASIC的潜力体现在,AI 算法厂商有望通过算法嵌入切入该领域,以进入如安防、智能驾驶等场景。由于其具备高性能低消耗的特点,可以基于多个人工智能算法进行定制,以应对不同的场景,未来在训练和推理市场上都有较大空间。

2、移动终端

灵活性好。使用通用处理器或 ASIC 难以实现的下层硬件控制操作技术,利用 FPGA 可以很方便的实现,从而为算法的功能实现和优化留出了更大空间。

除了云端,谷歌针对边缘端推理需求快速增长的趋势,也在开发边缘 TPU 芯片。2017 年 11 月,Google 推出轻量版的 TensorFlow Lite(某种程度取代此前的 TensorFlow Mobile),使得能耗有限的移动设备也能支持TensorFlow,2018年推出的Edge TPU芯片即是以执行TensorFlow Lite为主,而非 TensorFlow。Edge TPU 性能虽然远不如 TPU,但功耗及体积大幅缩小,适合物联网设备采用。

凤凰彩票登陆 67

来自IDC和Gartner的数据也显示,全球AI服务器及AI芯片市场规模自2016年到2020年都将保持持续的高速增长,而与此同时全球云端AI芯片当中GPU的市场份额呈现出持续下滑的趋势,预计到2022年云端训练GPU占比将降至60%,云端推理GPU占比更是只有30%。

在合作方面,比特大陆与福建当地企业合资成立福建省算域大数据科技有限公司,负责福州城市大脑的投资、建设与运营,为日后福州AI产业发展建设好基础设施。比特大陆还作为首批企业加入海淀城市大脑科技产业联盟,助力海淀“城市大脑”建设,后还与海淀区签署了围绕“智能处理芯片应用场景建设”的重大项目合作意向书,推动算力芯片应用落地。此外,公司还与东亚最大的游戏云平台优必达合作,共同建设公司位于日本、台湾的机房,基于“算丰”芯片,公司协助Ubitus共同开发计算机视觉相关的AI功能。

ISP 芯片(Image Signal Processing,图像信号处理)主要负责对前端摄像头所采集的原始图像信号进行处理;DVR(DigitalVideoRecorder,数字硬盘录像机)SoC 芯片主要用于模拟音视频的数字化、编码压缩与存储;IPC (IP Camera,IP 摄像机)SoC 芯片通常集成了嵌入式处理器、图像信号处理模块、视音频编码模块、网络接口模块等,具备入侵探测、人数统计、车辆逆行、丢包检测等一些简单的视频分析功能;NVR (Network Video Recorder,网络硬盘录像机) SoC 芯片主要用于视频数据的分析与存储,功能相对单一,但由于多与 IPC 联合使用,市场增长也较快。

成本相对 ASIC 具备一定优势。FPGA 一次性成本远低于 ASIC,在芯片需求还未成规模、深度学习算法暂未稳定需要不断迭代改进的情况下,利用具备可重构特性的FPGA 芯片来实现半定制的人工智能芯片是最佳选择。

1、整体排名

英伟达在汽车AI芯片的竞争中不落下风。英伟达在2015年推出了世界首款车载超级计算机Drive PX,紧接着 2016 年推出 Drive PX2,2018 年推出新一代超级计算机 Drive Xavier,同年,基于双 Drive Xavier 芯片针对自动驾驶出租车业务的 Drive PX Pegasu 计算平台面世。2019 CES 上,英伟达推出了全球首款商用 L2 自动驾驶系统 NVIDIA DRIVE AutoPilot。DRIVE AutoPilot 的核心是 Xavier 系统级芯片。该芯片处理器算力高达每秒 30 万亿次,已经投产。

Edge TPU 可以自己运行计算,不需要与多台强大计算机相连,可在传感器或网关设备中与标准芯片或微控制器共同处理 AI 工作。

人工智能方面,英伟达面向人工智能的产品有两类,Tesla 系列 GPU 芯片以及 DGX 训练服务器。

本文由凤凰彩票登陆发布于凤凰彩票登陆,转载请注明出处:AI微电路最新情势深入分析【凤凰彩票登陆】

关键词: 凤凰彩票登陆