市场动态全球十大AI芯片华为昇腾91

白癜风能治好吗 https://m-mip.39.net/disease/mipso_6905531.html

AI来了,国产EDA工具的春天到了?

在机械、智能手机、通讯设备、航空航天、生物医药等等各个涉及电子自动化的领域,通过EDA技术来完成特定目标芯片的设计,可以说是产业链上游的上游、基础的基础。

而如此重要的神兵利器,中国企业的市场认可度如何呢?答案是,毫不夸张地说,95%以上的EDA工具都掌握在美国企业手中。中国现存的10余家EDA公司,年销售额3.5亿元,只占到全球市场份额的0.8%,技术研发方面,也以16nm及28nm工艺支持为主。

单兵孤城的国产EDA

其实,早在去年“中兴事件”中,EDA工具就以大杀器的形象出现过。除了禁止卖芯片给中兴以外,全球最大的EDA公司Cadence也宣布停止对中兴服务。今年的特朗普清单中,EDA工具同样没有缺席,赫然在列。事情一旦无可挽回,中国几乎所有芯片企业都只能依靠当前版本的工具进行工作,效率大打折扣不说,还意味着很可能因为无法升级而很快落后于行业,建立在芯片能力基础上的软硬件自然也就成了无本之木、无源之水。

从理性的角度看,彻底地域化的最坏结果大概率不会出现,但EDA工具的战略地位却不得不引起重视。但话又说回来了,为什么时至今日都没有相关“备胎”出现呢?

这样处处掣肘的大背景下,中国EDA工具的前路在何方呢?

风水轮流转,今年看AI

今天没人能够忽视AI对社会产业带来了赋能作用,根据市场研究机构ABIResearch发布的最新报告,云端AI芯片市场将从年的42亿美元增长至年的亿美元规模;边缘AI芯片也将以31%的年平均增长率持续扩张。而EDA作为AI芯片中不可或缺的角色,也在半导体软硬件企业、创业者与开发者的推动下,迎面撞上了新的商机与挑战。

首要的需求变化,是更高的PPA(功耗、性能、面积)目标。

想要将AI移植到智能手机、车联网、IoT等终端,具备深度学习能力的系统级芯片(SoC)就变得不可或缺,产业端对芯片封装的小型化也越来越苛刻。

在越来越小的单位面积上集成越来越多的晶体管,需要更复杂的工艺器件,电路之间的交互、热物理效应等也都会发生改变,这意味着整个设计流程都需要被重新思考,EDA工具也必须与时俱进。

同时,产业智能市场的激烈竞争,也让开发者对设计周期(TimeToMarket)的要求越来越高,而设计规模和规则限制也在增多,如何提升AI芯片的设计效率,减少迭代次数,进而缩短设计周期,也在倒逼EDA厂商升级。

时代浪潮的涌动之下,将AI引入芯片设计环境,就是一个水到渠成的必然选择了。

重新制造轮子:中国EDA的AI土壤

EDA上云是未来的趋势之一,利用云端庞大的运算能力能够有效解决仿真耗时的问题,直接降低芯片创业者获取EDA工具的成本,某些芯片大企业也可以灵活地临时使用某些工具。而众所周知,中国云服务厂商无论是在硬件部署、软件创新、软硬件协同方面,已经开始成为智能产业的支撑力量,也将成为推动EDA领域进化的关键变量。

撬动一座产业版图的,有时是一力降十会的绝对实力,有时也许是顺势而为的一个支点。(文

脑极体)

全球十大AI训练芯片大盘点:华为昇腾是中国唯一入选

AI芯片哪家强?现在,有直接的对比与参考了。

英国一名资深芯片工程师JamesW.Hanlon,盘点了当前十大AI训练芯片。

并给出了各个指标的横向对比,也是目前对AI训练芯片最新的讨论与梳理。

其中,华为昇腾是中国芯片厂商唯一入选的芯片,其性能如何,也在这一对比中有了展现。

CerebrasWafer-ScaleEngine

这一芯片于今年8月份正式面世,被称为“史上最大AI芯片”,名为“晶圆级引擎”(CerebrasWaferScaleEngine,简称WSE)。

其最大的特征是将逻辑运算、通讯和存储器集成到单个硅片上,是一种专门用于深度学习的芯片。

一举创下4项世界纪录:

1、晶体管数量最多的运算芯片:总共包含1.2万亿个晶体管。虽然三星曾造出2万亿个晶体管的芯片,却是用于存储的eUFS。

2、芯片面积最大:尺寸约20厘米×23厘米,总面积平方毫米。

3、片上缓存最大:包含18GB的片上SRAM存储器。

4、运算核心最多:包含,个处理核心

之所以能够有如此亮眼的数据,直接得益于其集成了84个高速互连的芯片,单个芯片在FP32上的峰值性能表现为40TeraFLOPs,芯片功率达15千瓦,与AI集群相当。

其核心数据为:

?7nm+EUV工艺,平方毫米

?集成4个96平方毫米的HBM2栈和NimbusIO处理器芯片

?32个达芬奇内核

?FP16性能峰值TFLOPs(32xx2),是INT8的两倍

?32MB的片上SRAM(L2缓存)

?功耗W

互联和IO数据:

?内核在6x4的2d网格封包交换网路中相互连接,每个内核提供GBps的双向带宽

?4TBps的L2缓存访问

?1.2TBpsHBM2接入带宽

?3x30GBps芯片内部IOs

?2x25GBpsRoCE网络接口

单个达芬奇内核数据:

?3D16x16x16矩阵乘法单元,提供4,个FP16MACs和8,个INT8MACs

?针对FP32(x64)、FP16(x)和INT8(x)的2,位SIMD向量运算

?支持标量操作

?IntelNNP-T

这是XeonPhi之后,英特尔再次进军AI训练芯片,历时4年,壕购4家创业公司,花费超过5亿美元,在今年8月份发布。

本文来自转载自


转载请注明:http://www.bainiangudus.com/gsyq/19163.html