AI来了,国产EDA工具的春天到了?
在机械、智能手机、通讯设备、航空航天、生物医药等等各个涉及电子自动化的领域,通过EDA技术来完成特定目标芯片的设计,可以说是产业链上游的上游、基础的基础。
而如此重要的神兵利器,中国企业的市场认可度如何呢?答案是,毫不夸张地说,95%以上的EDA工具都掌握在美国企业手中。中国现存的10余家EDA公司,年销售额3.5亿元,只占到全球市场份额的0.8%,技术研发方面,也以16nm及28nm工艺支持为主。
单兵孤城的国产EDA
其实,早在去年“中兴事件”中,EDA工具就以大杀器的形象出现过。除了禁止卖芯片给中兴以外,全球最大的EDA公司Cadence也宣布停止对中兴服务。今年的特朗普清单中,EDA工具同样没有缺席,赫然在列。事情一旦无可挽回,中国几乎所有芯片企业都只能依靠当前版本的工具进行工作,效率大打折扣不说,还意味着很可能因为无法升级而很快落后于行业,建立在芯片能力基础上的软硬件自然也就成了无本之木、无源之水。
从理性的角度看,彻底地域化的最坏结果大概率不会出现,但EDA工具的战略地位却不得不引起重视。但话又说回来了,为什么时至今日都没有相关“备胎”出现呢?
这样处处掣肘的大背景下,中国EDA工具的前路在何方呢?
风水轮流转,今年看AI
今天没人能够忽视AI对社会产业带来了赋能作用,根据市场研究机构ABIResearch发布的最新报告,云端AI芯片市场将从年的42亿美元增长至年的亿美元规模;边缘AI芯片也将以31%的年平均增长率持续扩张。而EDA作为AI芯片中不可或缺的角色,也在半导体软硬件企业、创业者与开发者的推动下,迎面撞上了新的商机与挑战。
首要的需求变化,是更高的PPA(功耗、性能、面积)目标。
想要将AI移植到智能手机、车联网、IoT等终端,具备深度学习能力的系统级芯片(SoC)就变得不可或缺,产业端对芯片封装的小型化也越来越苛刻。
在越来越小的单位面积上集成越来越多的晶体管,需要更复杂的工艺器件,电路之间的交互、热物理效应等也都会发生改变,这意味着整个设计流程都需要被重新思考,EDA工具也必须与时俱进。
同时,产业智能市场的激烈竞争,也让开发者对设计周期(TimeToMarket)的要求越来越高,而设计规模和规则限制也在增多,如何提升AI芯片的设计效率,减少迭代次数,进而缩短设计周期,也在倒逼EDA厂商升级。
时代浪潮的涌动之下,将AI引入芯片设计环境,就是一个水到渠成的必然选择了。
重新制造轮子:中国EDA的AI土壤
EDA上云是未来的趋势之一,利用云端庞大的运算能力能够有效解决仿真耗时的问题,直接降低芯片创业者获取EDA工具的成本,某些芯片大企业也可以灵活地临时使用某些工具。而众所周知,中国云服务厂商无论是在硬件部署、软件创新、软硬件协同方面,已经开始成为智能产业的支撑力量,也将成为推动EDA领域进化的关键变量。
撬动一座产业版图的,有时是一力降十会的绝对实力,有时也许是顺势而为的一个支点。(文
脑极体)
全球十大AI训练芯片大盘点:华为昇腾是中国唯一入选
AI芯片哪家强?现在,有直接的对比与参考了。
英国一名资深芯片工程师JamesW.Hanlon,盘点了当前十大AI训练芯片。
并给出了各个指标的横向对比,也是目前对AI训练芯片最新的讨论与梳理。
其中,华为昇腾是中国芯片厂商唯一入选的芯片,其性能如何,也在这一对比中有了展现。
CerebrasWafer-ScaleEngine
这一芯片于今年8月份正式面世,被称为“史上最大AI芯片”,名为“晶圆级引擎”(CerebrasWaferScaleEngine,简称WSE)。
其最大的特征是将逻辑运算、通讯和存储器集成到单个硅片上,是一种专门用于深度学习的芯片。
一举创下4项世界纪录:
1、晶体管数量最多的运算芯片:总共包含1.2万亿个晶体管。虽然三星曾造出2万亿个晶体管的芯片,却是用于存储的eUFS。
2、芯片面积最大:尺寸约20厘米×23厘米,总面积平方毫米。
3、片上缓存最大:包含18GB的片上SRAM存储器。
4、运算核心最多:包含,个处理核心
之所以能够有如此亮眼的数据,直接得益于其集成了84个高速互连的芯片,单个芯片在FP32上的峰值性能表现为40TeraFLOPs,芯片功率达15千瓦,与AI集群相当。
其核心数据为:
?7nm+EUV工艺,平方毫米
?集成4个96平方毫米的HBM2栈和NimbusIO处理器芯片
?32个达芬奇内核
?FP16性能峰值TFLOPs(32xx2),是INT8的两倍
?32MB的片上SRAM(L2缓存)
?功耗W
互联和IO数据:
?内核在6x4的2d网格封包交换网路中相互连接,每个内核提供GBps的双向带宽
?4TBps的L2缓存访问
?1.2TBpsHBM2接入带宽
?3x30GBps芯片内部IOs
?2x25GBpsRoCE网络接口
单个达芬奇内核数据:
?3D16x16x16矩阵乘法单元,提供4,个FP16MACs和8,个INT8MACs
?针对FP32(x64)、FP16(x)和INT8(x)的2,位SIMD向量运算
?支持标量操作
?IntelNNP-T
这是XeonPhi之后,英特尔再次进军AI训练芯片,历时4年,壕购4家创业公司,花费超过5亿美元,在今年8月份发布。
本文来自转载自