电子展会
HOME
电子展会
正文内容
达摩院芯片 阿里达摩院布局“中国芯”,自研AI芯片性价比超同类40倍
发布时间 : 2025-07-18
作者 : 小编
访问数量 : 23
扫码分享至微信

阿里达摩院布局“中国芯”,自研AI芯片性价比超同类40倍

4月19日,澎湃新闻(www.thepaper.cn)记者从阿里巴巴达摩院获悉,该机构正研发一款神经网络芯片——Ali-NPU,运用于图像视频分析、机器学习等AI推理计算。按照设计,这款芯片性能将是目前市面上主流CPU、GPU架构AI芯片的10倍,而制造成本和功耗仅为一半,性价比超过40倍。

此款芯片的研发,未来将会更好的实现AI智能在图像、视频识别、云计算等商业场景中的运用,提升运算效率、降低成本。

阿里达摩院研究员骄旸对澎湃新闻表示,CPU、GPU作为通用计算芯片,为处理线程逻辑和图形而设计,处理AI计算问题时功耗高,性价比低,在AI计算领域急需专用架构芯片解决上述问题。

阿里巴巴自主研发的Ali-NPU,基于阿里机器智能技术实验室等团队在AI领域积累的大量算法模型优势,根据AI算法模型设计微结构以及指令集,以最小成本实现最大量的AI 模型算法运算。

未来,Ali-NPU的能力,不仅可以更好地满足视频、图像处理需求,还可以通过阿里云进行计算能力的输出,赋能各行各业。

“自研AI芯片”已成为阿里布局“中国芯”的战略组成部分,目前达摩院芯片研发团队,在美国、上海两地已达数十人,预计年底将达百人。此前,阿里已经投资了寒武纪、Barefoot Networks、深鉴、耐能(Kneron)、翱捷科技(ASR)、中天微等多家家芯片公司。

此举可能对国内企业核心技术自主研发产生引领效应。日前,美国商务部宣布,今后7年内,将禁止该国企业向中国电信设备制造商中兴通讯出售任何电子技术或通讯元件,引发了对中国通信产业核心技术“缺芯少魂”问题的讨论。

达摩院是阿里巴巴2017年11月宣布成立的研发机构,布局量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、人机自然交互、芯片技术、传感器技术、嵌入式系统等研发领域。马云曾表示未来将为该机构投入超过1000亿元。

入选芯片顶会ISSCC,阿里达摩院最新存算芯片技术解读

芯东西(公众号:aichip001) 作者 | 陈巍 千芯科技

编者注:阿里达摩院12月3日宣布其已成功研发基于DRAM的3D键合堆叠存算一体AI芯片,该芯片可满足AI等场景对高带宽、高容量内存和极致算力的需求,相关研究成果已被国际芯片顶会ISSCC 2022收录。本文为千芯科技董事长陈巍对该芯片创新技术的解读。

12月3日,阿里达摩院宣布成功研发新型架构芯片,已经被证明能够在阿里推荐系统中发挥极大的应用价值 ,并受到技术圈的普遍关注。

据悉,这颗芯片与数据中心的推荐系统对于带宽/存储的需求完美匹配,大幅提升带宽的同时还实现了超低功耗 ,充分展示了存算技术(第一代仅是近存计算)在数据中心场景的潜力。

▲达摩院存算芯片工作将发表在2022年ISSCC

让我们根据达摩院成员已公开的技术信息,来大胆解读这颗芯片的新科技。

据悉,该工作将发表在2022年ISSCC的Session 29的第一篇,堪称Session 29的扛鼎之作 。需要说明的是,ISSCC(International Solid-State Circuits Conference)被业界视为芯片设计界的奥林匹克运动会,是芯片设计圈的顶级盛会。

根据该论文的信息,我们可以看到,这款存算芯片的设计合作方包括北美Sunnyvale、北京、上海三地的达摩院和西安紫光国芯。幕后大佬包括了达摩院的谢源教授和紫光国芯的CEO任奇伟。

该存算芯片的吞吐率能效达到184QPS/W,单位面积存储密度为64Mb/mm^2,使用了基于3D混合键合(3D Hybrid Bonding)近存计算技术,将逻辑单元与DRAM单元键合在一起。

一、为什么达摩院要使用存算技术?

▲传统架构存在“存储墙”问题

“冯·诺伊曼架构存储和计算分离的模型,已无法满足人工智能应用的需求,计算存储一体化将突破AI算力瓶颈。”这是达摩院判断的2020十大科技趋势中的技术趋势之一。

AI技术的快速发展,使得算力需求呈爆炸式增长。虽然多核(例如CPU)/众核(例如GPU)并行加速技术也能提升算力,但在后摩尔时代,存储带宽制约了计算系统的有效带宽 ,芯片算力增长步履维艰。

巨大的算力需求与实际算力有限增长之间的矛盾,将问题根源指向了冯·诺依曼架构存算分离的局限性 。由于计算与存储分离,在计算的过程中就需要不断通过总线交换数据,将数据从内存读进CPU,计算完成后再写回存储。这一运转方式让冯·诺依曼架构无法适应新型计算的大算力需求。

分析显示,数据从内存传输到计算单元需要的功耗大约是计算本身的200倍,真正用于计算的时间和功耗占比大大降低。

为了从根本上解决冯·诺依曼架构瓶颈,就必须使用将计算和存储合二为一的存算技术

二、基于SeDRAM的近存计算技术

▲SeDRAM技术图示(B. Fujun et al.,2020)

达摩院存算芯片的内存单元采用了异质集成嵌入式DRAM(SeDRAM),拥有超大带宽、超大容量等特点,片上内存带宽可高达37.5GB/s/mm^2。

达摩院存算芯片所使用的SeDRAM就是堆叠嵌入式DRAM(Stacked Embedded DRAM)。

在以往的HBM使用硅中介层(interposer)和微凸块(microbump)来增加逻辑到内存接口的I/O连接数量,以在高数据速率下提供高带宽。然而,进一步提高每引脚数据速率需要HBM和复杂且耗电的PHY电路。而且TSV 和中介层连接具有较大的电阻和电容,从而导致高功耗。

在基于SeDRAM的存算芯片中,AI电路和外围电路,包括控制、I/O和DFT,被分立到一个逻辑芯片,并通过混合键合堆叠在存储阵列芯片上方,混合键合使用 Cu到Cu直接熔合键合。DFT模块则被设计为逻辑芯片中的 IP,用于为阵列芯片执行BISR(内置自修复)。

▲SeDRAM技术的延迟更低带宽更大(B. Fujun et al.,2020)

作为线路后端(BEOL)互连工艺的延伸,混合键合比微凸块和TSV的寄生电容小很多。因此,逻辑到存储器接口的功耗也可以降低40%。

混合键合的PIN间距尺寸为3μm,相反,microbump的间距约为50μm,TSV的间距约为6μm。与使用微凸块和TSV技术的HBM相比,使用混合键合技术的SeDRAM可以达到 110,000/mm^2的最大通孔密度

仅就带宽而言,基于混合键合技术的SeDRAM比HBM效率更高

当然,我们也看到,达摩院的这颗芯片仅仅是使用了近存计算技术,就已经获得了显著的性能,如果使用更先进的存算技术,则会产生更大的技术跃迁。

三、存算芯片的数据流架构

▲一种数据流架构(Wang Z. et al.,2020)

数据流架构是这颗芯片的另一个特色。

达摩院研发设计了基于数据流的定制化加速器架构,对推荐系统端到端进行加速,包括匹配、粗排序、神经网络计算、细排序等任务。

如数据流架构图所示,节点(Node Cluster)是构建整个架构的基本模块,每个检点的微架构包括多个存储块和一个处理核心。(例如权重存储和输入数据存储)

底层电路结构采用了同构设计,所有节点都可以灵活配置,每个节点有点像多处理器片上系统。

整个计算流程分为多轮(Round)。一轮可以进一步分为两个子轮。在计算子轮期间,存储在其本地缓冲区中的输入特征和神经权重被传送到处理数组中以进行计算。在每个通信子轮中,节点转发其输出特征,簇(Cluster)之间以循环方式交换存储的数据

通过这种近存计算(基于SeDRAM)和数据流架构的耦合,可以大大减少访问外部内存的次数,提升整体计算能效和性能

以搜索推荐为例,这一场景对内存带宽、功耗、时延等方面有很高的要求,如果用传统计算来实现,系统性能不易提高,但用存算的方式就能解决这些问题 ,同时降低成本。在实际推荐系统应用中,该芯片相对于传统CPU计算系统可以达到10倍以上性能提升和300倍的能效提升。

▲数据流架构的执行方式(Wang Z. et al.,2020)

四、存算技术路线的演进

目前存算技术在按照以下路线在演进:

查存计算(Processing With Memory): GPU中对于复杂函数就采用了这种计算方法,是早已落地多年的技术。存储芯片内部的存储单元完成查表计算操作,存储单元和计算单元完全融合,没有一个独立的计算单元。

近存计算(Computing Near Memory): 典型代表包括AMD的Zen系列CPU和达摩院本次发表的存算芯片。计算操作由位于存储区域外部的独立计算芯片/模块完成。这种架构设计的代际设计成本较低,适合传统架构芯片转入。这次达摩院发布的存算芯片也属于这一类型。

存内计算(Computing In Memory): 典型代表是Mythic、闪忆、知存、九天睿芯。计算操作由位于存储芯片/区域内部的独立计算单元完成,存储和计算可以是模拟的也可以是数字的。这种路线适合算法固定的场景算法计算,目前主要用于语音等轻算力场景。

▲存算架构的演进路线

逻辑存储(Logic In Memory): 通过在内部存储中添加计算逻辑,直接在内部存储执行数据计算,这种架构数据传输路径最短,同时能满足大模型的计算精度要求 。典型代表包括TSMC(在2021 ISSCC发表)和千芯。

在达摩院前期的测试中,这颗存算芯片(目前还仅是近存计算)已经被证明能够在阿里推荐系统中发挥极大的应用价值

可以看到,由于存算技术本身的高能效和大算力特点,可以打破传统计算架构的“存储墙”问题。

这次近存架构在数据中心推荐系统中的应用还只是小试牛刀。存算技术在海量数据计算场景中拥有天然的优势 ,将在云计算、自动驾驶、元宇宙等场景拥有广阔的发展空间。

相关问答

马云研究出了什么芯片?

阿里巴巴发布了第一款AI芯片——含光800,无疑给芯片行业投下了一颗重磅炸弹,瞬间成为新闻焦点。阿里CTO张建峰在会议展示这块芯片和参数,含光800有着领先世界...

马云投的芯片是什么公司?

里巴巴正式宣布成立芯片公司马云亲自命名平头哥半导体有限公司在杭州云栖大会上,阿里巴巴正式宣布成立芯片公司“平头哥半导体有限公司”,由阿里今年4月收购...

阿里发布了第一颗自研芯片含光800,它能跟其他巨头芯片厂商掰手腕么?

先从芯片这事儿说起,都说中国“缺芯”,小小的芯片,牵动很多人的神经。没有芯片,电脑不能运转,字节不会跳动,网络不会链接,雷达、通信都变成眼瞎耳聋,机...9月25...

阿里达摩院成立这么久,有哪些科技产品?

第一,达摩院成立既是为了老百姓,也不能说是为了老百姓。这是一个矛盾的说法,但也是事实。达摩院成立不是公立大学也不是社会性大学。他是为了企业服务的,也就...

阿里达摩院是用来干什么的?-红网问答

从这个名字来看,马云还是非常有武侠精神的。在金庸小说里,达摩院是用来挖掘、收集、整理、弘传少林传统武术和少林寺看家功夫,是武学的最高机构,天...

阿里巴巴为什么要研发芯片?

谢谢邀请。更多分享请关注【东风高扬】。阿里巴巴为什么要研发芯片?阿里巴巴是一家集团式多元业务经营的企业,虽然为人所知的主要是电子商务、以及金融业务,...

阿里巴巴成立最新研究院,取名“达摩院”有什么特别的含义吗?

马云10月11日在云栖大会上发表演讲说阿里巴巴将成立达摩院,进行科学研究与技术创新,未来五年内并将投资1000亿元用于技术研发。达摩院这个名称是马云起的,颇有...

如何评价阿里全资收购大陆唯一的自主嵌入式芯片公司中天微这件事?

观点:马云的确实未雨绸缪,早在2015年就和杭州中天微开始合作,2016年成为最大股东,2017年再投资5亿,2018年4月中兴被禁事件后,芯片问题凸现严重,如今阿里全...为...

马云进军芯片行业,“平头哥”能做起来吗?

马云进军芯片行业,并不只是目前才开始动作,早在几年前就已经开始布局。“平头哥”半导体有限公司只是基于之前的布局...马云进军芯片行业,“平头哥”能做起来吗?...

阿里巴巴达摩院是什么意思?

一个名称而已,是阿里巴巴专门研究前沿技术的机构。马云创建,创建初号称投资1000亿,且不要求盈利。为阿里巴巴创造了很多不错的技术,如玄铁芯片等一个名称而已...

 lol盲僧  贾欣惠 
王经理: 180-0000-0000(微信同号)
10086@qq.com
北京海淀区西三旗街道国际大厦08A座
©2025  上海羊羽卓进出口贸易有限公司  版权所有.All Rights Reserved.  |  程序由Z-BlogPHP强力驱动
网站首页
电话咨询
微信号

QQ

在线咨询真诚为您提供专业解答服务

热线

188-0000-0000
专属服务热线

微信

二维码扫一扫微信交流
顶部