英特尔最强芯片来了!吊打英伟达H100:性能飙升170%,成本竟然还更低【附全球人工智能芯片行业前景分析】
(图片来源:摄图网)
北京时间4月9日,全球领先的芯片巨头英特尔(Intel)发布了性能最强的新一代Gaudi3人工智能加速芯片, 为人工智能行业注入了新的活力。
据悉,这款新一代AI芯片与竞争对手英伟达的H100芯片相比,在训练性能上提高了170%,推理能力提升了50%,效率也提高了40%,而且成本更低。 具体来看,英特尔Gaudi 3与英伟达H100在相同节点数量下,相关大模型训练时间对比上最高快了1.7倍,在大模型推理速度表现上,Gaudi 3相比 H100平均快了1.5倍,最高快了4倍。这意味着英特尔的新一代AI芯片在性能方面取得了巨大的突破。
英特尔Gaudi 3 AI芯片采用了台积电5nm工艺,支持128GB HBMe2内存。相比上代产品,英特尔Gaudi 3带来了4倍(400%)的BF16 AI计算能力提升,1.5倍的内存带宽以及2倍的网络带宽提升。
据悉,Gaudi的最新版本将于2024年第三季度推出。
英特尔表示,到2030年,半导体市场规模将达1万亿美元,人工智能是主要推动力。 创新技术正在以前所未有的速度发展,每家公司都在加速成为AI公司。
人工智能芯片是一种专门为人工智能应用而设计的芯片,具有高效的计算能力和推理能力,能够加速机器学习和深度学习任务的执行。 这些芯片通常采用先进的制程工艺和架构设计,能够在处理大规模数据和复杂算法时表现出色,为人工智能技术的发展提供了重要支持。
随着人工智能在生活各领域的渗透,人工智能应用落地和大规模商业化的需求,催生了对芯片研发的更高要求。 人工智能芯片种类日趋多元,目前已正在研究的有类脑芯片、可重构AI芯片等,但其离商用还有较大差距。
随着全球人工智能终端设备数量的增长以及边缘计算的需求逐步提升,人工智能芯片作为人工智能的大脑,市场需求量快速增长,市场规模不断扩大。根据Tractica公布的数据显示,2019年全球人工智能芯片市场规模达110亿美元,预计2025年有望突破720亿美元。
AI芯片在处理人工智能应用中的大量计算任务中起着至关重要的作用。 未来,随着人工智能技术的普及和深入,AI芯片行业将迎来快速增长,成为半导体产业的新的增长引擎。
然而,AI技术不断发展,算力迅猛增长,随着AI的实用性不断增加,用户数量呈指数级增长,伴随而来的是暴涨的电力需求。马斯克警告:目前算力增长已面临瓶颈,变压器将面临短缺,随后是电力,到2025年,我们将没有足够的电力来运行所有的芯片。
前瞻经济学人APP资讯组
更多本行业研究分析详见前瞻产业研究院《全球人工智能芯片(AI芯片)行业市场调研与发展前景研究报告》
同时前瞻产业研究院还提供产业大数据、产业研究报告、产业规划、园区规划、产业招商、产业图谱、智慧招商系统、行业地位证明、IPO咨询/募投可研、IPO工作底稿咨询等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。
更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】,性价比最高功能最全的企业查询平台。
全球超算最新排名!ARM架构处理器雄踞第一,国产太湖之光排第四
近日,在德国法兰克福举行的国际超级计算大会上,2021第57版世界TOP500超级计算机排名正式公布,在Top10排名中,日本理化学研究所和富士通共同推进开发的超级计算机富岳(Fugaku)再次夺冠,第二和第三名均为美国的超级计算机,中国的神威·太湖之光超级计算机位列第4位,天河2A位列第6位。
与2020年11月份发布的第56版相比,Top10排名变化很小,只有一个新入围者,那就是来自美国新能源部劳伦斯伯克利国家实验室的Perlmutter系统。该超级计算机基于HPE Cray“Shasta”平台和由GPU加速器和CPU节点组成的异构系统,实现了64.6 Pflop/s,它在新排名中位列第5。
尽管前十名榜单变化不大,但是从整体排名来看,还是能发现一些重要的趋势。
首先就是采用AMD处理器的超级计算机显著增加,比如刚入选TOP10榜单的Perlmutter就是在用的AMD EPYC 7763处理器,排在第6的Selene也采用了AMD EPYC 7742。
另一个是,近些年来,异构计算在超级计算机中使用越来越多,且大多数采用了NVIDIA的GPU或英特尔基于X86的Xeon Phi作为协处理器。在今年的TOP500中,共有145个系统采用了加速器/协同处理器技术,与第56版的147个相比,有所下降。其中有96个系统使用了NVIDIA Volta芯片,26个使用了NVIDIA Ampere芯片,9个使用了NVIDIA Pascal系统。
英特尔处理器在超级计算机中的份额仍然最高,为86.2%,但低于第56版的91.8%。此外,名单中有49个系统使用了AMD的处理器,高于之前的4.2%。
TOP500排名是针对全球已知最强大的电脑系统做出的排名,该计划始于1993年,并且一年出版两次最新的超级计算机排名表。每年的第一次排名公布于6月份的国际超级计算机会议上,而第二次排名公布则是在11月份的超级计算机会议上。
TOP500的排名表是由德国曼海姆大学的Hans Meuer、美国田纳西大学诺克斯维尔分校的Jack Dongarra以及美国劳伦斯伯克利国家实验室的Erich Strohmaier与Horst Simon等人共同汇编的。
下面我们来看看这些超级计算机:
富岳
富岳(Fugaku)是由日本理化学研究所和富士通共同开发的超级计算机,是“京”的后继机型。它在2014年就开始研发,2021年正式激活。富岳部署在兵库县神户市中央区港湾人工岛上的理化学研究所计算科学研究中心内,其运算能力为京的100至120倍,耗电为30兆瓦至40兆瓦,京的耗电为12.7兆瓦。其实,“富岳”是富士山的别称。
富岳是全球首度夺冠的ARM架构超级电脑,采用富士通48核心A64FX SoC,与过往超级计算机大多采用的Intel或AMD的x86、x64主流平台不同。富岳拥有 7,630,848 个内核,在HPL标准下算力为442Pflop/s,这样的性能表现超过了排名第二的美国Summit超级计算机的3倍。
恐怖的是其峰值性能可达到1 exaFLOPS(1,000 petaFLOPS)。而且它除了在Linpack中拿到好成绩,也在新的HPL-AI基准测试中获得了2 exaFLOPS的好成绩。
2020年6月23日,富岳正式获认证,以415 PFLOPS计算速度成为TOP500排名第一的超级计算机。之后同年11月17日发表的TOP 500排行榜成功蝉联第一。如今又再次夺冠。
Summit超级计算机
Summit超级计算机(中文有翻译顶点,或者高峰),实验室代号“OLCF-4”,是IBM为美国能源部旗下橡树岭国家实验室开发建造的超级计算机。机组于2018年6月8日落成,理论运算能达200 PFLOPS(浮点运算速度每秒20亿亿次),超过峰值运算性能125 PFLOPS的神威·太湖之光,2018年6月25日正式获TOP500认证为全球最快的超级计算机。随后被富岳超越。但仍然是美国最快的超计算机。
Summit在 HPL 基准测试中的性能为 148.8 Pflop/s,在全球排名第二。Summit 有 4,356 个节点,每个节点使用的是与泰坦类似的CPU+GPU异构计算架构,包含两颗Power9 CPU(每颗CPU有 22个内核),以及6块NVIDIA Tesla V100 GPU组成。这些节点通过 Mellanox 双轨 EDR InfiniBand 网络链接在一起。
Sierra超级计算机
Sierra,代号ATS-2,是IBM为美国能源部下属的劳伦斯利佛摩国家实验室建造的超级计算机,由美国国家核安全局管理,也是该局的第二套“先进技术系统”(Advanced Technology System,ATS),本机组与橡树岭国家实验室的高峰使用几乎相同的架构。
Sierra的运算节点采用IBM的Witherspoon S922LC OpenPOWER主机,每台主机中配备IBM POWER9 CPU配以NVIDIA Tesla V100运算加速卡,CPU和加速卡之间使用NVLink连接,每颗CPU配以两块运算加速卡,不过原始计划里是每颗CPU配以三块运算加速卡。节点之间的连接采用EDR InfiniBand。
神威·太湖之光超级计算机
神威·太湖之光超级计算机(Sunway TaihuLight)是由国家并行计算机工程技术研究中心研制、安装在国家超级计算无锡中心的超级计算机,搭载了40960个中国自主研发的“申威26010”众核处理器,该众核处理器采用64位自主申威指令系统,峰值性能为12.54京次/秒,持续性能为9.3京次/秒。(1亿为1亿亿)
神威·太湖之光超级计算机由40个运算机柜和8个网络机柜组成。每个运算机柜比家用的双门冰箱略大,打开柜门,4块由32块运算插件组成的超节点分布其中。每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。每个单个处理器有260个核心,主板为双节点设计,每个CPU固化的板载内存为32GB DDR3-2133。
2020年7月,中国科大在“神威·太湖之光”上首次实现千万核心并行第一性原理计算模拟。
天河二号超级计算机
天河二号(简称:TH-2),是一组由国防科技大学研制的异构超级计算机,为天河一号超级计算机的后继机型。天河二号的组装和测试由国防科技大学和浪潮集团来负责,于2013年底入驻位于广东省广州市的中山大学广州校区东校园内的国家超级计算广州中心并进行验收,2013年底交付使用后对外开放接受运算项目任务,用于实验、科研、教育、工业等领域。
天河二号造价达一亿美元,整个系统占地面积达720平方米。它于2013年6月起至2016年6月之前,为世界上最快的超级计算机。目前,天河二号由国防科技大学和中山大学共同使用和维护。
天河二号的处理器是英特尔的Xeon E5-2692v2 12核心处理器,基于英特尔Ivy Bridge微架构(Ivy Bridge-EX核心),采用22纳米制程,峰值性能0.2112TFLOPS。
运算加速使用基于英特尔集成众核架构的Xeon Phi 31S1P协处理器,运行时钟频率为1.1GHz,拥有57个x86核心(实际上拥有61个核心,因激活全部核心时会存在运算周期协调冲突之问题,因此先遮蔽4个x86核心),每个x86核心借由特殊的超线程技术能运作4个线程,产生峰值性能为1.003TFLOPS。
不过基于美国商务部限制中国超级计算机采购美国器件,我国在2017年开始使用自主研发的Matrix-2000代替Xeon Phi作为协处理器的升级计划。
在TOP500榜单中,尽管其中中国超级计算机的绝对数量还是遥遥领先,但是由上一次的212变为现在186台,相应的,美国则由上一次的113台增至如今的123台。尚不清楚是否是由于芯片供应问题导致的负面效应。
但在综合性能指标上,来自美国的超级计算机仍然处于领先,目前总算力达到了856.8Pflop/s,而中国则为445.3Pflop/s。
相关问答
显卡芯片厂商排名?
显卡芯片排行榜英特尔成立于1968年,并于1971年引入微处理器。在接下来的50年里,它向来处于世界率先地位,涉及微处理器、芯片组、主板、系统和软件,并在2...
最强芯片排行榜?
首位的是美国老牌芯片公司英特尔,它不仅是全球领先的计算机和CPU厂商,还是集芯片设计与制造于一身的巨头。除了英特尔之外,美国上榜的还有5家企业,分别是排...
世界芯片最先进排名?
首位的是美国老牌芯片公司英特尔,它不仅是全球领先的计算机和CPU厂商,还是集芯片设计与制造于一身的巨头。除了英特尔之外,美国上榜的还有5家企业,分别是排...
芯片巨头排行?
芯片是半导体元件产品的统称,是一种非常精细的半导体元件,一般芯片的体积比较小。那么世界十大芯片制造公司排名有哪些呢?下面我们就一起看看世界十大芯片制造...
英特尔最好处理器有哪个型号_其他问答_系统粉
HDFHU这个型号很棒,推荐;Intel目前主流的芯片组是H55、P55\\45/43、G45等,支持ddr2800及ddr3Intel5系列芯片组支持最新的LGA1156处理器以前的芯片组...
数字功放芯片十大排名?
1、韩国NF数字功放芯片系列:毫无疑问,NF功放芯片在国内性价比上和使用上深受大家的好评和喜爱,NF系列集成了多功能数字音频信号处理功能,高性能,高保真全数...
欧洲芯片公司排名?
欧洲芯片如下:NO1.德州仪器(TI):渗透工业+汽车领域目前来看,TI的两大市场工业市场和汽车市场都算是表现相对较弱的市场。不过TI的模拟芯片与英特尔或高通...
intel公司世界排名?
一、英特尔(中国)有限公司英特尔是全球知名的企业,成立于1968年总部位于美国加州在微处理器、芯片组、板卡以及系统及软件方面处于领先地位,主要运营与电脑是...
intel芯片组主板7系列有那些,每个字母开头的分别代表什么。...
X79芯片组仅对应LGA2011平台。Z系列是超频系列,支持对带K的处理器进行不锁倍频的超频,也支持内存超频。支持睿频但锁倍频的处理器(即LGA1155接口的无K的i5和i...
英特尔I5系列处理器哪个最好?
单独比较cpu!i5的6600k性能最好。i56600K处理器默认主频3.5Ghz,拥有6M三级缓存,原生四核四线程,内置HD530核心显卡,作为Intel新一代酷睿处理器,最大的...