英伟达官宣下一代最强AI芯片!GPU性能8年提高1053倍
在当今计算、网络和图形技术的发展历史上,英伟达有许多独特之处。其中之一就是,它现在手头资金雄厚,而且凭借其架构、工程设计和供应链,在人工智能生成市场上占据了领先地位。因此,英伟达可以随心所欲地规划未来的发展路线图,只要有助于推动技术进步 。
早在2000年代,英伟达就已经是一家非常成功的创新企业,实际上并不需要涉足数据中心计算领域。但是,高性能计算(HPC)研究人员将英伟达拉入了加速计算领域 ,然后人工智能研究人员利用GPU计算优势,创造了一个全新的市场,这个市场已经等待了四十年,等待着以合理的价格将大量计算与海量数据相碰撞,真正实现把类似“思维机器”的东西带进到日常生活中。
致敬Danny Hillis、Marvin Minsky和Sheryl Handler,他们在1980年代创立了Thinking Machines,试图为AI处理提供支持,而不是传统的HPC模拟和建模应用。
同样,Yann LeCun在AT&T贝尔实验室创造卷积神经网络时,既没有数据也没有计算能力来制造我们现在所知的人工智能。
当时,黄仁勋是LSI Logic公司的主管,该公司生产存储芯片,黄仁勋最终成为AMD公司的CPU设计师。20世纪90年代初,就在Thinking Machines正处于艰难时期(最终破产),黄仁勋与Chris Malachowsky和Curtis Priem在圣何塞东边的Denny's餐厅会面,并创立了Nvidia。
Nvidia从超级分频器领域看到了新兴的人工智能机遇 ,并开始构建系统软件和底层大规模并行硬件,以实现人工智能革命的梦想。
这一直是计算的终极状态,也一直是我们所迈向的奇点。
如果其他星球上存在生命,那么生命总会进化到拥有大规模杀伤性武器的地步,总会创造出人工智能。可能也是在同一时间。在那一刻之后,这个世界会如何处理这两种技术,才是决定其能否在大灭绝事件中幸存下来的关键。
这听起来不像是讨论芯片制造商路线图的正常开场白。但事实并非如此,这是因为我们生活在一个充满变革的时代。
在台湾台北举行的年度电脑展(Computex)上 ,Nvidia的联合创始人兼首席执行官黄仁勋在其主题演讲中,再次试图将生成式人工智能革命(他称之为“第二次工业革命”)置于其背景之下,并展示了AI的未来,尤其是英伟达硬件的未来。
由此,我们窥见了GPU和互联技术路线图 。但是据我们所知,这并不是计划的一部分,黄仁勋和他的主题演讲通常都是最后一刻才真正开始。
01.革命不可避免
黄博士提醒我们注意:生成式人工智能的核心在于规模 。同时也指出2022年底ChatGPT时刻的到来既有技术方面的原因,也有经济方面的原因。
要达到ChatGPT的突破性时刻,需要GPU性能的大幅增长,然后再加上大量的GPU。
Nvidia确实实现了性能,这对人工智能的训练和推理都很重要,而且重要的是,它还从根本上减少了生成作为大型语言模型响应一部分的标记所需的能量。我们来看一下:
在八年间,从“Pascal P100 GPU”到“Blackwell B100 GPU”,GPU的性能提高了1053倍 。其中部分性能是通过降低浮点精度实现的,例如从Pascal P100、Volta V100和Ampere A100 GPU的FP16格式到Blackwell B100使用的FP4格式,降低了4倍。
由于在数据格式、软件处理和硬件方面运用了大量的数学魔法,如果不降低精度,性能提升将只有263倍,而降低精度不会对LLM性能造成实质性损害。要知道,在CPU市场上,每时钟核心性能提高10%至15%,核心数量增加25%至30%已属正常。如果升级周期为两年,那么在同样的八年时间里,CPU吞吐量将提高4至5倍。
如上图所示,单位功耗的降低是一个关键指标,因为如果无法为系统供电,就无法使用系统。而token的能耗成本必须降低,这意味着为LLM生成的每个token的能耗必须比性能提升的速度更快 。
在黄仁勋的主题演讲中,为了给大家提供一些更深层次的背景信息,在Pascal P100 GPU上生成一个token所需的17000焦耳热量大约相当于两个灯泡运行两天,而平均每个字需要三个token。
因此,现在我们开始明白为什么八年前的LLM甚至不可能在一定规模上运行,使其在执行任务时表现出色了。下图是在1.8万亿个参数、8万亿个通证数据驱动模型的情况下,训练GPT-4 Mixture of Experts LLM所需的功率:
对于一个P100集群来说,超过1000千兆瓦时的电量实在是太大了。
黄仁勋解释道:有了Blackwell GPU,公司将能够在大约10天内通过大约1万个GPU来训练GPT-4 1.8T MoE模型 。
如果人工智能研究人员和Nvidia没有转向更低精度,那么在这八年时间里,性能提升也不过是250倍。
降低能源成本是一回事,降低系统成本又是另一回事。在传统的摩尔定律末期,晶体管每隔18到24个月就会缩小一次,芯片变得越来越便宜、越来越小,这两种技巧都非常困难。
现在,计算复合体已经达到了微粒极限,每个晶体管都越来越昂贵,因此,由晶体管制成的设备本身也越来越昂贵。HBM内存是成本的重要组成部分,先进的封装也是如此。
黄仁勋本人今年早些时候在接受CNBC采访时就曾说过Blackwell的价格。在SXM系列GPU插座中(不包括PCI-Express版本的GPU),P100推出时的成本约为5000美元;V100约为1万美元;A100约为1.5万美元;H100约为2.5万至3万美元。B100的成本预计在3.5万美元到4万美元之间。
黄仁勋没有说明的是,运行GPT-4 1.8T MoE基准每一代需要多少GPU,以及这些GPU或运行所需的电费是多少。
下图这个电子表格显示,根据黄仁勋所说,大约需要1万个B100,才能在十天左右的时间内训练出GPT-4 1.8T MoE :
在这八年里,GPU的价格上涨了7.5倍,但性能却提高了1000多倍。因此,现在使用Blackwell系统,可以在十天左右的时间内实际训练出像GPT-4这样拥有1.8万亿个参数的大型模型,而在两年前,即使是在Hopper一代刚刚起步的时候,也很难在数月内训练出拥有数千亿个参数的模型。
现在,系统成本将与该系统两年的电费相当。GPU大约占人工智能训练系统成本的一半,因此购买一个1万个GPU的Blackwell系统大约需要8亿美元,而运行十天的电费大约需要54万美元 。
如果购买更少的GPU,就可以减少每天、每周或每月的电费支出,但同时也会相应增加训练时间,使电费支出再次上升。
就是这样,即使Hopper H100 GPU平台是“史上最成功的数据中心处理器”,正如黄仁勋在Computex主题演讲中所说的那样,Nvidia仍需继续努力。
如果将Hopper/Blackwell的投资周期与六十年前IBM System/360的发布相比较,IBM在那次发布中下了至今仍是公司历史上最大的赌注。
1961年,当IBM开始其“下一代产品线”研发项目时,它是一家年收入22亿美元的公司,在整个20世纪60年代,它花费了50多亿美元。
Big Blue是华尔街第一家蓝筹股公司 ,正是因为它花费了两年的收入和二十年的利润来创造System/360。它的某些部分推出较晚,表现不佳,但它彻底改变了企业数据处理的本质。
20世纪60年代末,IBM认为自己可能会创造600亿美元的销售额,但他们创造了1390亿美元的销售额,利润约为520亿美元。
可以说,Nvidia为数据中心计算的第二阶段掀起了更大的浪潮 。
02.抵制是徒劳的
无论是Nvidia还是其竞争对手或客户,都无法抵挡未来的引力,也无法抵挡生成式人工智能对利润和生产力的承诺。
因此,Nvidia必将加快步伐,推陈出新。凭借250亿美元的银行存款和今年预计超过1000亿美元的收入,或许还有500亿美元将进入银行,它有能力推陈出新,把我们所有人都拉进未来。
黄仁勋表示:“在这个令人难以置信的增长时期,我们要确保继续提高性能,继续降低成本,如训练成本、推理成本等,并继续扩展人工智能能力,让每家公司都能拥抱人工智能。我们把性能推得越高,成本下降得就越厉害。”
正如我们上面的表格所清楚显示的那样,事实的确如此。这就引出了最新的Nvidia平台路线图 :
在Hopper这一代中,最初的H100于2022年推出,配备了六层HBM3内存堆栈,通过带有900 GB/s端口的NVSwitch连接,并配有400 Gb/s端口的Quantum X400(以前称为Quantum-2)InfiniBand交换机以及ConnectX-7网络接口卡。
2023年,H200升级到六层更高容量和带宽更高的HBM3E内存,从而提升了H200封装中底层H100 GPU的有效性能。BlueField 3网卡也问世了,它为网卡增加了Arm内核,使其可以进行辅助工作。
在2024年,Blackwell GPU当然已经推出了8堆HBM3e内存,并与配备1.8TB/sec端口的NVSwitch 5和800Gb/sec的ConnectX-8网卡,以及配备800GB/sec端口的Spectrum-X800和Quantum-X800交换机搭配使用。
现在我们可以看到,在2025年,B200(上图中称为Blackwell Ultra)将拥有8个堆栈的HBM3e内存 ,这些堆栈有12个芯片高。
据推测,B100中的堆栈有8层高,因此Blackwell Ultra的HBM内存容量至少增加了50%,根据所使用的DRAM容量,增幅可能更大,HBM3E显存的时钟速度也可能更高。
Nvidia对Blackwell系列的内存容量含糊其辞,但我们在3月份的Blackwell发布会上估计,B100将拥有192GB内存和8TB/秒的带宽。
对于未来的Blackwell Ultra,我们预计会有更快的内存出现,如果出现带宽为9.6TB/秒的288GB内存,我们也不会感到惊讶。
我们认为,Ultra变体在SM上的良品率有可能会有所提高,从而使其性能略高于非Ultra前代产品。这将取决于产量。
Nvidia还将在2025年推出弧度更高的Spectrum-X800以太网交换机 ,可能会在盒子里装上六个ASIC,以创建一个非阻塞架构,就像其他交换机常用的那样,将总带宽翻倍,从而将每个端口的带宽或交换机中端口的数量翻倍。
在2026年,我们看到了“Rubin R100 GPU”,在去年发布的Nvidia路线图中,它的前身是X100,正如我们当时所说,我们认为X是一个变量,而不是任何东西的简称。
事实证明确实如此,Rubin GPU将使用HBM4内存,并将有8个堆栈,每个堆栈可能有十几个DRAM高,而2027年的Rubin Ultra GPU将有十几个HBM4内存堆栈 ,也可能有更高的堆栈(虽然路线图没有这么说)。
我们直到2026年才会看到Nvidia推出新的Arm服务器CPU“Vera”,它是当前“Grace”CPU的继任者。与之配套的是NVSwitch 6芯片,具有3.6 TB/s的端口,以及带有1.6 Tb/s端口的ConnectX-9网络接口卡。
有趣的是,还有一款名为X1600 IB/Ethernet Switch的产品,这可能意味着Nvidia正在融合其InfiniBand和以太网ASIC ,就像十年前Mellanox所做的那样。或者,这可能意味着Nvidia只是为了好玩而试图让我们产生怀疑。
2027年的路线图中还透露了一些其他信息,这可能意味着对网卡和交换机的全面超以太网联盟支持,甚至可能是用于将节点内和跨机架的GPU连接在一起的UALink交换机。
原文来源于:
https://www.nextplatform.com/2024/06/02/nvidia-unfolds-gpu-interconnect-roadmaps-out-to-2027/
中文内容由元宇宙之心(MetaverseHub)团队编译,如需转载请联系我们。
半导体行业专题报告:化学机械抛光CMP深度研究
获取报告请登录未来智库www.vzkoo.com。
CMP 材料
CMP 材料概况
化学机械抛光(chemical mechanical polishing, CMP)是集成电路制造过程中实现晶圆表面平坦化的关键技术。与传统的纯机械或纯化学的抛光方法不同,CMP 工艺是通过表面化学作用和机械研磨的技术结合来实现晶元表面微米/纳米级不同材料的去除,从而达到晶圆表面的高度(纳米级)平坦化效应,使下一步的光刻工艺得以进行。CMP 技术结合了机械抛光和化学抛光,相对于其他平坦化技术而言有着极大的优势,它不但能够对硅片表面进行局部处理,同时也可以对整个硅片表面进行平坦化处理, 是目前唯一 能兼顾表面全局和局部平坦化的技术。
自从 1988 年 IBM 公司将化学机械抛光技术(CMP)应用于 4M DRAM 芯片的制造,集成电路制造工艺就逐渐对 CMP 技术产生了越来越强烈的依赖,主要是由于器件特征尺寸(CD)微细化,以及技术升级引入的多层布线和一些新型材料的出现。特别是进入 0.25 μm 节点后的 Al 布线和进入 0.13μm 节点后的 Cu 布线,CMP 技术的重要性更显突出。进入 90~65nm 节点后,铜互连技术和低 k 介质的采用,CMP 的研磨对象主要是铜互连层、绝缘膜和浅沟槽隔离(STI)。从 45 nm 开始,逻辑器件的晶体管中引入高 k 金属栅结构(HKMG),因而同时引入了两个关键的平坦化应用,虚拟栅开口 CMP 工艺和替代金属栅 CMP 工艺。到了 32nm 和 22nm 节点,铜互连低 k 介质集成的 CMP 工艺技术支持 32nm 和 22nm 器件的量产。在 22nm 开始出现的 FinFET 晶体管添加了虚拟栅平坦化工艺,这是实现后续 3D 结构刻蚀的关键技术。先进的 DRAM 存储器件在凹槽刻蚀形成埋栅结构前采用了栅金属平坦化工艺。引入高迁层间移率沟道材料(如用于 nFET 的 III-V材料和用于 pFET 的锗)后,需要结合大马士革类型的工艺,背面抛光这些新材料。另外,CMP 也在 PCRAM 技术中担当起了 GST CMP 的重任。总之,诸如此类层出不穷,CMP 在纳米集成电路制造中的作用至关重要。
CMP 工艺应用广泛
CMP 主要用于浅槽隔离(STI)抛光、铜的研磨与抛光、高 k 金属栅的抛光、FinFET 晶体管的虚拟栅 CMP、GST 的 CMP、埋入字线 DRAM 存储器的栅 CMP、高迁移 率沟道材料未来的 CMP 等工艺。未来,伴随着半导体制造工艺日益复杂,CMP 的用 处更加广泛。
浅槽隔离(STI)抛光是较早被采用的 CMP 工艺,也是 CMP 在芯片制造中最基本的 应用。 纳米集成电路芯片制程中,STI CMP 工艺要求磨掉氮化硅(Si3N4)层上的氧化硅 (SiO2),同时又要尽可能地减少沟槽中氧化硅的凹陷。进入 45nm 及以下节点后,为了 填充越来越窄小的沟槽,LPCVD 被采用,其形成的氧化硅薄膜具有更厚的覆盖层,这 无疑加大了 CMP 的研磨量。随着 CMP 研磨液的发展,一种高选择比(大于 30)的研磨 液采用氧化铈(CeO2)作为研磨颗粒。这样,以氮化硅(Si3N4)为抛光终止层的直接抛光 (Direct STI CMP)成为现实。直至今日,采用氧化铈研磨液的抛光工艺依然是 STI CMP 的主流方法。
Cu CMP 工艺产生于 21 世纪初 130nm 节点及其之后,一直沿用到纳米集成电路 28~22 nm 节点。 当前的 Cu CMP 工艺通常分为三步:首先用铜研磨液(Slurry)来磨 去晶圆上铜布线层表面的大部分多余的铜料;第二步,继续用铜研磨液低速精磨与阻挡层接触的铜,同时通过终点检测技术控制研磨终止于阻挡层上;第三步,则用阻挡层研磨液磨除阻挡层及少量的介质氧化物,并进行 CMP 后去离子水清洗。
在 32 nm 及以下节点工艺中,高 k 金属栅的“栅后方法”是形成高 k 金属栅 的主流方法之一,其中 CMP 担当着富有挑战性角色。 “栅后方法”工艺流程中的 CMP, 第一次是 ILD CMP,用以研磨开多晶门;第二次是 Al CMP,用以抛光铝金属。多晶 门的制程涉及材料种类较多,同时要研磨氧化硅、氮化硅及多晶硅。具体来讲:第一步 采用硅胶研磨液,其中的氧化硅颗粒去除大部分 SiO2 层,留下 100-200 nm 的氧化硅 层在多晶硅门上;第二步,采用氧化铈研磨液或固定研磨液,类似于 STI CMP,研磨 抛光终止在 Si3N4 层上;第三步,采用硅胶研磨液,去除 Si3N4,研磨抛光终止在多 晶硅门上,这就是最富于挑战性的一步。
从平面 CMOS 晶体管设计转变为 FinFET 晶体管,在虚拟栅多晶硅薄膜中产生 了新的 CMP 工艺。 平面晶体管中,淀积的多晶硅薄膜有平坦的表面形貌,不需要 CMP, 但在 FinFET 设计中,同样的淀积薄膜的表面形貌不平整,必须在栅刻蚀前平坦化。 这种不平整形貌是因前面形成硅鳍的工艺引起的。此时,STI 氧化物薄膜的凹槽给随后 的多晶硅薄膜淀积创建了底层形貌。CMP 应用的主要价值在于产生满足光刻成像焦深 和分辨率的平坦基准平面,能实现极其重要的光刻曝光和栅堆叠刻蚀。由于其在晶体管栅上停止,控制了栅的高度。过抛光会使栅太短,欠抛光则会使栅太高,这会影响字线的电流携带能力。因此,无论是晶圆中还是晶圆与晶圆间,抛光后的栅高度必须严格控 制在小于 5nm 内。
半导体制造工艺推动 CMP 行业发展
化学机械抛光材料种类繁杂。集成电路工艺的进化带来了对抛光材料的各种新需求, 逻辑芯片随着制程增加,抛光材料种类和用量也迅速增长,比如 14 纳米以下逻辑芯片 工艺要求的关键 CMP 工艺将达到 20 步以上,使用的抛光液将从 90 纳米的五六种抛光 液增加到二十种以上;7 纳米及以下逻辑芯片工艺中 CMP 抛光步骤甚至可能达到 30 步,使用的抛光液种类接近三十种。而存储芯片由 2D NAND 向 3D NAND 技术变革, 也会使 CMP 抛光步骤数近乎翻倍。
CMP 市场持续发展
全球半导体市场规模近年来增速平稳,2012-2018 年复合增速 8.23%。其中,中 国大陆集成电路销售规模从 2158 亿元迅速增长到 2018 年的 6531 亿元,复合增速为 20.27%,远超全球其他地区,全球半导体产业加速向大陆转移。集成电路一般分为设 计、制造和封测三个子行业,在制造和封测行业中,均需要大量的半导体新材料支持。
2018 年全球半导体材料市场产值为 519.4 亿美元,同比增长 10.68%。其中晶圆 制造材料和封装材料分别为322亿美元和197.4亿美元,同比+15.83%和+3.30%。2018 年,在市场产值为 322 亿美金的半导体制造材料中,大硅片、特种气体、光掩模、CMP 材料、光刻胶、光刻胶配套、湿化学品、靶材分别占比 33%、14%、13%、7%、6%、 7%、4%、3%。分地区来看,目前大陆半导体材料市场规模 83 亿美元,全球占比 16%, 仅次于中国台湾和韩国,为全球第三大半导体材料区域。
随着半导体市场不断放量以及工艺制程不断复杂,全球 CMP 抛光材料市场不断增长,CMP 材料在半导体制造材料中占比 7%。2018 年全球 CMP 抛光材料市场规模达到 21.7亿美元,近几年持续增长。受益于国内半导体行业的大发展,国内半导体用 CMP 材料市场增速较快,2018 年国内的市场规模 29 亿元,未来有望持续高增长。
CMP 市场分类
CMP 工艺过程中所采用的设备及消耗品包括:抛光机、抛光液、抛光垫、后 CMP 清洗设备、抛光终点检测及工艺控制设备、废物处理和检测设备等。其中 CMP 材料主要包括抛光液、抛光垫、调节器、CMP 清洗以及其他等耗材。其中抛光液和抛光垫占 CMP 材料细分市场的 80%以上,是 CMP 工艺的核心材料。
CMP 抛光液
CMP 抛光液需求不断增长
抛光液是 CMP 技术中的决定性因素之一,其性能直接影响被加工工件表面的质量以及抛光加工的效率。抛光液对抛光过程所产生的影响体现在物理作用与化学作用两个方面。在物理作用方面,抛光液中的磨料对工件表面材料进行机械去除、抛光液对抛光区域进行润滑以减小摩擦、抛光液能够吸收加工过程所产生的热量,使加工区域恒温,另外,流畅的抛光液流动能够有效带走抛光过程所产生的材料碎屑,防止划伤工件表面;在化学作用方面,常使用能够对被抛光材料进行微量化学反应的化学物质作为抛光液组分,对抛光工件表层材料进行软化和腐蚀,从而辅助机械材料去除过程。针对不同被加工材料以及所选用的抛光垫材质,针对性地选用含有不同化学成分的抛光液或具有不同组分含量的抛光液以达到加工质量与效率的平衡。
在 CMP 抛光液中,一般使用水基抛光液作为加工介质,以去离子水作为溶剂,加入磨料(如 SiO2、ZrO2 纳米粒子等)、分散剂、pH 调节剂以及氧化剂等组分,每个组分都具有相应的功能,对化学机械抛光过程起到不同的作用。磨料通过抛光液输送到抛光垫表面后,在抛光垫和被加工表面之间同时受到压力作用以及相对运动的带动,通过对被加工表面形成极细微的切削、划擦以及滚压作用,对表面材料进行微量去除。磨料的形状、硬度、颗粒大小对化学机械抛光都具有重要的影响。分散剂是一种兼具亲水性与亲油性的界面活性剂,能够均匀分散一些不溶于液体的固体颗粒,对于抛光液而言,分散剂能够减少抛光液中磨料颗粒的团聚,提高抛光液中磨料的分散稳定性。抛光液中经常被添加入一些化学试剂用以调节其 pH 值,从而为抛光过程的化学反应提供一定的酸碱性环境,确保化学反应能顺利、高效地进行。在抛光过程中,为了能够较快的在抛光表面形成一层结合力较弱的氧化膜,以利于后续的机械去除,通常会在抛光液中添加氧化剂。在氧化剂的氧化腐蚀作用下,晶片表面产生的氧化膜被磨料的机械作用去除,从而使被加工的表面逐渐达到高质量的全局平坦化效果。
抛光液一般分为二氧化硅抛光液、钨抛光液、铝抛光液和铜抛光液。其中铜抛光液主要应用于 130nm 及以下技术节点逻辑芯片的制造工艺,而钨抛光液则大量应用于存储芯片制造工艺,在逻辑芯片中用量较少。以铜抛光液为例,其主要由腐蚀剂、成膜剂和纳米磨料组成。腐蚀剂用来腐蚀溶解铜表面,成膜剂用于形成铜表面的钝化膜,钝化膜的形成可以保护腐蚀剂的进一步腐蚀,并可有效地降低金属表面硬度。其中的纳米磨料通常是氧化铝(Al2O3)或氧化硅(SiO2),氧化剂是双氧水(H2O2),同时含有抗腐蚀抑制剂及其它添加剂。磨料的作用则是磨除凸处表面的钝化膜而露出铜层,使腐蚀剂能继续溶解,而凹处则被钝化膜保护而不被溶解。通过研磨液反复地溶解、钝化、磨除的过程实现铜的全局平坦化。
伴随着下游半导体行业的发展,2016 - 2018 年,全球化学机械抛光液市场规模分别为 11.0 亿美元、12.0 亿美元和 12.7 亿美元。
CMP 抛光液竞争格局
长期以来,全球化学机械抛光液市场主要被美国和日本企业所垄断,包括美国的Cabot、Versum、Dow 和日本的 Hitachi、Fujimi。其中,Cabot 全球抛光液市场占有率最高,但是已经从 2000 年的约 80% 下降至 2018 年约 36%,表明未来全球抛光液市场朝向多元化发展,地区本土化自给率提升。安集科技成功打破国外厂商垄断,实现进口替代,使中国在该领域拥有了自主供应能力。
CMP 抛光垫
CMP 抛光垫概况
在化学机械抛光过程中,抛光垫具有储存和运输抛光液、去除加工残余物质、传递机械载荷及维持抛光环境等功能。抛光垫性能受其材料特性、表面组织、表面沟槽形状及工作温度等因素影响。这些影响因素中,抛光垫的表面沟槽形状及寸是抛光垫性能的关键参数之一,它直接影响到抛光区域抛光液的分布和运动,影响抛光区域的温度分布。因此,抛光垫的表面沟槽形状及尺寸影响化学反应速率和机械去除作用,从而影响到化学机械抛光的抛光质量和抛光效率。
抛光垫一般都是高分子材料,如合成革拋光垫、聚氨醋抛光垫、金丝绒抛光垫等,其表面一般含有大小不一的孔状结构,有利于抛光浆料的存储与流动。拋光垫的硬度、密度、材质、弹性模量等对抛光质量影响较大。抛光垫亦是一种耗材需适时更换,长时间不更换的抛光垫,被抛光去除的材料残余物易存留在其中会对工件表面造成划痕;同时抛光后的抛光垫若不及时清洗,风干后粘结在抛光垫内的固体会对下一次抛光质量产生影响。
CMP 研发以美日为主
全球来看,CMP 专利,日本拥有专利族 1053 个,美国拥有 711 个,韩国拥有 376个,由 WIPO(世界知识产权组织)经 PCT(专利合作条约)进行登记的有 339 个,中国内地拥有 244 个,中国台湾拥有 149 个。以上 6 个地区的专利族数量占全球的 98.42%,而在剩余的 1.58%中,德国和欧洲各拥有 14 个专利族,印度拥有 5 个,马来西亚和新加坡各拥有 3 个,法国和英国各拥有 2 个,荷兰、加拿大、泰国各拥有 1 个。
全球首个抛光垫专利由美国国家半导体公司于 1992 年在欧洲申请,此后申请数量逐年递增,2004 年至 2009 年的申请数量始终处于高位,2010 年后数量有所下降,但总体变化平稳,显示出抛光垫领域仍然是各个公司的必争之地。中国内地的专利族首次在 1999 年公开,当年有 3 个,随后呈现出波浪式上升的趋势,2014 年达到历史最高的 36个。总体看来,中国内地在高分子抛光垫领域的起步较晚,专利数量不多,但近几年有逐渐爆发的趋势。
目前,全球 CMP 专业主要企业包括罗门哈斯(陶氏)、东洋橡胶工业株式会社、东丽工业株式会社、应用材料公司、三星电子、JSR、中芯国际、富士纺控股株式会等企业。其中,罗门哈斯为全球龙头,核心专利内容涉及面广,不同的应用场景均有专利申请,包括了抛光垫的总体设计,沟槽的设计,抛光垫的制作, 抛光垫使用寿命的提高,终点的检测方法, 抛光层与基材层的粘贴等,不仅数量多,且核心专利授权次数多,引用和被引频次高,专利家族公开号多,多国授权数多,多专利保护到位。东丽工业株式会社的核心专利领域主要集中在设计和制作抛光垫的方法,公开地区绝大部分是日本,核心专利的特点是数量多,授权次数多,被引频次高,公开号多。中国内地抛光垫专利领域主要集中在设计和使用方法,公开地区绝大部分是中国,授权的专利占比低,授权等级为 C,授权地区集中在中国,授权专利家族号较少,一般都为单一授权。
CMP 抛光垫竞争格局
伴随着下游半导体行业的发展,2016 - 2018 年,全球化学机械抛光垫市场规模分 别为 6.5 亿美元、7.0 亿美元和 7.4 亿美元。
目前全球生产芯片抛光垫的企业主要是陶氏,其垄断了集成电路芯片和蓝宝石两个领域所需要的抛光垫 90%的市场份额。此外,3M、卡博特、日本东丽、台湾三方化学等也可生产部分芯片用抛光垫。
相关上市公司
安集科技:国内 CMP 抛光液龙头
国内 CMP 抛光液龙头,打破进口垄断。公司产品包括不同系列的化学机械抛光液 和光刻胶去除剂,主要应用于集成电路制造和先进封装领域。公司打破了国外厂商对集成电路领域化学机械抛光液的垄断,实现了进口替代,在半导体材料行业取得了一定的市场份额和品牌知名度。公司拥有一系列自主知识产权的核心技术,涵盖了整个产品配 方及工艺流程,并积累了众多优质客户资源,包括中芯国际、台积电、长江存储等。 化学机械抛光液与光刻胶去除剂专业供应商,国产半导体材料稀缺标的。公司从事
化学机械抛光液和光刻胶去除剂的研发于生产,应用于集成电路制造和先进封装领域。 化学机械抛光液是公司的核心业务,占比 80%左右,目前在 130-14nm 技术节点实现 规模化销售,10-7nm 技术节点产品正在研发中。公司体量与技术均是国内佼佼者。
受益于进口替代与产业转移,公司成长潜力巨大。目前半导体材料市场被欧美巨头把持,公司作为行业破局者仍较为弱小,但是潜力巨大。全球半导体材料全球市场规模 约 519 亿美元;公司所处的 CMP 抛光材料市场约 21.7 亿美元,公司收入体量仅 2.55 亿人民币,仍有非常大的成长空间。
未来看点在于品类的扩张与客户的开拓。品类的扩张包括:铜及铜阻挡层化学机械 抛光液满足 28nm 以下技术节点逻辑芯片的要求;金属钨化学机械抛光液能够满足 3D NAND 和 DRAM 存储芯片的要求。客户开拓除了在现有客户供应份额的提升,也包括 新客户的拓展。
公司业绩有望迎来爆发。2020 年第一季度,受益于下游客户持续放,公司实现营 收 0.96 亿元,同比+64%。归母净利润 2356 万元,同比+426%。
鼎龙股份:持续发力 CMP 抛光垫
CMP 抛光垫有望迎来放量。 公司 2013 年立项 CMP 抛光垫,并被纳入了“02”专 项,负责中芯国际子课题‘20-14nm 技术节点 CMP 抛光片产品研发’任务。2019 年 上半年,应用于成熟制程领域的 DH3000/DH3002/DH3010 系列产品在持续开拓市场; 应用于先进制程领域的 DH3201/DH3410 系列产品已成功投产,且已顺利初步通过客 户的离线马拉松测试,上半年已取得十二寸客户的第一张订单,未来有望迎来放量。
持续发力柔性显示基材 PI 浆料。 公司主打黄色耐高温 PI,结合在客户端测试验证 的反馈,持续深入提高技术水平和自主研发能力,公司引入涂覆烘烤线,建立并完善了 一系列针对 PI 浆料性能的检测方法,年产 1000 吨生产研发楼目前已经完成水电施工, 目前正在进行无尘车间的装修,以及自动化设备的调试及安装,预期在 2019 年年底量 产。同时,柔显科技产品先后在国内知名面板厂商 G4.5 以及 G6 线开始并部分完成全 流程验证,建立了与客户端的紧密联系,加强柔显科技的品牌影响力和产品认知度,进 一步明确了客户端的迫切需求。
全产业链布局打印耗材。 公司业印耗材业务涉及碳粉、硒鼓、芯片、墨盒,已形成 全产业链闭环布局,近年来公司持续整合并购巩固耗材领先地位。
……
(报告观点属于原作者,仅供参考。报告来源:中泰证券)
获取报告请登录未来智库www.vzkoo.com。
立即登录请点击: 「链接」
相关问答
主板显示电量的原理?
原理:高级的锂电池一般都有一个电池控制芯片,比如线性锂电池芯片SL1053。这是控制电池充放电,电池过载保护,以及分析电压数据估计电量温度的。相当于一个高...
电池电量测量原理?
高级的锂电池一般都有一个电池控制芯片,比如线性锂电池芯片SL1053。这是控制电池充放电,电池过载保护,以及分析电压数据估计电量温度的。相当于一个高级保险...
苹果手机电池不显示百分比-ZOL问答
电池电量显示的原理是基于高级锂电池内置的电池控制芯片,例如线性锂电池芯片SL1053。这个芯片用于控制充放电、过载保护以及分析电压数据以估算剩余电量和温度...
1053S硒鼓怎么加粉,怎么拆开呀,谢谢?
这个鼓没有螺丝,加粉有点难度,另外,加粉后要换芯片,芯片很贵。这个鼓没有螺丝,加粉有点难度,另外,加粉后要换芯片,芯片很贵。
华为frddloo是什么手机?
荣耀8移动联通版(FRD-DL00)。荣耀8挺不错的,可以到体验店体验或者到官网查询参数信息:1.屏幕:荣耀8是5.2英寸JDI等高清显示屏,还有护眼模式,更好保护双眼...
手机怎么安装gps芯片?是否有gps卡槽?-ZOL问答
可以考虑外置蓝牙gps,那个芯片N多脚都是直接焊线路板上的,怎么可能做出插槽啊有,我不开蜂窝用凯立德能导航,而且蛮准的你再找一个SIM卡,按照后面的图案对照一...
华为荣耀honor8多少钱?
华为商城荣耀84GB+64GB全网通版售价是1699元。荣耀8挺不错的,可以到体验店体验或者到官网查询参数信息:1.屏幕:荣耀8是5.2英寸JDI等高清显示屏,还有护眼模...
华为荣耀8lite怎么样?
荣耀8挺不错的,参数信息如下:1.屏幕:荣耀8是5.2英寸JDI等高清显示屏,还有护眼模式,更好保护双眼健康,拥有双面2.5D玻璃,外观非常时尚,手感也很好。2....2...
三星4623加粉后显示请更换墨粉盒怎么办-汇财吧专业问答test
[回答]三星SCX-4623FH打印机属于多功能一体机。他提示要更换墨盒,若你换了,同时需要换芯片,一般新绩阀贯合卟骨诡摊韩揩的墨盒上都有,若是加的碳粉,就要同...
华为荣耀8怎么样?-荣耀-ZOL问答
后置双1200万像素彩色+黑白镜头,双ISP多重对焦方案,拍照亦清晰,支持大光圈模式、3D动态全景照片。前置800万像素镜头,可通过魅我功能,定制...前置8...