一颗小小的芯片,为何会产生那么大的热
滚烫的手机,温度过高而死机的电脑,这些问题时常困扰着广大的使用者们,这背后的原因多半要归咎于芯片过热。实际上芯片的发热问题不仅造成了使用上的不便,也给生产者们带来了巨大的技术成本,并限制了芯片性能的进一步的提升。一颗小小的芯片为何会产生那么大的热量?芯片的性能与发热量有什么关系?工程师和科学家们又是用什么方法来解决这一问题?本文就将为你揭晓以上问题的答案。一,功耗是芯片的梦魇
1965年,英特尔创始人之一的戈登·摩尔提出了经典的摩尔定律, “每18个月性能提升一倍,价格降低一半”,这条金科玉律就像一座路标,指引着行业发展的方向与节奏。随之而来的就是更小的晶体管,频率更高的CPU,集成度更高的数字电路和更低的成本。一代又一代的芯片和电子产品由专用走向普及,并逐渐渗透到了生活和工作的方方面面。也正是如此,人们打开了数字世界的大门,看到了前所未见的光景。但与此同时,芯片性能的跃升也逐渐遇到了瓶颈……以栅极氧化层为例,在采用CMOS数字电路构造的CPU里,它起到关键的绝缘作用。栅极氧化层不仅要保证表面平整,不能有缺陷,为了符合半导体工艺标准,它的厚度也有一个理论的上限值。当制程工艺由90nm向65nm过渡时,虽然芯片的集成度得到了提升,但是想要将小于2nm的这层栅极氧化层的厚度继续降低,却是十分困难。这一技术难题让英特尔这样的芯片巨头也为之头疼。随着芯片的加工工艺精度进入原子级别,任何缺陷都被会被无限放大,比如在内部结构中仅仅缺少一个原子的厚度,就可能引起非常大的漏电流,这样的漏电流不仅白白浪费了电能,更是引起芯片严重发热的原因。以早期的英特尔奔腾四CPU为例,有一半的功耗就是由于漏电被浪费了。如今的CPU的单核速度可达到4GHz,算力的提升也带来了功耗和发热量的水涨船高,这时如果还照方抓药式地采用传统的风扇降温,CPU内部的热量就会迅速攀升甚至将其融化。为了兼顾算力和功耗,工程师则采用了双核芯片及多核的方法,走多核芯片路线以分担单颗CPU的工作负荷间从而降低功耗和发热。除此以外,此后材料的革新,也能够对功耗和散热起到了非常大的优化作用。二,神秘的测试
测试是检验真理的唯一标准。就像学生时代的临考前,老师们千叮咛万嘱咐的一句话:做完题目别着急交卷,先检查检查,在半导体制造过程中更是如此,从芯片的制造到交付出货期间,芯片测试已成为了不可或缺的环节。在所有电子元器件的制造工艺里面,存在着去伪存真的需要,为了实现试验的过程,就需要各种试验设备,这类设备就是所谓的ATE(Automatic Test Equipment)。ATE是一种通过计算机控制,进行芯片、电路板和子系统等测试的设备,通过计算机编程取代人工劳动,自动化地完成测试序列。ATE的应用场合涵盖集成电路整个产业链,主要包括了芯片的设计验证、晶圆制造相关的测试到封装完成后的成品测试。ATE市场的发展可以追溯到1960年代,早期的半导体测试设备发展并不完全是由独立的设备商引导,而是由半导体制造公司主导。仙童半导体(Fairchild)、德州仪器(TI)等制造企业生产ATE都是用于内部使用,而从1980年代起,ATE领域开始进行整合,2011年惠瑞捷(VERIGY)被收购后,形成了以泰瑞达(Teradyne)和爱德万测试的双寡头格局。回顾ATE的发展史,可以说泰瑞达是“第一个吃螃蟹的人”。早在1960年,两位麻省理工高材生在波士顿创立了泰瑞达公司。如今,在波士顿总部的展示区域,依旧陈列着世界上第一台ATE设备D133,它是1961年推出的第一台二极管测试机,标志着自动测试设备迈入全新纪元。Teradyne(泰瑞达)的命名颇有意思,名字中的"Tera"取自10的12次方的前缀,"dyne"是力学的单位。如此命名,也意味着这家公司将是一股不容小觑的巨大力量。从70年代到80年代早期的十年间,集成电路经历了由小规模到中规模再到大规模和超大规模的变迁。这时计算机控制的测试系统成为主要的测试设备。80年代中期,随着门阵列器件的成功开发,对于测试方面要求达到了256管脚,速度高于40MHz。进入到90年代,单片处理器单元(MPU)的问世也带来了高速高管脚数的ATE。随后多媒体器件的出现使ATE变得更加复杂,需要同时具有数字电路、模拟电路和存储器电路的测试能力。近年来,工艺节点不断提升,芯片制程工艺不断逼近物理极限,这些也带来了更高的集成度。随之而来,整个芯片的功耗方案也要作出相对应的改变。当下,先进制程芯片具有非常复杂的供电系统,测试成本不断增加的同时,测试环节对产品良率的监控将会愈发重要,这样的情况下,ATE该如何测试?三,实际测试中的挑战
实际测试中的挑战
应用处理器的测试机里有两个非常重要的单元,其一是数字芯片测试的数字I/O,数字I/O承担了相对复杂的工作,可以抓取失效;另一个就是电源,虽然DC电源看起来比较简单,但在实际的大功率处理器的测试中,电源在起到非常重要的作用,因为它决定了测试质量,最终测试的良率也与电源的实际性能息息相关。展开来看,应对不同的挑战,不同测试环节的测试参数和应用场景稍有区别,就需要采取不同的解决方案。对于复杂的供电问题,利用模块化的供电策略可以降低多相位复杂供电的困扰。通过灵活地分配测试资源,将电源拆解成一个个小的电源模块,任意组合成小的单元模块给不同的电源轨供电,同时还可以利用冗余的电源模块来帮助已经预设好的模块降低供电电源轨的稳压压力。简单举例,一个需要30安培的VDD引脚,如果每个通道支持5安培的输出能力,可以组合6个这样的单元来供电,同时利用冗余的通道组合单元与前面的6个单元组合在一起降低供电压力。此外,还可以利用软件编程的方式设定上电次序、软启动等,以减少外围供电电路。对于大多数应用处理器来说,工作频率与VDD一般呈现正相关性。在前期的设计验证中,厂商会尝试寻找sweet point使得芯片在有限的功耗下表现出更好的性能,在实际的生产测试中,可能会直接地设定一个指定的VDD,看其能否在这个特定的VDD下达到预期的频率。四,不同测试挑战的对症下药
“Millivolts Matter”,每一个毫伏的精度都非常重要。越来越低的核心电压对电源的输出精度,以及动态响应提出了越来越高的要求。泰瑞达一直把电源仪表的输出电压能力作为仪表设计最重要的参数之一,这也是泰瑞达区分于众多ATE厂商的特征之一。在实际测试过程中电源的供电不是完全平坦的,实际的电源功耗与实际工况有很大关系,甚至会导致芯片丢失状态,从而导致器件失效。这样的问题既难预测又很难排查。通过不断改变输出的VDD与Scan Shift频率来查看所有测试向量的输出结果,当VDD越低频率越高时,越容易发生失效。在实际的Shmoo测试案例中,泰瑞达的UltraFLEXplus具有更稳定的供电电源,这意味着可获得更高的边界良率,使得芯片更加贴近于真实的本征。这样一来,在实际产品中,我们对于芯片的实际工况便能够得到一个更加准确的推断,知道哪些情况是可以工作的,哪些情况是不能工作。总的来说,更好更稳定电源不仅能够提升良率,还能够认识芯片在真正工况下的工作状态。总结
半导体测试就是通过测量半导体的输出响应、预期输出、并进行比较以确定或评估集成电路功能和性能的过程,贯穿设计、制造、封装、应用全过程。随着半导体制造工艺要求的提升,测试环节在半导体制造过程中的地位随之不断提升。半导体测试机的技术核心在于功能集成、精度与速度、降低成本与可扩展性。在泰瑞达看来,测试解决方案要有足够好的静态精度及稳压能力,同时在边界情况下获得更好的鲁棒性来帮助降低失效的概率;尽可能简化外围电路的设计,降低运营方面的损失,侧面降低测试成本;最后加入警报机制来提前预判,避免发生异常情况。今天是《半导体行业观察》为您分享的第2790内容,欢迎关注。
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
一文详解芯片发热原理!
集成电路工艺发展至今,高功耗高发热的问题一直如影随形。尤其是在处理器领域,不管桌面和服务器领域的英特尔和AMD,抑或是移动端的高通、联发科甚至是苹果公司,也不管是何种架构、什么工艺,都无法根本解决高功耗和高发热问题。
目前对于高性能服务器集群,放在专用的低温空调房已经是标准配置;就连家用游戏电脑有时都需要采用专门的冷却装置。
但是,芯片的体积如此微小,最小不过指甲盖一般,最大也不会超过手掌心,为什么功耗和发热会这么大呢?
这就要从集成电路的基本构成:二进制 和晶体管 说起。我们知道整个数字世界是由二进制也就是0和1构成的。反映在集成电路上,就是高电压(1)和低电压(0)。而实现这种机制的根本结构,就是晶体管。那么晶体管是如何产生0和1的呢?
如上图所示,晶体管本身就像一个开关,可以通过控制它们的开关来决定输出的电压。上述两种不同的晶体管分别用来产生高电压1和低电压0。
在目前的主流工艺下,晶体管大小仅仅有几十纳米甚至几纳米,那么这么小的东西怎么会有这么大的发热和功耗呢?原因就在于四个字:积少成多 。晶体管的发热,来自于其中通过的电流。我们知道,当电流通过导体或半导体,总是会释放一部分热量,就好像生活中的电暖器一样。
当前高性能芯片,无论是手机处理器还是桌面乃至服务器处理器,其集成的晶体管数量从数亿到数十亿不等。拿英特尔的酷睿处理器来说,高端型号CPU含有晶体管7亿以上,每个只贡献极为微小的功耗和发热,其整体的数值都将是一个恐怖的数字。同时由于CPU频率很高,比如I7睿频能够达到3GHz以上。这就意味着,在性能峰值下,有相当数量的晶体管在每秒内翻转(0->1,1->0)次数高达3.22亿次。每次都伴随着电流消耗和热量的产生。
由于散热速度远远小于其产生速度,于是就形成了如下图所示的局部高温区域(越红温度越高)。需要指出的是,对于大多数芯片,即使是发热高很大程度上也只发生在芯片的局部区域。像高通的某款芯片搞的手机都烫手的情况是比较少见的!
目前对与这种情况并没有什么特别好的方法。虽然业界已经研究低功耗设计多年,但是始终无法满足高端的计算需求。因此在未来相当长一段时间内,高发热现象仍然会伴随着绝大部分高性能计算设备,也就意味着需要花费很大的物力和财力来为这些设备散热。
希望我们有一天终能解决这个问题!
相关问答
芯片发热一般是什么原因?
芯片发热是因为芯片在运行时会产生热量。芯片的计算机门操作会不断产生热量,即使在断电状态下也会如此。当计算机的负载增加时,芯片的温度也会相应升高。此外,...
在电子电路中,有哪些故障原因会引起芯片温度异常,即芯片发烫?
主要原因有:电源电压过高,负载电流太大,输入输出之间产生寄生振荡,运行频率过高等还有输入信号不足使本来工作在开关状态的管子工作在放大区以及器件散热片...
电脑连接电源后主板芯片发热,点不亮,是怎么回事-ZOL问答
一些坏的芯片在通电后发热量往往异常。没办法的,主板维修很麻烦。修出来的也不好的。建议欢快主板吧。可以考虑电源有故障,也有可能内存条插槽有问题,前几天...
在电子电路中,有哪些故障原因会引起芯片温度异常,即芯片发...
还有输出负载增大,也会增加发热.输出短路会迅速升温烧毁芯片.长时间大负荷工作也会发烫甚至烧毁.1、芯片内部有器件短路,导致芯片供电电流增大。2...
在电子电路中,有哪些故障原因会引起芯片温度异常,即芯片发...
1、芯片内部有器件短路,导致芯片供电电流增大。2、芯片外部供电电压升高,导致芯片供电电压电流同时增大。3、散热不好且长时间大负荷工作,导致芯片...
集成芯片工作时过热发烫有什么好的方法吗?
1、芯片内部有器件短路,导致芯片供电电流增大。2、芯片外部供电电压升高,导致芯片供电电压电流同时增大。3、散热不好且长时间大负荷工作,导致芯片发烫...1...
主板的芯片组发热正常吗?
不正常引起主板温度过高的原因有以下几点:1、机箱内及主板灰尘多。2、检查机箱排风通道不流畅以及风扇运转比较慢。3、主板北桥散热器不牢固,...芯片组肯...
手机芯片发热解决方法?
.在手机上玩大型游戏,长时间上网手机会很热,这种情况是正常的,发热的主要原因是处理器高速运转产生热量,该情况关闭游戏过一会,手机恢复正常。2.手机正常待...
主板BIOS芯片发热...............主板点不亮-ZOL问答
5条回答:我很负责的说,这个主板应该是完全兼容E8200的准确来说兼容的CPU类型有:Core2Extreme/Core2Quad/Core2Duo/Celeron我觉得应该还是主板BIOS的问题,建...
骁龙8gen1芯片为什么发热严重?
因为高通8gen1超强的性能和提升的功耗也带来了更严重的发热问题,搭载骁龙8Gen1的motoedgeX30在光明山脉的最高画质下,机身的最高温度甚至超过了61摄氏...