年底量产!长江存储128层QLC闪存发布:16Gbps,单颗容量133Tb
2020年4月13日,长江存储科技有限责任公司(以下简称“长江存储”)宣布其128层QLC 3D NAND 闪存(型号:X2-6070)研发成功,并已在多家控制器厂商SSD等终端存储产品上通过验证。
长江存储X2-6070 128L QLC 1.33Tb 3D NAND
据介绍,长江存储X2-6070是业内首款128层QLC规格的3D NAND闪存,拥有业内已知型号产品中最高单位面积存储密度,最高I/O传输速度和最高单颗NAND 闪存芯片容量。此次同时发布的还有128层512Gb TLC(3 bit/cell)规格闪存芯片(型号:X2-9060),单颗容量512Gb(64GB),以满足不同应用场景的需求。
长江存储市场与销售高级副总裁龚翊(Grace)表示:“作为闪存行业的新人,长江存储用短短3年时间实现了从32层到64层再到128层的跨越。这既是数千长存人汗水的凝聚,也是全球产业链上下游通力协作的成果。随着Xtacking® 2.0时代的到来,长江存储有决心,有实力,有能力开创一个崭新的商业生态,让我们的合作伙伴可以充分发挥他们自身优势,达到互利共赢。”
Xtacking 2.0加持,性能再度提升
作为存储行业的新入局者,早在2018年,长江存储就推出了自研的Xtacking技术,不仅提高了I/O接口速度,而且还保证了3D NAND多层堆叠可达到更高容量以及减少上市周期。
据介绍,Xtacking是可以在一片晶圆上独立加工负责数据I/O及记忆单元操作的外围电路。存储单元同样也将在另一片晶圆上被独立加工。当两片晶圆各自完工后,Xtacking技术只需一个处理步骤就可通过数百万根金属VIA(Vertical Interconnect Accesses,垂直互联通道)将二者键合接通电路,而且只增加了有限的成本。
在I/O速度方面,目前NAND闪存主要有两种I/O接口标准,分别是Intel/索尼/SK海力士/群联/西数/美光主推的ONFi,目前ONFi 4.1标准的I/O接口速度最大为1.2Gbps。第二种标准是三星/东芝主推的ToggleDDR,I/O速度最高1.4Gbps。不过,大多数NAND厂商只能提供1.0 Gbps或更低的I/O速度。而长江存储的Xtacking技术可以将I/O接口的速度大幅提升到3Gbps,实现与DRAM DDR4的I/O速度相当。
另外,Xtacking技术还可使得产品开发时间缩短三个月,生产周期可缩短20%,从而大幅缩短3D NAND产品的从开发到上市周期。
得益于Xtacking架构对3D NAND控制电路和存储单元的优化,长江存储64层TLC产品在存储密度、I/O性能及可靠性上都有不俗表现,去年上市之后广受好评。
而在长江存储此次发布的128层系列产品中,已全面升级到Xtacking 2.0,进一步提升NAND吞吐速率、提升系统级存储的综合性能,进一步释放3D NAND闪存潜能。
首先,在I/O读写性能方面,此次发布的X2-6070及X2-9060均可在1.2V Vccq电压下实现1.6Gbps(Gigabits/s 千兆位/秒)的数据传输速率,为当前业界最高。
其次,在单die容量方面,3D QLC单颗容量高达1.33Tb,是上一代64层的5.33倍。
另外,由于外围电路和存储单元分别采用独立的制造工艺,CMOS电路可选用更先进的制程,同时在芯片面积没有增加的前提下Xtacking 2.0还为3D NAND带来更佳的扩展性。
长江存储表示,通过对技术创新的持续投入,已成功研发128层两款产品,并确立了在存储行业的技术创新领导力。凭借1.6Gb/s高速读写性能和1.33Tb高容量,长江存储通过X2-6070再次向业界证明了Xtacking®架构的前瞻性和成熟度,为今后3D NAND行业发展探索出一条切实可行的路径。未来,长江存储将与合作伙伴携手,构建定制化NAND商业生态,共同推动产业繁荣发展。
龚翊(Grace)强调:“我们相信,长江存储128层系列产品将会为合作伙伴带来更大的价值,具有广阔的市场应用前景。其中,128层QLC 版本将率先应用于消费级SSD,并逐步进入企业级服务器、数据中心等领域,以满足未来5G、AI时代多元化数据存储需求。
最快今年年底量产
今年1月16日,长江存储召开市场合作伙伴年会,在会上,长江存储就曾宣布将跳过96层堆叠闪存技术,直接投入128层闪存的研发和量产工作。随后在上周,长江存储CEO杨士宁在接受采访时最新表示,受新冠疫情影响,128层闪存的研发进度在短期确实会有所波及,但长江存储已实现全员复工,各项进度正在抓紧追赶,从中长期来看,这次疫情并不会影响总体进度。杨士宁还特别强调,128层闪存技术会按计划在2020年推出。也就是说此次发布的的128层QLC 3D NAND有望年底量产。
龚翊今天在接受媒体采访时也表示:“长江存储128层产品的量产时间大约是在今年年底到明年上半年,公司会根据量产进程的展开逐步提升良率。”
虽然在最初32层3D NAND量产时,长江存储的产品与国际大厂相比落后了4-5年,但是随着去年64层3D NAND的量产,差距已经进一步缩小到了2年左右,并且得益于自研的Xtacking技术,使得长江存储的64层产品的密度进一步提升,接近于国际厂商96层产品的水平。而现在,由于直接跳过了96层,这也使得长江存储的128层产品已经与国际厂商开始处于同一水平线上。并且,这次全球首发的128层QLC 3D NAND产品,还领先于业界主要对手。
”长江存储联席首席技术官汤强也表示:“我们在短期内就能把128层的TLC和QLC验证成功,证明我们和合作伙伴已经具备国际领先的研发实力。”
资料显示,三星于2019年6月推出128层TLC 3D NAND,存储容量256Gb,8月实现量产,11月将存储容量提高到单颗芯片512Gb水平。SK海力士2019年6月发布128层TLC 3D NAND,预计2020年进入投产阶段。美光2019年10月宣布128层3D NAND流片出样。铠侠今年1月31日发布112层TLC 3D NAND,量产时间预计将在2020 年下半年。可以看出,国际存储厂商发布与量产128层3D NAND量产的时间基本落在2019-2020年。但是在QLC、I/O速度等方面,长江存储确实走在了国际厂商的前面。
QLC将成赢利点
QLC是继TLC(3 bit/cell)后3D NAND新的技术形态,具有大容量、高密度等特点,适合于读取密集型应用。每颗X2-6070 QLC闪存芯片拥有128层三维堆栈,共有超过3,665亿个有效的电荷俘获型(Charge-Trap)存储单元 ,每个存储单元可存储4字位(bit)的数据,共提供1.33Tb的存储容量。如果将记录数据的0或1比喻成数字世界的小“人”,一颗长江存储128层QLC芯片相当于提供3,665亿个房间,每个房间住4“人”,共可容纳约14,660亿“人”居住,是上一代64层单颗芯片容量的5.33倍。
虽然,QLC在写入性能和擦写次数方面与TLC相比确实有一定差距。但是可以通过技术手段在一定程度上进行弥补和优化,同时,QLC所带来的存储密度和成本优势更加的突出的。
据长江存储介绍,其对QLC的性能上进行了改善,特别是在读取能力方面,读取速度更快,延迟时间更短。目前的在线应用如在线会议、在线视频、在线教育等,更多表现为对存储器读取能力的需求上,一次性写入之后更多是从数据库进行数据的读取,而非频繁写入。因此,在这方面QLC存储器是有其应用优势的。此外,在成本方面,QLC产品会与同世代TLC也会进一步拉开距离,价格优势将会表现出来。
闪存和SSD领域知名市场研究公司Forward Insights创始人兼首席分析师Gregory Wong认为:“QLC降低了NAND闪存单位字节(Byte)的成本,更适合作为大容量存储介质。随着主流消费类SSD容量迈入512GB及以上,QLC SSD未来市场增量将非常可观。”Gregory同时表示:“与传统HDD相比,QLC SSD更具性能优势。在企业级领域, QLC SSD将为服务器和数据中心带来更低的读延迟,使其更适用于AI计算,机器学习,实时分析和大数据中的读取密集型应用。在消费类领域,QLC将率先在大容量U盘,闪存卡和SSD中普及。”
龚翊也指出:“我们认为128层相对原来的64层和32层的产品,更具成本竞争力,我们也很期待产品发布以后,会有更好的市场表现。而且我们有信心在128层这代产品上可以实现盈利。”
编辑:芯智讯-林子
128核的大芯片来了,号称最通用的CPU
来源:本文内容来自tom’shardware,谢谢。
当Tachyum在Hot Chips 18上推出其Prodigy通用处理器的概念时,它的芯片设计用于使用动态二进制翻译器运行任何代码,引起了轰动。它在执行本机代码和翻译代码时都表现出高性能。该公司花了一段时间来设计实际的硬件,接受评估套件的预订(在新标签中打开); 该公司还披露了其 Prodigy 的确切规格。它们看起来确实令人印象深刻,但每个芯片 950W 的热设计功率也令人恐惧。
128个专有内核,5.7GHz、16个 DDR 5内存
每个 Tachyum Prodigy 处理器具有多达 128 个专有内核,与 16 个 DDR5 内存通道(用于 1,024 位接口)配合,支持高达 7200 MT/s 的数据传输率(因此提供高达 921.6 GBps 的带宽)以及 64 个 PCIe 5.0 车道。此外,该芯片总共支持高达 8TB 的 DDR5 内存,这与我们将在其他制造商即将推出的服务器 CPU 中看到的一致。至于时钟频率,Tachyum 的 Prodigy 设计运行频率高达 5.7 GHz,是台积电性能优化的 N5P 工艺技术的产物。
(图片来源:Golem.de)
在性能方面,Tachyum 期待其旗舰 Prodigy T16128-AIX 处理器能为HPC 提供高达 90 FP64 TFLOPS 以及为推理和训练提供高达12 个“AI PetaFLOPS”,据推测当运行本机代码时消耗高达 950W(并使用液体冷却)。同时,Tachyum 的 Prodigy 处理器可以在 2 路和 4 路配置下工作。具体来说,AMD 的 Instinct MI250X 在大约 560W 的 HPC 中具有 96 FP64 TFLOPS 的峰值吞吐量。相比之下,Nvidia 的H100 SXM5 可以在 700W 时为AI提供高达20 INT8/FP8 PetaOPS/PetaFLOPS(稀疏性时高达 40 PetaOPS/PetaFLOPS)。然而,这两种计算gpu都不能用于通用的工作负载。这正是有趣的地方。
新CPU诞生
Tachyum 的 Prodigy 是一款通用同质处理器,最多可容纳 128 个专有的 64 位 VLIW 内核,每个内核具有两个 1024 位矢量单元和每个内核一个 4096 位矩阵单元。此外,每个内核都有一个 64KB 指令缓存、一个 64KB 数据缓存、1MB L2 缓存,并且可以利用其他内核未使用的 L2 缓存作为受害 L3 缓存。
(图片来源:Tachyum)
Tachyum 的首席执行官兼联合创始人 Radoslav Danilak 与 Golem.de交谈时表示,Tachyum 的 VLIW 内核是有序内核,但当编译器制造商进行适当优化时,它们可以支持 4 路无序问题。(在新标签中打开). 他还再次强调,Prodigy 指令集架构可以通过使用所谓的毒位的软件实现非常高的指令级并行性。
据该公司称,这些内核运行为 Prodigy(VLIW 架构有望大放异彩)以及 x86、Arm 和 RISC-V 二进制文件编写并明确优化的本机代码,使用软件仿真并且不会降低性能。从历史上看,所有让 VLIW 处理器执行 x86 代码的尝试都失败了(例如,Transmeta 的 Crusoe、Intel 的 Itanium),主要是因为特定的 CPU 架构和仿真效率低下。Tachyum 的负责人承认,Qemu 二进制翻译将性能降低了 30% 到 40%(没有透露任何基线),但希望现实世界的性能仍然足够高以具有竞争力。同时,一些程序已经原生支持。
“我们本机支持 GCC 和 Linux,而且 FreeBSD 现在也可以在 [on Prodigy] 上运行,”Danilak 说。“Apache、MongoDB 或 Python 已经原生运行,Pytorch 和 Tensorflow 框架也可用。”
Tachyum 强调,Prodigy 不是加速器,而是真正的 CPU,将与 AMD、Intel 和其他公司竞争。为确保处理器能够在通用和 AI 工作负载中提供具有竞争力的性能,自 2018 年首次推出以来,该公司对其设计实施进行了大量更改。
“我们是 CPU 替代品,而不是 AI 加速器公司,我们的目标是云/超大规模和电信公司,”Danilak 说。“随着时间的推移,我们计划赢得一些超级计算机客户,因此我们将向量/MAC 单元的宽度从 512 位增加到 1,024 位 [这也为人工智能的 4,096 位矩阵运算带来了必要的数据路径]。”
事实上,Tachyum 的 Prodigy 承诺的一个特别优势是它能够执行不同类型的代码。假设它可以在执行通用工作负载(实例)的同时以不错的功率提供不错的性能,它可能会为 AWS、Microsoft Azure 等提供一些额外的灵活性,因为它们将能够将相同的机器用于 AI、HPC、和通用实例(如果需要)。当然,它需要来自不同方的一些实际软件工作,但这可能会奏效,至少在理论上是这样。
到2023年才能量产
应该指出的是,Tachyum 仍然没有任何 Prodigy 芯片。因此,所有的性能预测都是模拟的产物,而该公司现在唯一拥有的是其处理器的 FPGA 原型。
(图片来源:Tachyum)
与此同时,该公司最近开始接受Tachyum 的 Prodigy 评估平台的预订,该平台将用于一些 Prodigy 芯片。公司必须在 2022 年 7 月 31 日之前下订单,实际硬件的交付时间约为“收到订单后的六到九个月”。
如果一切按计划进行,Tachyum 预计将在 8 月中旬流片出第一个 Prodigy 芯片(可能小于 500 mm^2)。在那之后,该公司预计将在 12 月左右获得其芯片的第一批样品,如果芯片工作正常,该公司计划开始提供样品(即发送评估套件)。通常,芯片从晶圆厂返回后大约需要一年时间。尽管如此,Tachyum 仍希望其首款处理器能够按计划工作,并能够在 2023 年上半年开始实际量产。
在未来,Danilak 设想使用台积电的 N3 节点之一制造的 Prodigy 2 处理器将在相同的功率下提供两倍的性能以及 PCIe Gen6 支持。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3068内容,欢迎关注。
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
相关问答
芯片精灵检测是128g,为什么量产后是16g?
出现这个现象一般是3种情况:1.芯片本身是扩容芯片,通过出厂时篡改芯片底层数据让电脑软件误认为是128G的,这种芯片在你写入数据超过芯片真实容量时数据就会丢...
Inteli5-4300Y/4G存储空间/128G硬盘显卡芯片IntelGT2-ZOL问答
这笔记本的CPU性能低下,更何况GPU只是GT2级别,玩lol推介是中低特效好了,另外别人说是完全流畅不卡,估计是最低特效,关了阴影的。问号都没有.你玩深沉呢...本田...
当前128G、256G的手机sd卡芯片中国能独立制造吗?
泻药。这种问题我没有过多了解,无法准确回答。但题中说的是制造,我想应该是没问题的。至于能否独立研发,这个没有了解,不太清楚。但是我觉得应该也是可以...
Inteli5-4300Y/4G内存/128G硬盘显卡芯片IntelGT2?
这笔记本的CPU性能低下,更何况GPU只是GT2级别,玩lol推介是中低特效好了,另外别人说是完全流畅不卡,估计是最低特效,关了阴影的。这笔记本的CPU性能低下,更何...
oppo手机内存16g变成128g的代码?
一、更换内存芯片理论上讲,手机的机身内存是固定的,是手机品牌商在出厂时就安装好的,很多人就说这这是无法进行扩展的,但我却有不同意见,既然厂家是“组装...
闪迪u盘cz73128g用的什么芯片-ZOL问答
1、查不到主控芯片的型号,可以拆开U盘的外壳。2、然后看那个小的正方形的集成块,它就是U盘的主控。3、然后根据它的型号下载量产工具,也可以,但是闪迪的量产工...
为什么固态硬盘一些是120G有些是128g呢?哪种好点?-181****...
都是三星的固态硬盘。120G的通常是840系列,128G的通常是830,840PRO系列,由于采用的主控芯片不同,所以容量会有所不同。只要是正规渠道购买,都能买到...
128层存储芯片基本知识?
存储芯片的内部结构就像一座住宅大厦,里面有很多一间间的小房子,这一间间的小房子就是电荷存储的物理空间。最初的小房子只能盖一层,是平面型的。随着芯片制...
现在入手骁龙845芯片8G运行128g内存手机是否落后?
6g感觉都够用对于现代手机来说绝对不落后,845基本的日常应用是没问题,打个吃鸡,王者,崩坏3也绝不卡顿,但是这批机子已经3年以上了,你得考虑零件,电池的老化造成...
华为手机内存扩容性能稳定没?
中端处理器麒麟985还要强一点,相信再战斗个2年毫无压力,所以花几百块钱扩容一下...如果你的华为手机是采用的麒麟980处理器,这个处理器的性能,其实比目前华为...