人人书

杂志

保存到桌面 | 繁体人人书 | 手机版
传记回忆文学理论侦探推理惊悚悬疑诗歌戏曲杂文随笔小故事书评杂志
人人书 > 杂志 > 新一代内存路在何方

新一代内存路在何方

时间:2024-10-31 10:12:15

HBM可以说是普通人接触到的第一款3D堆栈内存,它代表着未来,而DDR内存则是主流代表,下一步是DDR5内存,再加上美光、Intel主导的HMC内存,这三者以及它们的衍生品可以说是2020年之前内存/显存技术角逐天下的主角了。

HBM的出现代表着3D堆栈的新一代内存技术日趋实用化

未来几年将实现百亿亿次计算,对处理器及内存的要求都很高每次有新闻提到PC市场销量下滑,大家往往会不自觉地调侃两家公司——“Intel,你又挤牙膏了,SNB还能战三年”,还有一个想努力挤牙膏但新牙膏上市延期、只能先上PPT的AMD。五年多前的SNB处理器+4GBDDR3内存的确还能再战,但是公平地说,计算机性能实际上一直在不断增长,2011年的TOP500冠军是日本京/K计算机,性能只有8.2PFLOPS(千万亿次),内存容量141TB,2016上半年的TOP500冠军是中国的太湖之光,浮点性能93PFLOPS,内存容量1.31PB,差不多都是5年前的10倍。

五年前的高性能计算刚刚达到1亿亿次,去年太湖之光就实现了10亿亿次,2020年之前的目标是实现百亿亿次,也就是exaFLOPS级别,包括中国、美国、日本和欧盟在内,百亿亿次计算是世界各国都在争夺的下一个制高点,它不仅对主处理器/协处理器提出了极高的要求,支撑起如此庞大运算规模也需要在网络连接、高速内存等子系统上实现突破。

处理器方面陆续将会有Intel下一代Xeon处理器、IBMPower9及AMDZen,加速卡也有NVIDIAVolta、AMDNavi等,下一代内存技术则会有DDR5、HBM、HMC等,它们还会根据不同应用范围衍生出多个版本。这次我们就来探讨一下未来的集中内存(也包括显存)技术的走向及特点。

从Haswell-E处理器开始,内存就开始从DDR3向DDR4升级,经过2年多时间的磨合,如今,DDR4内存也可以说是白菜价了。2015年AMD推出了Fiji核心的Fury系列显卡,它使用的是HBM显存,与之前的GDDR5显存不同,HBM可以说是普通人接触到的第一款3D堆栈内存,它代表着未来,而DDR内存则是主流代表,下一步是DDR5内存,再加上美光、Intel主导的HMC内存,这三者以及它们的衍生品可以说是2020年之前内存/显存技术角逐天下的主角了。

预测DDR、HBM及HMC三强争霸的结局还太早了,要想分出胜负我们还得掂量掂量这三者在性能、功耗及成本上的表现。

DDR5:内存正统续作

2014年,随着Hasewll-E处理器及X99主板的问世,DDR4内存首次进入桌面市场,不过X99平台是面向发烧级玩家的。到了2015年,Intel又推出了Skylake处理器,这才算是真正走入主流市场。经过这两年的发展,DDR4内存已经从王谢堂前飞入寻常百姓家了,其性价比完全不输DDR3内存。

对于DDR4内存,我们之前在三位一体升级换代,Haswell-E、X99及DDR4前瞻一文中已经详细解析过它与DDR3内存的不同,简单来说就是在基础频率无法大幅提升的情况下,DDR4通过翻倍提升显存核心的Bank(内存库)数量变相提高了数据吞吐率,其数据频率可从前代的0.8-2.1Gbps大幅提升到1.6-3.2Gbps,进而提高了内存带宽。

此外,DDR4内存的电压也从前代的1.5V降低到了1.2V,提高了能效,而随着工艺的进步,DDR4内存的核心容量也从之前4Gb提升到了8Gb、16Gb,可以轻松实现单条64GB以及128GB内存,这些都是它比DDR3内存先进的地方。

目前,高频DDR4内存频率已经达到了4.26Gbps,差不多又到了一个极限了,下一步该准备DDR4的继任者了,不出意外的话,其命名就是DDR5,技术路线也类似DDR3到DDR4那样,核心频率同样不会有大幅提高,能做文章的地方还是数据预取位宽、内存库数量等。

DDR5内存目前还在研发阶段,尚未有具体规范,所以厂商公布的很多规格都不是确定的,其目标是相比DDR4内存至少带宽翻倍、容量更大,同时更加节能。具体来说就是数据频率从目前1.6-3.2Gbps的水平提升到3.2-6.4Gbps,预取位宽从8bit翻倍到16bit,内存库提升到16-32个。至于电压,DDR4电压已经降至1.2v,DDR5有望降至1.1v或者更低。

内存/显存技术路线图

DDR4内存已经是主流,下一代DDR5内存

DDR5/HBM/HMC内存及显存规范简介

DDR4内存在核心频率变化不大的情况下大幅提升了带宽

三星公布的DDR5规范与美光的略有不同

DDR5内存数据频率再次翻倍,带宽至少也会翻倍在三星讨论的DDR5内存规范中,其目标跟美光基本一致,也是带宽至少翻倍,预取位宽也会翻倍,不过内存库数量还是16个,与美光公布的数据略有不同。

而在时间点上,业界还是有一定共识的——DDR5预计在2017年完成规范制定,2018年推出样品,2019年开始生产,不过要普及的话估计至少是2020年的事了。

此外,尽管美光、三星都没提制程工艺的问题,但考虑到2018年10nm工艺已经量产了,2020年左右则是7nm节点了,而目前DDR4最先进的工艺是18nm,到了2020年那个时间段,内存也会转向10nm以下节点的。

DDR5内存衍生版之GDDR6显存

说DDR5内存是最正统的内存续作,不仅因为它是最主流的内存选择,还与它的衍生版有关——显存用的下一代GDDR与手机、平板用的LPDDR低功耗内存都跟DDR5息息相关,业界在讨论DDR5内存的同时,同样也没忘了GDDR6及未来的LPDDR5内存。

其实,很久之前显卡用的显存是跟PC内存一样的,但随着GPU性能的不断提升,对带宽的要求也水涨船高,普通PC内存已经无法满足带宽需求了。在DDR内存的基础上就衍生出了GDDR内存,GDDR5就是在DDR3基础上衍生的,两者的大部分规格都基本相同,只不过数据预取位宽从4bit翻倍到8bit,所以GDDR5的带宽在DDR3基础上提高了一倍,这也是其数据频率是真实频率4倍的由来,而普通DDR3内存是2倍真实频率。

在DDR5基础上衍生出来的显存就是GDDR6(虽然还未正式命名)了,它的实际频率与目前高频GDDR5内存差不多,都是1.75GHz左右,但因为预取位宽再次翻倍,数据频率则会从7Gbps提升到14Gbps以上,这个思路其实跟美光主推的GDDR5X显存是一样的,同样是在不提高实际频率的情况下通过提升预取位宽实现带宽提升。GDDR6显存路线图

低功耗LPDDR5内存

当然,为了进一步降低功耗,GDDR6显存的电压也会从目前1.5V降至1.35V。

DDR5内存衍生版之LP5显存

低功耗LPDDR内存也会在DDR5基础上继续演进,其速率可达到6.4Gbps左右,而电压则会进一步降低,目前LPDDR4已经是1.1v电压了,LPDDR5的电压会低于1.1v,目标是实现20%的能效提升。

HBM:第三代性能更强大

2015年AMD推出了Fiji核心的Fury系列显卡,虽然推出的三款显卡都是面向高端市场的,售价比较高,但从技术上来说Fury系列显卡绝对是显卡史上的一次重大变革,因为它用上了HBM显存,它不仅仅是性能更强大,最重要的是HBM显存极大地减少了PCB面积占用,可以把高端显卡做得非常小巧。从某种程度上来说,AMD的R9Nano显卡是当时让我们印象最深刻的产品,比GTXTitanX和GTX980Ti更有意义。

对于HBM显存,我们之前在评测及解析中也详细说过它的特点和优势了,在此就不再赘述了,感兴趣的读者可以参考以前的相关文章。总的来说,HBM的性能远超GDDR5,它的功耗降50%,面积小94%,一句话总结就是HBM在电压只有1.2V的情况下将显存带宽提升到512GB/s,性能更强、功耗更低,且占用空间更小。

到了2016年,HBM显存又进化到了第二代,并正式成为JEDEC标准。与前代产品相比,HBM2显存核心容量从2Gb提升到8Gb,数据频率从1Gbps提升到2Gbps,带来的好处就是在同样4-hi堆栈下,HBM2单颗显存容量可达4GB,带宽1024GB/s。Fury显卡上的HBM显存堪称一次革命一代HBM显存就比GDDR5有了明显优势

HBM3显存也在路上了HBM显存最早是由AMD和SKHynix联合研发的,第一代HBM显存主要是SKHynix在生产,进入HBM2时代,NVIDIA、三星也参与进来了,前者首发了HBM2显存的TeslaP100加速卡。同时,SKHynix也开始量产HBM2显存,有2-hi、4-hi、8-hi三种堆栈方式,速率1.0、1.6及2.0Gbps,带宽分别是128、204、256GB/s,堆栈容量2、4、8GB,最高可实现32GB堆栈总容量,1024GB/s带宽。

HBM2还没上市,三星已经开始讨论HBM3显存了,预计在2019-2020年问世,不过,目前并没有确切的规格。从三星的表态来看,HBM3会进一步提高堆栈层数、核心容量及带宽,但在核心频率、内存库、DQ位宽方面保持HBM2的水平,但就算提升容量和堆栈层数,也足够HBM3容量翻倍、带宽翻倍了,64GBHBM3容量应该不是梦。

值得注意的是,HBM3显存的电压预计会比目前1.2v低得多,这有助于大幅降低HBM3功耗。

从HBM显存问世开始,我们就知道它是个好东西,各方面完胜GDDR显存——除了成本太高,因为HBM显存是新标准,产能不足,而且它是2.5D堆栈的,制造工艺比GDDR5显存复杂多了,这都加剧了HBM显存的普及难度。

在这方面,三星一边推进更高性能的HBM3,同时也在探讨研发低成本的HBM,通过移除ECC校验、缓冲器层、减少I/O及降低TSV数量(TSV工艺中打孔数量越多,性能越好,但会更复杂),这些手段有助于减少HBM成本,虽然这会对HBM性能造成一定影响,I/O位宽从1024bit减少到512bit,但可以通过其他手段弥补,比如提高数据频率到3Gbps,这样一来低成本HBM的带宽会从256GB/s降低到200GB/s左右,还在可接受范围内,而制造成本就低多了。

对HBM来说,阻碍它普及的最大障碍就是成本了,一旦低成本HBM得以实现,那么HBM就有可能不再局限于高端显卡之中,CPU也可以拿它来做缓存了。

HMC:不同于HBM的3D内存

如同闪存从2DNAND转向3DNAND一样,内存也要从平面转向3D立体,前面的HBM就是3D内存技术的一种,不过它并非唯一选择,美光、Intel还有HMC(HybridMemoryCube)内存,它也是通过TSV硅穿孔工艺堆栈多层DRAM核心以实现3D堆栈的。

实现3D堆栈之后,HMC也可以搭积木一样堆叠内存核心了,带来的优势就是:

低成本HBM显存也在讨论中

HBM3显存也在路上了

SKHynix目前生产的HBM显存类型及规格

多层DRAM核心实现3D堆栈·性能更强,带宽是DDR3内存的15倍

·功耗更低,功耗比DDR4减少70%

·占用面积更小,比DDR4减少90%

·设计更简单,通道复杂性比DDR4减少88%

HMC与HBM都是TSV工艺的堆栈内存,很容易混淆,不过具体结构上HMC内存与HBM还是有很大不同的,它可以分为三个层次——顶部的是堆栈的DRAM核心,中间有个逻辑层(LogicLayer),最下面则是封装层(Package)。

另外,HMC与处理器的连接方式也有所不同,HBM有个工艺复杂的中介层,打通了处理器与HBM芯片,而HMC与处理器连接是靠4条高速Link,每条Link有16个通道,速度最高可达30Gbps,典型速度有10Gbps、15Gbps、25Gbps。如果是4-link、10Gbps速度,那么带宽可达160GB/s,15Gbps速度则是240GB/s,美光还在开发8-linkHMC,理论带宽可上320GB/s。

美光目前量产的HMC单颗容量2GB,核心容量为4Gb,4层堆栈,带宽160GB/s,算起来性能比HBM2显存的256GB/s要差一些,不过HMC对比HBM还有个优势,那就是HBM的高带宽需要离处理器很近,显卡跟HBM都是封装在一起的,所以制造工艺复杂,成本太高,而HMC通过Link与处理器相连,既可以做近场内存(NearMemory),也可以距离远点(FarMemory),部署更加灵活。

不过,与HBM显存受到显卡、FPGA追捧不同,HMC推广的力度就小多了,尽管HMC阵营也有三星、SKHynix参与,但真正在推进的只有美光、Intel,Intel代号“KnightsLanding”的XeonPhi上使用了16GB片上缓存,就是美光提供的HMC,号称是DDR4内存的5倍性能、5倍能效,同时面积占用只有后者1/3。

美光主导的HMC内存

这张图中可以看到HBM与HMC结构上的不同HMC的规范发展已经到了2.0时代,据说美光今年还要推出HMC3.0规范,Link数量、堆栈层数、核心容量都有进一步提高,带宽可提升到480GB/s,该指标跟HBM3差不多同级了。

美光HMC样品

美光HMC内存主要特点

小结

本文主要介绍了2020年之前新一代内存/显存的技术路线,DDR5内存的发展是按部就班,DDR5技术使用传统思路提升带宽、降低能耗,而HBM及HMC则是3D堆栈,发展潜力比DDR5更诱人,不过3D堆栈目前制造过程复杂,成本太高,主要用于高性能计算领域,普通消费者要想用上廉价3D内存/显存恐怕还要等待技术逐步成熟之后。
   

热门书籍

热门文章