首页 > 行业动态 > 当QLC遇见数据中心——Intel D5
当QLC遇见数据中心——Intel D5
2019-11-27 11:51:42 5015

以下文章来源:KoolShare论坛

D5QLC

差不多是在十年以前,Intel重新为自家的CPU产品设计了命名方案,曾几何时I3I5I7占领了我们的日常生活。这种友好的命名规则极大帮助了消费者,特别是一些非专业用户。人们只需要知道同时代的I7I5好,I5I3强就行了,而不必要去分辨那些诸如QX9650的复杂数字组合。

去年Intel把这套命名规则悄悄地搬到了SSD产品线上,从2018年下半年开始发布的数据中心新产品都会被命名为D3D5D7等等

blob.png

NAND经过多年的演化已经从SLCMLC、平面 TLC变成了现在主流的3D TLC,而下一代QLC也逐渐登上了舞台。这样的演化使得NAND的容量越来越大,成本越来越低。但带来的副作用则是擦写次数及写入性能的降低。

blob.png

Intel在更早的时候也曾经发布过基于QLC NAND的消费级产品660P。性能虽说不敢恭维,但价格倒真的是够便宜,大品牌的五年质保也为其赢得了一部分用户青睐。所以说只要定位找得准,即使性能不是那么的拔尖,也一样能获得不错的实际效果。

IntelP4420/P4320这样的QLC NVME SSD划分为D5级别,如果拿CPU来类比的话这属于中端产品定位。Intel给它们的评语是LargeAffordableReliable

blob.png

Large:巨大的。QLCTLC相比多了一位来存储数据,容量增加33%。所以Intel 数据中心级别 QLC NVME SSD的起步容量为7.68T,这在Intel产品线中只有P4510P4610的最高容量能勉强摸到尾灯,更别说15T朝上的尺子形状的P4326了。

Affordable:便宜的。QLC能提供更低的每GB价格,在相同容量下可以为企业降低更多成本

Reliable:可靠的。这点可能会让人产生质疑,因为QLC的可擦写次数要小于TLC。然而不要忽略一点,寿命不但与擦写次数有关,还与容量有关。根据Intel官方给出的数据,在128K连续与4K随机负载各占50%的情况下,P4420可以提供2DWPD的寿命(P43201DWPD),那么7.68T容量的盘即可提供高达28100TBWP432014100TBW)的写入寿命。而3D TLC产品P4510也只不过是13.88PBW

blob.png

不是随便一款SSD都能被称为数据中心级,Intel把这样的一款QLC产品送进数据中心,想必也经历过千锤百炼。被视为洪水猛兽,避之尤恐不及的QLC,在Intel这样的行业巨头调教下究竟能迸发出多少能量,今天我就来测试一下

大容量与高冗余

这次我们测试的是Intel基于3D QLC NAND的数据中心SSD——D5-P4420。当然他还有一个兄弟款D5-P4320,从官方给出的参数看来几乎只有写入寿命的区别。但实际上到底是怎样,我们也将在不久之后为大家奉上

blob.png

截止目前Intel D5-P4420还仅有一种容量——7.68T

blob.png

接口则是采用U.2这种在数据中心比较常见的存储接口

blob.png

背面则是和Intel其他的U.2盘一样做了增加散热面积的突起式设计

blob.png

边上也贴有型号贴纸

blob.png

盘体外面的螺丝一共有两个,都隐藏在正面贴纸下面

blob.png

拆开盘体后可见D5-P4420是双PCB设计,这样设计的好处是可以在有限的空间里容纳更多的NAND。缺点则是靠中间的那两面无法享受到外壳的散热福利

blob.pngblob.png

主控的Spec CodeSLLWY,暂时还没有关于这款主控的详细资料

blob.png

闪存编号为29F02T2AMCQH2,这是一款单颗4Tb512GB)的3D QLC颗粒。全盘共24颗,容量总计12288GB。最终成品容量仅为7.68T,也就是说有相当之多的OP空间,这么做也是够奢侈的了。

blob.png

缓存采用镁光的DDR4颗粒,单颗8Gb1GB),全盘总计10颗。按照一般产品的逻辑每1TBNAND会搭配1GBDRAM做缓存,而D5-P4420用了十颗,想必是和ECC内存一样在DRAM上也做了冗余。

blob.png

电源管理芯片是IDTP78,这个经常出现在Intel企业级(数据中心级)SSD上,算是久经考验的成熟解决方案了

blob.png

完整掉电保护方案的电力来自于这颗尼吉康1300uf大电容

blob.png

Windows下正常识别

blob.png

格式化之后实际容量为6.98T

blob.png

出厂态与稳定态

全球存储网络工业协会(SNIA)将SSD的写入性能状态分为三个阶段

blob.png

FOB:出厂态。一般指全新盘的状态,当然也有一些方式让旧盘也能恢复出厂态,比如Secure Erase。这个状态是SSD性能最强的阶段,如何尽可能的提升出厂态的性能以及延长出厂态的持续时间也是消费级SSD最重点优化的方向之一

Steady State:稳定态。指SSD经过长期负载使用,数据写入与垃圾回收达到相对平衡时的状态。此时是SSD最真实的性能表现,也是企业级的重点考察范围。所以这部分的性能是企业级(数据中心级)SSD重点优化的方向

Transition:过渡期。指从出厂态到稳定态的过渡阶段,如何从出厂态平滑的过渡是这个阶段的重点

而我们平时看到的以AS SSDCDM为首的测试工具都是针对SSD出厂态性能进行的测试,适合家用厂家,但并不能反映企业级(数据中心级)SSD的真实性能

blob.png

可以看到P4420在这两款测试工具中的表现不如现在的中高端NVME SSD。这是企业级(数据中心级)SSD不同优化策略所导致的

blob.png

我们采用IOMETER这样的测试方式对SSD进行持续的高强度写入才能看到稳定态的情况

blob.png

可以看到P4420NTFS文件系统下,使用QD32 4K随机写入大约13000秒之后进入稳定态。并且其在出厂态时性能摆动巨大,而进入稳定态之后波动大幅收窄,这也能够看得出来P4420作为数据中心SSD重点的优化方向

blob.png

128K连续写入离散度

SNIA标准测试

为了探究企业级(数据中心级)SSD的真实性能,SNIAPTS为我们制定了了标准化测试流程。我这次的测试也完全按照标准流程走下来。下面将分别测试D5-P4420IOPS、吞吐量、延迟。

测试平台如下:

CPUIntel XEON W-3265主板SuperMicro X11SPA-T内存Micro DDR4-2933 RDIMM 16G*6操作系统CentOS 7.6 1810 X86_64测试软件FIO 3.14

测试SSD信息如下:

品牌Intel型号D5-P4420容量7.68T序列号BTLL9051069B7P6FGN固件版本3DV10110

IOPS测试

准备工作——关闭设备写入缓存,设置测试Queue Depth=32Thread Count=4

预热——执行Secure Erase,然后以Block Size=128KiB持续写入两倍SSD容量

开始——随机读写比率分别设置为100/095/565/3550/5035/655/950/100共七种,每种读写比例均使用1024KiB128KiB64KiB32KiB16KiB8KiB4KiB512B共八种不同尺寸的数据块。每种数据块执行一分钟,每轮测试总计7*8=56分钟。然后重复上述动作最多25

记录——记录每个读写比例的每个数据块在一分钟内的平均IOPS,以4K 100%写入作为判定是否进入稳定态的依据,若连续5轮的4K 100%写入IOPS都未超过平均值的正负10%即视为进入稳定态

blob.png

不愧是Intel的数据中心级产品,D5-P4420在第一个回合即进入稳定态。虽然如此,但也可以看到第一轮和第三轮的波动比较大,几乎是压在及格线上,但好歹也算是通过了

blob.png

其他大小的数据块IOPS收敛至稳定态的结果图

blob.png

IOPS测试结果图表

blob.pngblob.png

这项测试的目的是模拟最严苛的环境,从而探求这款SSD的性能底线在哪里,给用户一个保底选项供参考。而在实际使用过程中几乎是不会达到这样变态的环境的,换句话说完全不用担心日常环境中会出现比这个测试还要低的性能。

Intel P4420 7.68T在稳定态下QD32 4K随机写入IOPS约为58919,这比官方给出的35000要高出很多。这样的反向虚标也体现出了Intel对于自家首款企业级QLC产品的谨慎。

QD32 4K随机读取IOPS仅有67172,这并不是一个很好的数据,大概相当于中档SATA企业盘。其原因在于这项测试采用不同数据块以及不同写入比例持续高压态势,使得主控疲于应付这种随机请求,主控资源几近枯竭。此时的性能瓶颈已经不再是QLC,而是主控。如何在这种极端环境下合理调配读取和写入的资源,这就是要由固件所决定的了。显然P4420的固件在此时选择了优先写入,所以就只能在一定程度上牺牲读取性能了。

吞吐量测试

准备工作——关闭设备写入缓存,设置测试Queue Depth=32Thread Count=1

预热——执行Secure Erase,然后以Block Size=1024KiB持续写入两倍SSD容量

执行——顺序读写比例设置为100/00/100共两种,每种读写比例都使用1024KiB数据块执行一分钟,每轮测试总计2*1=2分钟,然后重复上述动作至多25

blob.png

P4420在顺序读写中表现出的稳定性显然是要强于随机读写,连续五轮几乎没有什么波动

blob.png

在吞吐量上顺序读取达到2977MB/S,这是主流NVME的水平,也基本打到官方标注的参数。顺序写入则达到了1036MB/S,大概是中小容量3D TLC的水准,这对于一个QLC SSD来说算是一个不错的成绩了,毕竟写入是QLC的一大短板。

延迟测试 

扫一扫,关注网烁公众号!
微信搜索“网烁”或“waso-vip