首页 > 公司动态 > 网烁7048四路Titan XP 深度学习服务器配置一览
网烁7048四路Titan XP 深度学习服务器配置一览
2018-07-02 11:56:42 6839

深度学习是目前科技型企业甚至不少传统企业转型的“方舟”,今天以一位网烁的服务器客户为例,为大家分享一台深度学习服务器的搭建思路。这位客户是从事新材料行业,打算购入一台GPU服务器进行深度学习训练代替人工,让AI来检验材料表面,提高检测效率。


首先我们来看一看这台服务器的基础配置:

超微GPU服务器7048GR-TR

服务器是以Supermicr 7048GR-TR平台为核心,平台支持Intel®Xeon E5-2600V3/V4系列,QPI高达9.6GT/S,支持4通道内存;

内存方面,平台支持最高2TB 2400MHz的DDR4 ECC 3DS LRDIMM内存,主板上内存插槽共计16根;

扩展方面,4条PCI-E 3.0 x16、2条PCI-E 3.0 x8和1条1个PCI-E 2.0 x4插槽,支持最高4张NVIDIA GPU卡;

板载ASPEED AST2400 BMC芯片提供视频输出,2个RJ45 2GbE网口和1个IPMI远程管理端口为这台服务器提供了远程监控能力;

平台的存储能力也相当可观,共有8个3.5英寸标准热插播托盘和3个5.25的标准光驱位;

电源采用具有PMBus 协议的2000W冗余电源;

散热方面,中部风墙采用4个92x38mm 4pin可调速散热风扇,后部风扇数为4,其中2个为可选。

网烁根据该客户的实际需求,为客户定制了以下方案:

GPU卡:客户的服务器采用了四张Nvidia GTX TITAN Xp作为GPU卡配置,为什么要采用TITAN XP作为深度计算的GPU卡,而不是最新的TITAN V呢?我们看数据说话:

 TIM截图201806281617203.jpg

GPU卡对深度学习影响最大的三个参数分别是单精度浮点运算(越高越好)、显存带宽(越高越好)和显存容量(越多越好)。与TITAN XP相比,TITAN V价格高出2.49倍,然而在单精度浮点运算能力、显存带宽上的优势仅仅为1.23倍和1.19倍,TITAN XP与TITAN V的显存容量也相同,二者相比自然选择性价比更优的TITAN XP。况且,购买4张TITAN XP的价格只能购入1.6张TITAN V,而四张TITAN XP后四倍数值的提升(根据运行环境不同,实际数据可能会有略微出入)对TITAN V的优势无疑是很明显的。

TIM图片201806261122114.jpg

散热:根据我们的经验,在多GPU卡时应该采用最大风扇数配置才能达到良好的散热效果,所以我们在备选散热风扇位置安装了2枚球形风扇,以保证GPU卡散热良好。

TIM图片201806261122015.jpg

CPU:CPU采用了两颗E5-2678V3 2.5G 十二核处理器。这颗CPU架构为Haswell,适用于Socket 2011-3插槽,拥有2.5GHz主频和2.9GHz睿频,L3为30MB,TDP为120W,总线速度为5GT/s,支持双通道DDR4类型内存。本地存储、内存和显存之间数据交换需要消耗大量CPU资源,而两颗十二核心处理器为深度学习服务器提供了良好的支持。


内存:根据经验,内存的容量通常至少为GPU卡显存容量的2倍才足以应对内存与显存之间巨大的数据交换。深度学习对内存的消耗主要分为输入的图像数据、模型复杂程度、各层响应。其中学习资料占用很小,一张256X256的彩色学习图片大小以192KB来计算,即使加载1万张学习库也仅仅占用不到2GB内存;而神经网络识别模型和各层的响应则是内存占用大户,结构越复杂,运算时占用的内存就越多。所以我们为用户在平台上搭载了4跟金士顿 32G RECC DDR4 2400MHz内存,保证双通道发挥出内存读写最大性能的同时,128G内存又满足了内存两倍于显存(48G)的容量要求。


Intel SSD S4500 480G,采用企业级SSD一方面为了保证数据吞吐时不会造成性能瓶颈,另一方面企业级SSD的平均无故障时间和完善的质保体系远超消费级SSD。

IMG_20180625_1510512.jpg


以上就是该服务器的配置情况,如果你对深度学习、人工智能服务器有需求,欢迎联系网烁的客服电话400-028-1968,我们将及时为你跟进,为你搭建适用、好用的专业计算机。

扫一扫,关注网烁公众号!
微信搜索“网烁”或“waso-vip