请选择 进入手机版 | 继续访问电脑版

从深度学习计算过程来分析深度学习工作站\服务器的硬件配置

[复制链接]
查看: 1532|回复: 1
avatar

630

主题

630

帖子

1920

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1920
online_admin 发表于 2021-8-21 17:58:51 | 显示全部楼层 |阅读模式
[size=0.882em]人工智能已经无处不在,席卷世界。2017年的初夏,除了挖矿,还有深度学习。那么用于深度学习的工作站/服务器也和矿机一样到处可见,然而事实并不是只要机器里有GPU,或者GPU越多性能就越强,下面以ultralab深度学习工作站/服务器为例进行解读。

[size=0.882em]目前深度学习工作站/服务器遇到的问题
[size=0.882em]1.为什么4块GPU机器,比人家2块GPU机器还慢
[size=0.882em]2.为什么同样8块GPU比人家8块GPU卡,还慢
[size=0.882em]3.为什么2块GPU卡,一个快一个慢
[size=0.882em]4.为什么这么多GPU卡,计算过程还是很慢
[size=0.882em]5.我的机器噪音巨大,无法放到办公环境,怎么在静音环境下运行
[size=0.882em]……


[size=0.882em]那么深度学习需要什么样的硬件配置才是最合理、最高效的?
[size=0.882em]首先从深度学习计算过程分析开始:

[size=0.882em]上述图示,深度神经网络计算大致流程,下面通过深度神经网络计算环节,分析核心硬件配置理想要求

[size=0.882em]常见图形工作站硬件配置上的误区:
[size=0.882em]1.硬盘用普通PC硬盘,寿命短,带宽低,或数量不够
[size=0.882em]2.CPU用的最多的是Xeon E52620v(8核2.1GHz),频率太低,数据预处理太慢,成为整个计算的最大瓶颈
[size=0.882em]3.为了把钱用到“刀刃上”—尽可能多配GPU卡,但是总显存比内存容量大,不合理,或者CPU核数低于GPU卡数,这些都会造成计算过程资源耗尽,数据来回从虚拟内存导入,计算变慢ultralab深度


[size=0.882em]学习工作站\服务器硬件配置推荐
[size=0.882em]GXi/M图灵计算工作站


[size=0.882em]拥有超高CPU频率,大幅加速深度学习预处理过程
[size=0.882em]支持最大4块(GX360i)/7块(GX480M)/9块(GX610M)GPU卡,单精度浮点100Tflops
[size=0.882em]拥有最大16个硬盘位,容量160TB
[size=0.882em]完全处于办公环境(静音级)、不再被噪音所困扰
[size=0.882em]不需要专门的机房,不占过多空间,维护成本极低
[size=0.882em]完美的硬件配置和专业优化加速技术,保证整个机器系统高速高效运转


[size=0.882em]详细硬件配置参考:
[size=0.882em](1)GX360i机型配置参考(超值型)

[size=0.882em]特点:支持4块GPU卡,CPU频率高达5GHz,整体配置均衡无死角,满足深度学习训练硬件配置要求
备注:含23”高清图显


[size=0.882em]2)GX480M、GX610M机型配置参考(高性能型)

[size=0.882em]特点:支持最大到7块(GX480M)或9块(GX610M)GPU卡,CPU的频率和核数达到最大均衡,每个环节保证达到最高性能,整体配置均衡无死角,满足深度学习训练对配置的要求
备注:含23”高清图显


总结
[size=0.882em]UltraLAB GXi/M是一款静音级、高性能GPU超算的深度学习训练计算机,安静,性能强大,适合科研部门在安静的办公环境下运行。此外,该机型用途极广,扩展能力强,调整配置后,可为电磁仿真计算(CST)、量子化学/分子动力学计算(VASP、AMBER等)、超大屏拼接(8X9=72路视频拼接合成)、视频剪辑合成、指纹识别等应用,提供强悍的计算、图形生成能力。
回复

使用道具 举报

avatar

0

主题

8

帖子

26

积分

新手上路

Rank: 1

积分
26
在线会员 发表于 2021-8-21 17:58:57 | 显示全部楼层
转发了
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies

本版积分规则

logo
  • 反馈建议:893566502@qq.com
  • 工作时间:周一到周五 10:00-19:00

关注我们

  • wx