基于自己开发的服务器搭建的这套GPU集群已经在自己课题组里上线运行了一段时间(硬件如p4~9所示),跨节点并行计算性能完全符合预期,同时很稳定,至今从未出现过“掉卡”问题,比一些基于“大厂准系统”的8卡4090机器稳定多了。 目前只上了3个计算节点,24块V100 SXM2 16GB,还不是“完全体”,主要原因是机房capacity不足(白嫖机房还要啥自行车),等几个月后学校的新机房建成,也许有机会进一步扩展。 “完全体”有3种规模,架构分别如p1~3所示。其中p2的144- […]
基于自己开发的服务器搭建的这套GPU集群已经在自己课题组里上线运行了一段时间(硬件如p4~9所示),跨节点并行计算性能完全符合预期,同时很稳定,至今从未出现过“掉卡”问题,比一些基于“大厂准系统”的8卡4090机器稳定多了。 目前只上了3个计算节点,24块V100 SXM2 16GB,还不是“完全体”,主要原因是机房capacity不足(白嫖机房还要啥自行车),等几个月后学校的新机房建成,也许有机会进一步扩展。 “完全体”有3种规模,架构分别如p1~3所示。其中p2的144- […]
Sep-2023 by ア熵增焓减ウ | yult-entropy@qq.com | entropylt@163.com 0 写在前面 应科技博主@极客湾Geekerwan 邀请,我给最新的AMD EPYC CPU做了一些基准测试。原本打算将相关分析做进视频里,但由于进度赶不上,视频中只放了“7950X指数”,分析部分写成了单独的图文发出来,写得比较通俗,因为考虑到会有很多吃瓜群众来看。 视频链接:256核512线程!史上最强CPU到底能做什么? 硬件:7950X和双路EPY […]
Aug-2023 by ア熵增焓减ウ | yult-entropy@qq.com | entropylt@163.com It's everyone's duty to squash the green behemoth. 0 Introduction Please be aware that the information provided in this blog post is not comprehensive and should be considered as […]
Aug-2023 by ア熵增焓减ウ | yult-entropy@qq.com | entropylt@163.com 点此阅读中文版 It's everyone's duty to squash the green behemoth. 0 Introduction In the past two years, numerous world-leading supercomputers have embraced AMD GPUs as heterogeneous acc […]
Aug-2023 by ア熵增焓减ウ | yult-entropy@qq.com | entropylt@163.com 打击黄狗,人人有责 0 前言 本文的信息并不全面,仅仅是作者近期在AMD GPU上测试经典MD性能的附属产物。你或许可以使用较老版本的ROCm和特定的GPU轻松地编译并运行文中提到的应用程序,也有可能在不久后的软件更新中,文中提到的一些兼容性问题就会被解决。本文内容在相应程序的官方文档/手册/Readme/Wiki中均未提及,且几乎无法在互联网上搜索到现 […]
Aug-2023 by ア熵增焓减ウ | yult-entropy@qq.com | entropylt@163.com 打击黄狗,人人有责 0 前言 近两年,全球有大量顶级超级计算机采用了AMD GPU作为异构加速器,因此大量HPC应用程序开始了移植到ROCm软件栈的进程,并且其中很大一部分已经具有很高的完成度和很好的性能,可以用于正式的科学研究。此外,也有一部分程序原生支持了intel GPU。鉴于此,笔者集齐了所有NVIDIA Ada Lovelace架构桌面GPU、 […]
[本文首发于计算化学公社 | 文 熵增焓减 | yult-entropy@qq.com | 2023-03] 0 写在前面 近期intel W790平台的系列产品即将或已经上市,笔者对其中2个具有代表性的型号进行了性能测试,分别是intel Xeon w7-2495X和intel Xeon w9-3495X。 本文MD测试部分只包括GROMACS 2023,其中所用模型与此系列首篇完全一致;另增加了Gaussian 16 Rev. C.02 AVX2和ORCA 5.0.4这 […]
[本文首发于计算化学公社 | 文 熵增焓减 | yult-entropy@qq.com | 2023-03] 0 写在前面 去年10月的文章中说: “如今Ada Lovelace架构刚刚上市,并无针对性优化,预计在将来几个月,随着几款MD软件以及编译器和驱动层面对于Ada Lovelace架构的优化,RTX 4090运行MD模拟的性能还会有进一步提升。” 如今已过去5个月,是时候检验一下自己是否被打脸了。 1 测试平台 硬件: ID CPU GPU 内存-RAM 主板-Mot […]
[本文首发于计算化学公社 | 文 熵增焓减 | 赞助 51972, 庚子计算 | yult-entropy@qq.com | 2022-10] 0 写在前面 这次测试最初的目的是证明用何种性能级别的CPU可在运行GPU加速GROMACS(简称GMX)时榨干最新顶级消费级GPU——NVIDIA GeForce RTX 4090,但某日笔者建议一些bilibili UP主测试该GPU运行“生产力”软件的发言被不学无术/不懂装懂者群起而攻之,遂决定亲自上阵,在最初的测试计划中引入一 […]
本月初,应某超算平台邀请,为其GPU节点运行GMX的性能做了一点Benchmark,在这里跟uu萌分享捏(其实是邀请的是我老师,她把这活转给我干乐) 对于GMX用户嘛,总结起来就一句话:别去用没有NVLink且CPU很弱的GPU集群(什么废话x 附上测试的原始数据: 本文同步发表于计算化学公社论坛
COPYRIGHT © 2021-2023 enthalpy.space. ALL RIGHTS RESERVED.
Theme Kratos Made By Seaton Jiang