基于自己开发的服务器搭建的这套GPU集群已经在自己课题组里上线运行了一段时间(硬件如p4~9所示),跨节点并行计算性能完全符合预期,同时很稳定,至今从未出现过“掉卡”问题,比一些基于“大厂准系统”的8卡4090机器稳定多了。 目前只上了3个计算节点,24块V100 SXM2 16GB,还不是“完全体”,主要原因是机房capacity不足(白嫖机房还要啥自行车),等几个月后学校的新机房建成,也许有机会进一步扩展。 “完全体”有3种规模,架构分别如p1~3所示。其中p2的144- […]
基于自己开发的服务器搭建的这套GPU集群已经在自己课题组里上线运行了一段时间(硬件如p4~9所示),跨节点并行计算性能完全符合预期,同时很稳定,至今从未出现过“掉卡”问题,比一些基于“大厂准系统”的8卡4090机器稳定多了。 目前只上了3个计算节点,24块V100 SXM2 16GB,还不是“完全体”,主要原因是机房capacity不足(白嫖机房还要啥自行车),等几个月后学校的新机房建成,也许有机会进一步扩展。 “完全体”有3种规模,架构分别如p1~3所示。其中p2的144- […]
上个月笔者给自己实验室部署了一台NAS并实施了配套的组网,给实验室15个工位通了光缆,用于团队协同工作。一些实施细节记录于此。 1 简介 本次依旧是完全DIY,采用了大量二手硬件,当然,硬盘还是使用全新的。配置如下: 此配置和去年9月的“miniHPC存储节点”有诸多相似之处,主要的修改有以下几点: 本次所搭建的NAS的应用场景对RDMA没有刚性需求,因此操作系统改用维护更简单的TrueNAS Scale 24.04。 改用1+1 CRPS冗余电源,一路接市电,一路接UPS。 […]
Computex 2024上intel公布了Xeon 6的一系列SKU,分LGA-4710和LGA-7529两种Socket,对应6700系列和6900系列,命名有很大变化,不过命名在技术上并不重要,重要的是Xeon 6900P分支(Granite Rapids-AP, GNR-AP)的Top SKU有希望追上AMD EPYC Turin Classic。 Xeon GNR-AP的内核微架构是Redwood Cove,与Meteor Lake P-core的Redwood C […]
作为科学计算研究人员,站在HPC/科学计算的角度评论一下昨天发布的Blackwell GPU。 1. 完全没提到Vector算力,包括FP32 Vector和FP64 Vector。而这两者是HPC最主要使用的算力,由所谓的CUDA Core提供。FP64 Tensor算力相较于上代H100也倒退了,64TFLOPS>40TFLOPS,另外,作为对比,AMD Instinct MI300X的FP64 Matrix是163TFLOPS。NVIDIA放弃HPC是意料之中的 […]
笔者在2021和2022年双十一都发了MD工作站配置推荐,今年也例行发布一篇。 由于众所周知的原因,近期不推荐购买RTX4090,建议等过一段时间炒作潮过去了再买。若急用,也可将4090换为4080,其余配置不变。 根据8月份发布的基准测试,配置2的7900XTX跑AMBER和OpenMM性能高于4080。 目前双十一第一波还没有开始,因此大部分硬件的价格仅供参考,还有下降空间,建议自行蹲优惠(尤其是JD自营)。 此前笔者曾多次在一些跟帖/评论区中提及,TITAN V用于跑L […]
0 写在前面 9月初笔者给朋友课题组设计了一套小集群,为了省钱,存储(NAS)部分是自行采购散件DIY的,组网也使用了二手硬件。NAS和交换机从下单散件到组装、调试完毕花了10天,原计划等到集群部署完成后综合起来写一篇帖子分享出来,但期间出现了一些问题,计算节点迟迟没有到货,故先把NAS部分单独发出来。 1 简介 采购这些散件已过去一个多月,行情有很大变化,因此价格仅供参考。 如果追求极致省钱,网卡也可以选用同为CX3 Pro芯片的拆机HP544+FLR。 18TB HDD没 […]
0 前言 上个月收到一位网友的哔哩哔哩私信,希望笔者帮他折腾一下用AMD GPU跑LAMMPS,笔者本不太愿意接这种“吃力不讨好”的活,拖了一天多,最终良心过不去,还是接了。 该网友的PC配置是AMD Ryzen 5900X + Radeon 6800XT,他事先在闲鱼平台上花钱找人安装了Ubuntu Desktop 22.04.3 LTS操作系统。据了解,第一个“闲鱼师傅”安装不成功,把锅甩给了“主板不兼容”,又找了一个师傅,才安装成功。 此外,该网友还有一台Ryzen 7 […]
Sep-2023 by ア熵增焓减ウ | yult-entropy@qq.com | entropylt@163.com 0 写在前面 应科技博主@极客湾Geekerwan 邀请,我给最新的AMD EPYC CPU做了一些基准测试。原本打算将相关分析做进视频里,但由于进度赶不上,视频中只放了“7950X指数”,分析部分写成了单独的图文发出来,写得比较通俗,因为考虑到会有很多吃瓜群众来看。 视频链接:256核512线程!史上最强CPU到底能做什么? 硬件:7950X和双路EPY […]
Aug-2023 by ア熵增焓减ウ | yult-entropy@qq.com | entropylt@163.com It's everyone's duty to squash the green behemoth. 0 Introduction Please be aware that the information provided in this blog post is not comprehensive and should be considered as […]
Aug-2023 by ア熵增焓减ウ | yult-entropy@qq.com | entropylt@163.com 点此阅读中文版 It's everyone's duty to squash the green behemoth. 0 Introduction In the past two years, numerous world-leading supercomputers have embraced AMD GPUs as heterogeneous acc […]
COPYRIGHT © 2021-2023 enthalpy.space. ALL RIGHTS RESERVED.
Theme Kratos Made By Seaton Jiang