作为科学计算研究人员,站在HPC/科学计算的角度评论一下昨天发布的Blackwell GPU。 1. 完全没提到Vector算力,包括FP32 Vector和FP64 Vector。而这两者是HPC最主要使用的算力,由所谓的CUDA Core提供。FP64 Tensor算力相较于上代H100也倒退了,64TFLOPS>40TFLOPS,另外,作为对比,AMD Instinct MI300X的FP64 Matrix是163TFLOPS。NVIDIA放弃HPC是意料之中的 […]
作为科学计算研究人员,站在HPC/科学计算的角度评论一下昨天发布的Blackwell GPU。 1. 完全没提到Vector算力,包括FP32 Vector和FP64 Vector。而这两者是HPC最主要使用的算力,由所谓的CUDA Core提供。FP64 Tensor算力相较于上代H100也倒退了,64TFLOPS>40TFLOPS,另外,作为对比,AMD Instinct MI300X的FP64 Matrix是163TFLOPS。NVIDIA放弃HPC是意料之中的 […]
0 写在前面 9月初笔者给朋友课题组设计了一套小集群,为了省钱,存储(NAS)部分是自行采购散件DIY的,组网也使用了二手硬件。NAS和交换机从下单散件到组装、调试完毕花了10天,原计划等到集群部署完成后综合起来写一篇帖子分享出来,但期间出现了一些问题,计算节点迟迟没有到货,故先把NAS部分单独发出来。 1 简介 采购这些散件已过去一个多月,行情有很大变化,因此价格仅供参考。 如果追求极致省钱,网卡也可以选用同为CX3 Pro芯片的拆机HP544+FLR。 18TB HDD没 […]
本月初,应某超算平台邀请,为其GPU节点运行GMX的性能做了一点Benchmark,在这里跟uu萌分享捏(其实是邀请的是我老师,她把这活转给我干乐) 对于GMX用户嘛,总结起来就一句话:别去用没有NVLink且CPU很弱的GPU集群(什么废话x 附上测试的原始数据: 本文同步发表于计算化学公社论坛
COPYRIGHT © 2021-2023 enthalpy.space. ALL RIGHTS RESERVED.
Theme Kratos Made By Seaton Jiang