谷川
而在和上一代 MI300X 的对比中🩱,MI355X 运行 Llama 3.1 405B 模型,在 AI 智能体性能表现上是前者的 4.2 倍,内容生成能力是上一代 MI300X 的 2.9 倍👞🥦🍏🍅🤍,摘要能力是上一代的 3.8 倍,对话式人工智能表现则为 2.6 倍🍒。
才几天没干就痒了
演讲中的经典语句,如“你无法预见未来的点滴,只能回望时串联起过往”和“时间有限,别浪费在活成别(bie)人的样子上”,至今仍被(bei)广泛引用。
AMD Instinct MI355X GPU 在 AI 和高性能计算领域(yu)都有着出色的表现。据 AMD 的介绍,在与(yu) NVIDIA B200 和 GB200 的(de)对(dui)比中,MI355X 的显存(cun)约为竞品的(de) 1.6 倍,内存带宽则基本持平。针对 FP64 和 FP32 运算,MI355X 的峰值性能领先优势达到(dao)了竞品的 2 倍。对于(yu) FP16 和 FP8 运(yun)算,其峰值性能与竞品相当或略有胜出,而 FP6 的性能则(ze)也(ye)达到了竞品 2 倍以(yi)上。此外,在 FP4 运算上,MI355X 与竞品的峰值性能相近。而(er)在性价比方(fang)面(mian),另外相比 B200,采用 Instinct MI355X 的企业或开(kai)发者可获得 40% Tokens/$ 性价比优势。
谷川
具体来(lai)看,相较于 ROCm 6,ROCm 7 的 Llama 3.1 70B 提升了 3.2 倍(bei),Qwen2-72B 提升了 3.4 倍,DeepSeek R1 提升了(le) 3.8 倍。