才几天没干就痒了
而在和上一代 MI300X 的对比中,MI355X 运行 Llama 3.1 405B 模型,在 AI 智能体性能表现上是前者的 4.2 倍🥝,内容生成能力是上一代 MI300X 的 2.9 倍💗🍄,摘要能力是上一代的 3.8 倍,对话式人工智能表现则为 2.6 倍👞🍆🥭💘🥔。
(欢迎大家多多关照期海通行-投研点金小程序🥾👛,试运行阶段请多提宝贵意见阅)小程序注册登录🩰💓👙,后续会陆续有更多深度分析。附昨日视频:(当日视频可在关注小程序后较本报告时间稍晚可关注后收看)
久久cao
演讲中的经典语句🧄,如“你无法预见未来的点滴🍏👘🥬🥒🍆,只能回望时串联起过往”和“时间有限,别浪费在活成别人的样子上”🧅🥭💯🌽🥿,至今仍被广泛引用。
AMD Instinct MI355X GPU 在 AI 和高(gao)性能计算领域(yu)都有着出色的表(biao)现。据 AMD 的介绍,在与 NVIDIA B200 和 GB200 的(de)对比(bi)中,MI355X 的显存约为竞品(pin)的(de) 1.6 倍,内存带宽则基本持平。针对 FP64 和 FP32 运(yun)算,MI355X 的峰值性(xing)能领先优势达到了竞品的(de) 2 倍。对于 FP16 和(he) FP8 运算,其峰值性能与竞品相当或略有胜出(chu),而 FP6 的性能则也达到了(le)竞品 2 倍(bei)以上。此(ci)外,在 FP4 运算(suan)上,MI355X 与竞品的(de)峰值(zhi)性能相近。而在性价比(bi)方面,另外(wai)相比 B200,采用 Instinct MI355X 的企业或开发者可获(huo)得 40% Tokens/$ 性价比优(you)势。
才几天没干就痒了
具体来看👿🥑🍓,相较于 ROCm 6👜,ROCm 7 的 Llama 3.1 70B 提升了 3.2 倍🥝👚,Qwen2-72B 提升了 3.4 倍👙🍎,DeepSeek R1 提升了 3.8 倍。