帖子
Zyphra发布首个MI355X推理评测:长文本直逼B200

币界网消息,Zyphra发布了基于AMD旗舰芯片MI355X的端到端大模型推理实测,测试在真实单节点环境下运行DeepSeek V3.2、Kimi K2.6与GLM-5.1,并对标NVIDIA B200。实测显示,AMD的288GB显存远超B200的180GB,使其在处理超长文本时能更高效地利用缓存,降低硬件成本。然而,AMD在芯片间互联上处于劣势,B200通过NVLink交换机实现900GB/s带宽,而MI355X采用点对点直连,通信效率较低。为弥补这一短板,Zyphra开发了张量序列并行(TSP)与树状注意力(Tree Attention)算法。最终结果显示,尽管在单请求速度上NVIDIA B200仍领先,但在长文本场景下,Zyphra推理栈的吞吐量逐渐逼近B200,证明AMD在长文本生产环境中具备竞争力。
相关快讯
美国货币政策背景利好美元,加息预期支撑美元指数
Strive 斥资 3030 万美元增持 382 枚比特币
Pump Fun将启用USDC配对,影响SOL生态资金流
Web3 用户生成内容平台 Tomoland 完成 200 万美元融资,Sky9 Capital 领投
数据:贝莱德向 Coinbase 存入了 5,847 个比特币,价值 4.4952 亿美元
渣打银行计划2030年前裁减超7000个岗位
嘉楠科技发布2026年Q1财报:总收入6270万美元
Hyperliquid巨鲸:HYPE上扬引巨鲸追涨,Hyperliquid未来24小时TWAP净买盘力量达280万美元
VanEck:数字信贷市场未来十年或达 2.5 万亿美元,BTC 有望达 100 万美元
X上线“活跃粉丝”功能,可查看 24 小时真实活跃用户数


