帖子
Zyphra发布首个MI355X推理评测:长文本直逼B200

币界网消息,Zyphra发布了基于AMD旗舰芯片MI355X的端到端大模型推理实测,测试在真实单节点环境下运行DeepSeek V3.2、Kimi K2.6与GLM-5.1,并对标NVIDIA B200。实测显示,AMD的288GB显存远超B200的180GB,使其在处理超长文本时能更高效地利用缓存,降低硬件成本。然而,AMD在芯片间互联上处于劣势,B200通过NVLink交换机实现900GB/s带宽,而MI355X采用点对点直连,通信效率较低。为弥补这一短板,Zyphra开发了张量序列并行(TSP)与树状注意力(Tree Attention)算法。最终结果显示,尽管在单请求速度上NVIDIA B200仍领先,但在长文本场景下,Zyphra推理栈的吞吐量逐渐逼近B200,证明AMD在长文本生产环境中具备竞争力。
相关快讯
美国股指期货小幅走低,半导体股持续下跌
Bitget钱包新增130种Xstocks代币化股票
机构:AI 数据中心需求或推动比特币矿企重估,已宣布超 900 亿美元合作
戴尔联手Palantir推出本地AI操作系统:底层存储替换Ceph,直接瞄准国防与核心银行
亚德诺拟15亿美元收购Empower,硬刚英伟达供应商MPS
WEEX Labs:AI 与金融板块共振走强,美股风险偏好持续回暖
美股收盘三大股指涨跌不一,理想汽车跌近 10%
Ondo:代币化股票 TVL 突破 15 亿美元,头部资产集中度约 25%
前 OpenAI 研究员 Aschenbrenner 大举押注比特币矿企,同时做空英伟达与 AMD
美股三大指数转跌,美光科技跌近 3%


