蘇姿豐,投了只賣AMD算力的AI獨角獸
估值至少達到341億元。
芯東西5月20日消息,據(jù)《福布斯》昨日報道,美國AI模型開發(fā)商Zyphra正在進行5億美元(約合人民幣34億元)的新一輪融資,美國芯片巨頭AMD也參與了投資。消息人士稱,Zyphra的估值將至少達到50億美元(約合人民幣341億元)。
Zyphra成立于2020年,開發(fā)先進的開源AI模型,并提供云基礎(chǔ)設(shè)施服務(wù)。大多數(shù)AI實驗室默認(rèn)采用英偉達芯片,而Zyphra卻完全站在AMD派系,其模型的訓(xùn)練和推理均在AMD硬件上運行,這既節(jié)省了成本,又帶來了供應(yīng)鏈優(yōu)勢。
Zyphra Cloud是一個由AMD提供技術(shù)支持的全棧式新云平臺,專為AI原生初創(chuàng)公司、企業(yè)和前沿AI超大規(guī)模數(shù)據(jù)中心而設(shè)計。
該平臺最初基于AMD MI355X GPU,支持領(lǐng)先的開源模型的無服務(wù)器推理,現(xiàn)已擴展到裸機AMD基礎(chǔ)設(shè)施,提供兩種主要部署模式:按需部署的裸機GPU集群,適用于靈活的工作負(fù)載;以及定制化的超大規(guī)模AMD基礎(chǔ)設(shè)施,適用于大規(guī)模訓(xùn)練和推理部署。
目前,MI355的15兆瓦容量已投入使用。
Zyphra Cloud中,Zyphra Inference推理云提供生產(chǎn)級模型服務(wù),專為大型MoE模型和具有長上下文以及大型KV和prefix cache的長時間運行的代理工作負(fù)載而設(shè)計,由MI355X GPU和TensorWave合作提供支持,可處理包括Kimi-K2.6、DeepSeek-V3.2、GLM-5.1等先進開源模型。其模型服務(wù)價格如下:

昨日,Zyphra預(yù)告將發(fā)布其基于MI355X的推理的首個端到端基準(zhǔn)測試結(jié)果,并稱其推理優(yōu)化顯著優(yōu)于AMD基線,并縮小了MI355X和B200在運行Kimi K2.6、GLM-5.1、DeepSeek-V3.2等模型時的性能差距。
其優(yōu)化包括:
樹狀注意力:用于長上下文注意力的平衡樹狀簡化
TSP:在節(jié)點內(nèi)部鏈路上保持模型并行組
跨內(nèi)核、HIP圖、RCCL進行調(diào)優(yōu)
EAGLE推測性解碼針對ROCm進行了調(diào)整

更長的上下文時間能更好地發(fā)揮其優(yōu)勢。隨著上下文時間的增加,TSP和樹狀注意力機制能夠帶來更大的性能提升,從而縮小與B200的差距。在單請求解碼和TTFT方面,B200當(dāng)前仍領(lǐng)先于Zyphra的技術(shù)棧和AMD基線,但Zyphra看到了縮小差距的途徑。

Zyphra解釋了為什么選擇MI355X:每個GPU配備288GB HBM3E,而B200則配備180GB,這意味著更多的駐留KV和prefix cache、更大的模型、更長的上下文,實現(xiàn)更低的延遲和更高的吞吐量。

相比B200,MI355X的單節(jié)點HBM內(nèi)存預(yù)算在GLM 5.1、DeepSeek-V3.2和DeepSeek-V4-Pro(即將推出)上大約翻了一番。

接下來,Zyphra計劃支持DeepSeek-V4-Pro,擴展到1.6T參數(shù)和1M上下文、訓(xùn)練信息量化、基于擴散的推測器,以及服務(wù)引擎方面的工作。
該公司還計劃將支持范圍擴展至下一代AMD平臺,包括MI450系列及后續(xù)產(chǎn)品。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com






