GPT-5.5漲價(jià)翻倍,Gemini暴漲三倍:當(dāng)前AI漲價(jià)潮還能持續(xù)多久?
AI前沿大模型的這場(chǎng)漲價(jià)博弈,究竟還能走多遠(yuǎn)?
從今年一月開(kāi)始,全球GPU租賃價(jià)格漲幅已經(jīng)超過(guò)兩倍。

根據(jù)Counterpoint在今年2月推出的《內(nèi)存價(jià)格追蹤報(bào)告》數(shù)據(jù),2026年第一季度至今,內(nèi)存價(jià)格環(huán)比上漲幅度已經(jīng)達(dá)到80%-90%,創(chuàng)下了歷史最大漲幅記錄。

上游成本的暴漲,已經(jīng)直接傳導(dǎo)到了AI行業(yè)的下游終端。
AI研究機(jī)構(gòu)Epoch AI最新發(fā)布的《梯度更新》報(bào)告做了一個(gè)直白測(cè)算:把全球所有Blackwell芯片的算力加總,算出能處理的Token總量,再和當(dāng)前市場(chǎng)的實(shí)際需求做比對(duì)。
最終結(jié)論很殘酷——供給完全跟不上需求。
暴漲的Token需求已經(jīng)吞噬了算力供給
先看供給端的情況。
Epoch AI的測(cè)算以Kimi K2.6大模型為基準(zhǔn),該模型是擁有萬(wàn)億總參數(shù)、320億活躍參數(shù)的MoE架構(gòu)。

在輸入輸出比為8000:1000的標(biāo)準(zhǔn)場(chǎng)景下,全球所有Blackwell芯片集群的理論吞吐量極限,是每秒約200億輸出Token。
這個(gè)數(shù)字聽(tīng)起來(lái)很大?換算一下,相當(dāng)于全球每個(gè)人每月能分到700萬(wàn)Token。

但這只是理想場(chǎng)景下的理論值。如果把上下文窗口拉長(zhǎng)到現(xiàn)在常用的128k,Blackwell的吞吐量會(huì)直接暴跌50倍,降到每秒僅約5億輸出Token。
再來(lái)看需求端。
Google不久前披露,自家產(chǎn)品現(xiàn)在每秒就要處理約12億Token(包含輸入+輸出)。
按照行業(yè)常見(jiàn)的8k輸入對(duì)應(yīng)1k輸出的請(qǐng)求比例換算,Google每秒的輸出Token需求約為1.3億。Exponential View估算,Google的需求大約占全球總Token需求的25%。

也就是說(shuō),以現(xiàn)在的需求來(lái)看,把全球所有Blackwell芯片全產(chǎn)能拉滿(mǎn),全部用來(lái)跑大模型,也只是剛好能勉強(qiáng)撐住。
那需求現(xiàn)在的增長(zhǎng)速度是多少呢?
每年10倍。
從2024年開(kāi)始,Google處理的Token量每年增長(zhǎng)10倍,其他AI服務(wù)商的增長(zhǎng)速度也基本和這個(gè)水平一致。
反觀供給側(cè)呢?全球AI算力每年只增長(zhǎng)3.4倍,芯片內(nèi)存帶寬的年增速也只有4.1倍。

供給年增3.4倍對(duì)上需求年增10倍,供需缺口每年都在被越拉越大。
Meta員工日均消耗百萬(wàn)Token,企業(yè)端需求已經(jīng)爆炸
算力緊缺從來(lái)不是抽象的數(shù)字,已經(jīng)真實(shí)發(fā)生在企業(yè)日常運(yùn)營(yíng)中。
看看頭部科技公司內(nèi)部的情況就知道了。
The Information報(bào)道顯示,Meta的8.5萬(wàn)名員工,每個(gè)月就要消耗掉60萬(wàn)億Token。

換算下來(lái),Meta每一位員工平均每天就要燒掉約100萬(wàn)輸出Token。

Apple的消耗規(guī)模更驚人。
Apple部分工程團(tuán)隊(duì),每天的Token使用預(yù)算就高達(dá)300美元——按照Kimi K2.6的定價(jià)計(jì)算,這筆錢(qián)足夠一個(gè)人生成2500萬(wàn)輸出Token。

這還只是兩家頭部公司的消耗。
現(xiàn)在全球大約有1400萬(wàn)軟件工程師每天都在使用AI工具。
如果所有工程師的使用強(qiáng)度都達(dá)到Meta或者Apple員工的水平,全球Token吞吐需求將會(huì)直接飆升到每秒2億到40億Token。
40億的需求,對(duì)比Blackwell在長(zhǎng)上下文場(chǎng)景下5億每秒的極限供給,差了整整一個(gè)數(shù)量級(jí)。
漲價(jià)持續(xù),但增長(zhǎng)開(kāi)始放緩
更值得玩味的變化已經(jīng)出現(xiàn)。
METR最新研究結(jié)果顯示,Claude Code在實(shí)際開(kāi)發(fā)測(cè)試中,反而讓資深開(kāi)發(fā)者的任務(wù)完成速度變慢了19%。
同時(shí),VS Code相關(guān)AI編碼插件的安裝增速,從今年年初開(kāi)始就已經(jīng)明顯放緩。

編碼AI工具增長(zhǎng)放緩,背后其實(shí)是兩個(gè)因素的疊加:一方面是算力資源本身已經(jīng)捉襟見(jiàn)肘,另一方面很多企業(yè)今年的AI預(yù)算已經(jīng)提前花完。

和增長(zhǎng)放緩形成鮮明對(duì)比的,是前沿大模型的一輪接一輪漲價(jià):ChatGPT Pro上調(diào)訂閱價(jià)格,Claude API價(jià)格持續(xù)上漲,Gemini的漲幅最夸張,部分場(chǎng)景價(jià)格直接暴漲3倍,GPT-5.5的定價(jià)更是直接翻倍。

現(xiàn)在企業(yè)用AI,用量越來(lái)越大、花費(fèi)越來(lái)越高,但獲得的效果卻不一定能跟上成本漲幅,這筆賬企業(yè)很快就算明白了。
高性?xún)r(jià)比替代方案成新選擇,前沿模型定價(jià)權(quán)動(dòng)搖
市場(chǎng)已經(jīng)出現(xiàn)了新的分流路線,很多企業(yè)開(kāi)始轉(zhuǎn)向高性?xún)r(jià)比的替代方案。
DeepSeek V3的訓(xùn)練成本只有頭部前沿模型的1/10到1/20,API價(jià)格更是低到同類(lèi)前沿產(chǎn)品的1/16。

那性能呢?DeepSeek V3的實(shí)際表現(xiàn)已經(jīng)逼近GPT-5的水平。
國(guó)外技術(shù)社區(qū)Hacker News上有一個(gè)熱門(mén)帖子,創(chuàng)作者做了一個(gè)11個(gè)月回本的投資回報(bào)模型,幫企業(yè)算清楚:從GPT-5.5切換到DeepSeek,每年能省下多少成本。

評(píng)論區(qū)的開(kāi)發(fā)者和企業(yè)管理者形成了一個(gè)共識(shí):前沿大模型的定價(jià)權(quán)正在逐步崩塌。
當(dāng)一個(gè)高性?xún)r(jià)比模型只用1/16的價(jià)格,就能跑出頭部模型90%的效果,漲價(jià)對(duì)頭部模型來(lái)說(shuō)就不再是利潤(rùn)增長(zhǎng)的手段,反而會(huì)變成加速客戶(hù)流失的推手。
本來(lái),「企業(yè)不斷增加Token用量榨取AI價(jià)值」是前沿大模型廠商的核心增長(zhǎng)邏輯,但現(xiàn)在The Information的報(bào)道顯示,這種增長(zhǎng)邏輯已經(jīng)開(kāi)始反噬AI廠商自身的利潤(rùn)空間。
用戶(hù)越多,虧損越多;靠漲價(jià)止血,用戶(hù)就會(huì)流向替代方案。這已經(jīng)形成了典型的死亡螺旋。

AI行業(yè)走到算力經(jīng)濟(jì)懸崖邊,格局正在重塑
把視角拉遠(yuǎn)來(lái)看整個(gè)行業(yè)。
當(dāng)前全球的AI算力里,OpenAI、Anthropic、Google DeepMind這些頂級(jí)前沿實(shí)驗(yàn)室,只占據(jù)了20%-30%的份額。
剩下70%-80%的算力,都掌握在企業(yè)自用算力、云服務(wù)商、推理服務(wù)商手里。
這也就意味著,哪怕是最頂級(jí)的AI實(shí)驗(yàn)室,也沒(méi)辦法靠自建算力填滿(mǎn)供需缺口,它們和所有參與者一樣,都在搶同一批芯片產(chǎn)能。
算力年增3.4倍,需求年增10倍,這個(gè)供需剪刀差不會(huì)自動(dòng)消失。
確實(shí),小模型已經(jīng)在替代一部分市場(chǎng)需求,蒸餾模型生態(tài)的崛起就能證明這一點(diǎn),但模型能力提升又在不斷催生新的更大需求,缺口依然無(wú)法填補(bǔ)。
現(xiàn)在整個(gè)AI行業(yè)其實(shí)已經(jīng)站在了懸崖邊上,這不是技術(shù)能力的懸崖——大模型的能力還在不斷變強(qiáng),這是經(jīng)濟(jì)模型的懸崖,現(xiàn)在的商業(yè)邏輯已經(jīng)算不通了。
當(dāng)GPU租金翻倍上漲、API價(jià)格接連暴漲、開(kāi)源高性?xún)r(jià)比替代品性能逼近頭部、企業(yè)開(kāi)始質(zhì)疑AI編碼工具的投資回報(bào),一個(gè)核心問(wèn)題已經(jīng)被拋到了行業(yè)面前:
前沿大模型的核心護(hù)城河,到底是模型本身的智能,還是堆出來(lái)的算力?
如果答案是算力,那么控制芯片產(chǎn)能的玩家,就能掌控AI的未來(lái);如果答案是模型智能,那么DeepSeek用1/16的成本就能逼近同等效果,已經(jīng)動(dòng)搖了這個(gè)結(jié)論。
參考資料:
https://counterpointresearch.com/en/insights/Memory-Prices-Surge-Up-to-90-From-Q4-2025
https://www.signalbloom.ai/posts/outsourcing-plus-localai-will-soon-become-more-economical-vs-frontier-labs/https://news.ycombinator.com/item?id=48278610
本文來(lái)自微信公眾號(hào)“新智元”,作者:ASI啟示錄;編輯:大衛(wèi),36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com






