欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<rt id="ii4ay"></rt>

<menu id="ii4ay"></menu>

<li id="8eacp"></li>

<ruby id="8eacp"></ruby>

<span id="8eacp"><delect id="8eacp"><small id="8eacp"></small></delect></span>

GPT-5.5漲價(jià)翻倍，Gemini暴漲三倍：當(dāng)前AI漲價(jià)潮還能持續(xù)多久？

05-29 06:39

AI前沿大模型的這場(chǎng)漲價(jià)博弈，究竟還能走多遠(yuǎn)？

從今年一月開(kāi)始，全球GPU租賃價(jià)格漲幅已經(jīng)超過(guò)兩倍。

根據(jù)Counterpoint在今年2月推出的《內(nèi)存價(jià)格追蹤報(bào)告》數(shù)據(jù)，2026年第一季度至今，內(nèi)存價(jià)格環(huán)比上漲幅度已經(jīng)達(dá)到80%-90%，創(chuàng)下了歷史最大漲幅記錄。

上游成本的暴漲，已經(jīng)直接傳導(dǎo)到了AI行業(yè)的下游終端。

AI研究機(jī)構(gòu)Epoch AI最新發(fā)布的《梯度更新》報(bào)告做了一個(gè)直白測(cè)算：把全球所有Blackwell芯片的算力加總，算出能處理的Token總量，再和當(dāng)前市場(chǎng)的實(shí)際需求做比對(duì)。

最終結(jié)論很殘酷——供給完全跟不上需求。

暴漲的Token需求已經(jīng)吞噬了算力供給

先看供給端的情況。

Epoch AI的測(cè)算以Kimi K2.6大模型為基準(zhǔn)，該模型是擁有萬(wàn)億總參數(shù)、320億活躍參數(shù)的MoE架構(gòu)。

在輸入輸出比為8000:1000的標(biāo)準(zhǔn)場(chǎng)景下，全球所有Blackwell芯片集群的理論吞吐量極限，是每秒約200億輸出Token。

這個(gè)數(shù)字聽(tīng)起來(lái)很大？換算一下，相當(dāng)于全球每個(gè)人每月能分到700萬(wàn)Token。

但這只是理想場(chǎng)景下的理論值。如果把上下文窗口拉長(zhǎng)到現(xiàn)在常用的128k，Blackwell的吞吐量會(huì)直接暴跌50倍，降到每秒僅約5億輸出Token。

再來(lái)看需求端。

Google不久前披露，自家產(chǎn)品現(xiàn)在每秒就要處理約12億Token（包含輸入+輸出）。

按照行業(yè)常見(jiàn)的8k輸入對(duì)應(yīng)1k輸出的請(qǐng)求比例換算，Google每秒的輸出Token需求約為1.3億。Exponential View估算，Google的需求大約占全球總Token需求的25%。

也就是說(shuō)，以現(xiàn)在的需求來(lái)看，把全球所有Blackwell芯片全產(chǎn)能拉滿(mǎn)，全部用來(lái)跑大模型，也只是剛好能勉強(qiáng)撐住。

那需求現(xiàn)在的增長(zhǎng)速度是多少呢？

每年10倍。

從2024年開(kāi)始，Google處理的Token量每年增長(zhǎng)10倍，其他AI服務(wù)商的增長(zhǎng)速度也基本和這個(gè)水平一致。

反觀供給側(cè)呢？全球AI算力每年只增長(zhǎng)3.4倍，芯片內(nèi)存帶寬的年增速也只有4.1倍。

供給年增3.4倍對(duì)上需求年增10倍，供需缺口每年都在被越拉越大。

Meta員工日均消耗百萬(wàn)Token，企業(yè)端需求已經(jīng)爆炸

算力緊缺從來(lái)不是抽象的數(shù)字，已經(jīng)真實(shí)發(fā)生在企業(yè)日常運(yùn)營(yíng)中。

看看頭部科技公司內(nèi)部的情況就知道了。

The Information報(bào)道顯示，Meta的8.5萬(wàn)名員工，每個(gè)月就要消耗掉60萬(wàn)億Token。

換算下來(lái)，Meta每一位員工平均每天就要燒掉約100萬(wàn)輸出Token。

Apple的消耗規(guī)模更驚人。

Apple部分工程團(tuán)隊(duì)，每天的Token使用預(yù)算就高達(dá)300美元——按照Kimi K2.6的定價(jià)計(jì)算，這筆錢(qián)足夠一個(gè)人生成2500萬(wàn)輸出Token。

這還只是兩家頭部公司的消耗。

現(xiàn)在全球大約有1400萬(wàn)軟件工程師每天都在使用AI工具。

如果所有工程師的使用強(qiáng)度都達(dá)到Meta或者Apple員工的水平，全球Token吞吐需求將會(huì)直接飆升到每秒2億到40億Token。

40億的需求，對(duì)比Blackwell在長(zhǎng)上下文場(chǎng)景下5億每秒的極限供給，差了整整一個(gè)數(shù)量級(jí)。

漲價(jià)持續(xù)，但增長(zhǎng)開(kāi)始放緩

更值得玩味的變化已經(jīng)出現(xiàn)。

METR最新研究結(jié)果顯示，Claude Code在實(shí)際開(kāi)發(fā)測(cè)試中，反而讓資深開(kāi)發(fā)者的任務(wù)完成速度變慢了19%。

同時(shí)，VS Code相關(guān)AI編碼插件的安裝增速，從今年年初開(kāi)始就已經(jīng)明顯放緩。

編碼AI工具增長(zhǎng)放緩，背后其實(shí)是兩個(gè)因素的疊加：一方面是算力資源本身已經(jīng)捉襟見(jiàn)肘，另一方面很多企業(yè)今年的AI預(yù)算已經(jīng)提前花完。

和增長(zhǎng)放緩形成鮮明對(duì)比的，是前沿大模型的一輪接一輪漲價(jià)：ChatGPT Pro上調(diào)訂閱價(jià)格，Claude API價(jià)格持續(xù)上漲，Gemini的漲幅最夸張，部分場(chǎng)景價(jià)格直接暴漲3倍，GPT-5.5的定價(jià)更是直接翻倍。

現(xiàn)在企業(yè)用AI，用量越來(lái)越大、花費(fèi)越來(lái)越高，但獲得的效果卻不一定能跟上成本漲幅，這筆賬企業(yè)很快就算明白了。

高性?xún)r(jià)比替代方案成新選擇，前沿模型定價(jià)權(quán)動(dòng)搖

市場(chǎng)已經(jīng)出現(xiàn)了新的分流路線，很多企業(yè)開(kāi)始轉(zhuǎn)向高性?xún)r(jià)比的替代方案。

DeepSeek V3的訓(xùn)練成本只有頭部前沿模型的1/10到1/20，API價(jià)格更是低到同類(lèi)前沿產(chǎn)品的1/16。

那性能呢？DeepSeek V3的實(shí)際表現(xiàn)已經(jīng)逼近GPT-5的水平。

國(guó)外技術(shù)社區(qū)Hacker News上有一個(gè)熱門(mén)帖子，創(chuàng)作者做了一個(gè)11個(gè)月回本的投資回報(bào)模型，幫企業(yè)算清楚：從GPT-5.5切換到DeepSeek，每年能省下多少成本。

評(píng)論區(qū)的開(kāi)發(fā)者和企業(yè)管理者形成了一個(gè)共識(shí)：前沿大模型的定價(jià)權(quán)正在逐步崩塌。

當(dāng)一個(gè)高性?xún)r(jià)比模型只用1/16的價(jià)格，就能跑出頭部模型90%的效果，漲價(jià)對(duì)頭部模型來(lái)說(shuō)就不再是利潤(rùn)增長(zhǎng)的手段，反而會(huì)變成加速客戶(hù)流失的推手。

本來(lái)，「企業(yè)不斷增加Token用量榨取AI價(jià)值」是前沿大模型廠商的核心增長(zhǎng)邏輯，但現(xiàn)在The Information的報(bào)道顯示，這種增長(zhǎng)邏輯已經(jīng)開(kāi)始反噬AI廠商自身的利潤(rùn)空間。

用戶(hù)越多，虧損越多；靠漲價(jià)止血，用戶(hù)就會(huì)流向替代方案。這已經(jīng)形成了典型的死亡螺旋。

AI行業(yè)走到算力經(jīng)濟(jì)懸崖邊，格局正在重塑

把視角拉遠(yuǎn)來(lái)看整個(gè)行業(yè)。

當(dāng)前全球的AI算力里，OpenAI、Anthropic、Google DeepMind這些頂級(jí)前沿實(shí)驗(yàn)室，只占據(jù)了20%-30%的份額。

剩下70%-80%的算力，都掌握在企業(yè)自用算力、云服務(wù)商、推理服務(wù)商手里。

這也就意味著，哪怕是最頂級(jí)的AI實(shí)驗(yàn)室，也沒(méi)辦法靠自建算力填滿(mǎn)供需缺口，它們和所有參與者一樣，都在搶同一批芯片產(chǎn)能。

算力年增3.4倍，需求年增10倍，這個(gè)供需剪刀差不會(huì)自動(dòng)消失。

確實(shí)，小模型已經(jīng)在替代一部分市場(chǎng)需求，蒸餾模型生態(tài)的崛起就能證明這一點(diǎn)，但模型能力提升又在不斷催生新的更大需求，缺口依然無(wú)法填補(bǔ)。

現(xiàn)在整個(gè)AI行業(yè)其實(shí)已經(jīng)站在了懸崖邊上，這不是技術(shù)能力的懸崖——大模型的能力還在不斷變強(qiáng)，這是經(jīng)濟(jì)模型的懸崖，現(xiàn)在的商業(yè)邏輯已經(jīng)算不通了。

當(dāng)GPU租金翻倍上漲、API價(jià)格接連暴漲、開(kāi)源高性?xún)r(jià)比替代品性能逼近頭部、企業(yè)開(kāi)始質(zhì)疑AI編碼工具的投資回報(bào)，一個(gè)核心問(wèn)題已經(jīng)被拋到了行業(yè)面前：

前沿大模型的核心護(hù)城河，到底是模型本身的智能，還是堆出來(lái)的算力？

如果答案是算力，那么控制芯片產(chǎn)能的玩家，就能掌控AI的未來(lái)；如果答案是模型智能，那么DeepSeek用1/16的成本就能逼近同等效果，已經(jīng)動(dòng)搖了這個(gè)結(jié)論。

參考資料：

https://counterpointresearch.com/en/insights/Memory-Prices-Surge-Up-to-90-From-Q4-2025

https://www.signalbloom.ai/posts/outsourcing-plus-localai-will-soon-become-more-economical-vs-frontier-labs/https://news.ycombinator.com/item?id=48278610

本文來(lái)自微信公眾號(hào)“新智元”，作者：ASI啟示錄；編輯：大衛(wèi)，36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

劉強(qiáng)東最新內(nèi)部講話：京東啟動(dòng)涅槃項(xiàng)目，被機(jī)器替代的一線員工一個(gè)都不裁

全國(guó)首個(gè)！聆動(dòng)通用工業(yè)級(jí)具身智能機(jī)器人拿下CR認(rèn)證，創(chuàng)行業(yè)新里程碑

算力重構(gòu)能源格局：AIDC儲(chǔ)能全球發(fā)展分析與中國(guó)發(fā)展機(jī)遇

Costco開(kāi)市客登陸京東：雙軌會(huì)員制能適應(yīng)中國(guó)市場(chǎng)嗎？

盒馬輿情頻發(fā)引反思：嚴(yán)筱磊不妨向胖東來(lái)于東來(lái)學(xué)習(xí)

項(xiàng)目推薦

康小虎 · 健康小屋

康老板 · 氧療堂

<rt id="xxpit"><progress id="xxpit"></progress></rt>

<rt id="xxpit"></rt>