欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

Claude刷爆5億,一夜?jié)q60倍,你的Token賬單還撐得?。?/h1>
大廠動(dòng)態(tài)
06-02 14:05

Claude賬號(hào)忘設(shè)上限,一月燒光近5億美元!開(kāi)發(fā)者每月花費(fèi)從29美元變750美元,還有的從50美元一路狂飆到3000美元:你的Token賬單還撐得住嗎?

1個(gè)月燒出5億美元賬單!

 

近日,科技圈曝出一樁驚天烏龍。據(jù)Axios報(bào)道,一家企業(yè)在短短1個(gè)月內(nèi),竟然在Claude上刷爆5億美元!

 

原因令人哭笑不得:管理層在給員工開(kāi)通Claude賬號(hào)權(quán)限時(shí),忘了設(shè)置使用額度上限。

 

 

其實(shí),AI賬單爆倉(cāng)的遠(yuǎn)不止這一家。

 

今年4月,一名谷歌云用戶因公開(kāi)服務(wù)中遺留的API key被濫用,原本只有7美元預(yù)算的賬戶,一夜之間收到了1.8萬(wàn)美元的賬單。

 

 

這個(gè)倒霉用戶名叫Jesse Davies,是一名澳大利亞AI顧問(wèn)、Agentic Labs創(chuàng)始人。他給自己的Google Cloud賬戶設(shè)了兩道保險(xiǎn):一個(gè)10澳元(約7美元)的預(yù)算預(yù)警,一個(gè)1400美元的硬性消費(fèi)上限。

 

據(jù)Tom's Hardware報(bào)道,攻擊者發(fā)現(xiàn)了他幾個(gè)月前從AI Studio發(fā)布的一個(gè)Cloud Run服務(wù),發(fā)了6萬(wàn)多個(gè)請(qǐng)求,兩道保險(xiǎn)都沒(méi)攔住:賬單計(jì)算有延遲,等系統(tǒng)反應(yīng)過(guò)來(lái),金額已經(jīng)飆到了1.8萬(wàn)美元。

 

5月中旬,開(kāi)源項(xiàng)目OpenClaw的創(chuàng)始人Peter Steinberger在X上貼出一張截圖:30天,OpenAI API賬單130萬(wàn)美元。

 

 

他的團(tuán)隊(duì)只有三個(gè)人,但他們指揮的100個(gè)Codex智能體在并行跑:30天燒掉6030億個(gè)Token、跑出760萬(wàn)次請(qǐng)求。還好,這130萬(wàn)美元并非他自掏腰包。

 

Steinberger今年2月加入了OpenAI,這130萬(wàn)美元被當(dāng)作一次內(nèi)部實(shí)驗(yàn):

 

測(cè)試如果不考慮Token成本,AI編程能跑到什么極限。他補(bǔ)充道,這是Codex「Fast Mode」(高速檔計(jì)費(fèi))的結(jié)果,關(guān)掉之后大約30萬(wàn)美元。

 

 

更早一些,Uber的CTO Praveen Neppalli Naga也曾向The Information承認(rèn),公司4月份就把全年的Claude Code預(yù)算燒光了,他們的COO也公開(kāi)表示,AI成本越來(lái)越「難以自圓其說(shuō)」。

 

5億、130萬(wàn)、1.8萬(wàn),金額雖然差出幾個(gè)數(shù)量級(jí),卻指向同一個(gè)事實(shí):

 

在智能體時(shí)代,失控的密鑰、晝夜無(wú)休的智能體軍團(tuán)、忘了設(shè)上限的賬號(hào):任何一個(gè),都能讓你的Token賬單一夜刷爆。

 

AI賬單為什么會(huì)爆倉(cāng)?

 

答案主要藏在計(jì)費(fèi)方式的變化里。

 

從今年4月起,OpenAI的包月計(jì)費(fèi)方式開(kāi)始轉(zhuǎn)向按Token用量計(jì)費(fèi)。

 

4月2日,Codex計(jì)費(fèi)從按消息估算改成按Token用量對(duì)齊:輸入、緩存輸入、輸出三類Token分開(kāi)算。4月23日,這套規(guī)則擴(kuò)展到所有Enterprise、Edu、Health、Gov方案:月費(fèi)里那筆看不見(jiàn)的折扣被抽掉了。

 

GitHub也緊隨其后,剛剛官宣:所有Copilot套餐從2026年6月1日起,轉(zhuǎn)向按用量計(jì)費(fèi)。舊的高級(jí)請(qǐng)求邏輯作廢,換成AI額度,按輸入Token、輸出Token、緩存Token的實(shí)際消耗,對(duì)照每個(gè)模型的API費(fèi)率結(jié)算。

 

 

GitHub官方解釋了這么做的原因:

 

現(xiàn)在一個(gè)快速的聊天提問(wèn),和一次跑好幾小時(shí)的自主編碼任務(wù),用戶花的錢一樣多。GitHub一直在替那些跑重度任務(wù)的用戶買單,但這套模式已經(jīng)不可持續(xù)。

 

AI智能體崛起之前,聊天和補(bǔ)全成本差不多,月費(fèi)兜得住。

 

智能體崛起之后,一次任務(wù)能連續(xù)跑幾小時(shí)、改動(dòng)整個(gè)代碼庫(kù),重度用戶和輕度用戶的成本差可以拉到幾個(gè)數(shù)量級(jí)。月費(fèi)制在這種差距面前,直接崩了。

 

消息一出,Reddit和X上一片嘩然。

 

一位ID為JBusu的開(kāi)發(fā)者曬出了賬單截圖,直言新定價(jià)「就是個(gè)笑話」。原本28.12美元/月的開(kāi)銷,按新制要付746.01美元,他已決定退訂,「這個(gè)價(jià)格,我自己租云服務(wù)器都還便宜」。

 

 

 

另一名用戶截圖更夸張,費(fèi)用從50美元一路狂飆到3000美元,他說(shuō)沒(méi)想到定價(jià)這樣離譜,「還有人繼續(xù)訂閱嗎?」

 

 

不過(guò)也有Copilot老用戶出來(lái)反駁:這些極端賬單多半是vibe-coder(憑感覺(jué)編碼者)們不把燒Token當(dāng)回事給燒出來(lái)的,未必能代表正常使用。

 

一位老用戶在評(píng)論區(qū)留言:「我整天都在用,月底基本不超額,很難相信這是工作復(fù)雜度的差異。」另一位則更直接:「就是有人要全自動(dòng)的YOLO模式開(kāi)發(fā),讓AI隨便跑。這種浪費(fèi)被剔除,對(duì)其他人反而是好事。

 

有一點(diǎn)必須清楚:GitHub沒(méi)有廢除月費(fèi),基礎(chǔ)訂閱價(jià)格并沒(méi)有變。真正變的是額外用量、智能體任務(wù)、更貴的模型調(diào)用,從此進(jìn)入用量計(jì)費(fèi)。

 

被沖擊最大的,是那些靠Copilot跑長(zhǎng)鏈任務(wù)的重度智能體用戶。

 

被自己人玩壞的排行榜

 

月費(fèi)失守,一面是平臺(tái)改了計(jì)費(fèi)規(guī)則,另一面是用AI的人,自己也在拼命燒。

 

5月,Business Insider報(bào)道,Amazon下線了一個(gè)名叫KiroRank的內(nèi)部AI使用排行榜。

 

該報(bào)道援引知情人士的話稱,這個(gè)榜單悄悄催生了一種奇怪的工作方式:部分員工為了在榜單上多爬幾位,會(huì)去刷一些并不解決實(shí)際問(wèn)題的Token消耗,純粹為了排名。

 

 

事情曝出之后,Amazon高級(jí)副總裁Dave Treadwell直接向全員喊話:「別為了用AI而用AI。用它去解決客戶問(wèn)題,解決業(yè)務(wù)問(wèn)題,去創(chuàng)新?!?/strong>

 

這事雖然有點(diǎn)荒唐,但毫不意外。當(dāng)「燒Token」能上榜,員工自然就會(huì)去燒Token。

 

硅谷給這種現(xiàn)象起了個(gè)專門(mén)的名字:Tokenmaxxing(極限燒Token),把消耗量當(dāng)生產(chǎn)力。

 

Axios的報(bào)道里也提到,有CTO發(fā)現(xiàn)員工拿AI模型查天氣、寫(xiě)日常郵件,簡(jiǎn)單到不行的事,套上最貴的前沿模型,賬單就能悄無(wú)聲息地飛漲。

 

KiroRank并非Amazon官方考核體系,而是員工自發(fā)搭的非正式工具。但它清楚地暴露了一個(gè)經(jīng)典的管理學(xué)規(guī)律:當(dāng)KPI設(shè)錯(cuò)的時(shí)候,人就會(huì)用最聰明的方式鉆空子

 

把「用了多少」等同于「干得好不好」——這正是這一輪AI浪費(fèi)的制度性根源。

 

算Token賬的人,已經(jīng)在賺錢

 

Token賬單焦慮的另一面,有人悄悄把它做成了生意。

 

第一條路:用上下文喂飽AI。

 

Glean正是Arvind自家公司。它做的就是企業(yè)AI工作助手:把分散在公司各處的知識(shí)統(tǒng)一打通,讓員工的AI直接拿到上下文,不必再四處翻箱倒柜。AI少繞路,燒的Token自然就少。

 

這套機(jī)制讓Glean的年度營(yíng)收15個(gè)月翻三倍,跨過(guò)3億美元,客戶包括Databricks、Reddit、Samsung。

 

第二條路:把活分給對(duì)的模型。

 

模型路由初創(chuàng)公司Factory AI干的就是這件事:自動(dòng)把每個(gè)任務(wù)派給最合適的模型,簡(jiǎn)單任務(wù)走便宜檔,復(fù)雜任務(wù)走頂配。Arvind也講過(guò):路由做對(duì)了,能省10倍

 

這兩條路殊途同歸:讓AI干活,但別讓它亂燒

 

學(xué)術(shù)圈的研究,也在為這種轉(zhuǎn)向奠基。

 

 

https://arxiv.org/pdf/2604.22750

 

2026年4月的一篇arXiv論文,第一次系統(tǒng)拆解了智能體編碼任務(wù)到底怎么燒錢。

 

結(jié)論一:智能體任務(wù)的Token消耗,可達(dá)普通代碼推理和代碼對(duì)話的上千倍,推高成本的主因是輸入Token。

 

結(jié)論二:同一個(gè)任務(wù)跑多次,Token消耗能差出30倍。

 

結(jié)論三更高的Token消耗,并不必然帶來(lái)更高準(zhǔn)確率。精度往往在中等成本處見(jiàn)頂——再往上燒,錢花了,效果反而飽和。

 

論文還發(fā)現(xiàn),前沿模型連預(yù)測(cè)自己要燒多少Token都做不到,普遍低估真實(shí)成本。

 

你以為多花錢就能多辦事。實(shí)際是錢花了,活不一定更好,預(yù)算還算不準(zhǔn)。

 

當(dāng)AI賬單開(kāi)始趕超人力成本

 

「這是我記憶中第一次,技術(shù)成本開(kāi)始和人力成本持平?!?/p>

 

5月29日,Glean CEO Arvind Jain在接受CNBC記者Deirdre Bosa采訪時(shí)這樣講道。

 

 

英偉達(dá)應(yīng)用深度學(xué)習(xí)副總裁Bryan Catanzaro的觀察也印證了這一點(diǎn)。

 

他在Axios訪談里提到:對(duì)于他的團(tuán)隊(duì)來(lái)說(shuō),算力成本已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)員工薪資。

 

類似的現(xiàn)象正在多家公司浮現(xiàn):從做企業(yè)AI的Glean,到賣AI算力的英偉達(dá),再到用AI的Uber,都在重新審視這筆賬。

 

在Arvind看來(lái),歷史上技術(shù)只是企業(yè)整體成本里很小的一塊,但現(xiàn)在AI成本已經(jīng)能追平工資單了,很多企業(yè)的年度AI預(yù)算通常都是一到兩個(gè)月就燒光。

 

 

過(guò)去一年,AI使用率是被崇拜的指標(biāo):多用就是先進(jìn),燒Token就是擁抱未來(lái)?,F(xiàn)在,許多企業(yè)開(kāi)始反思那句樸素的話:這些燒掉的Token,到底換來(lái)了什么?

 

免費(fèi)包月暢用的窗口期,恰恰正在此時(shí)關(guān)上。

 

接下來(lái),擺在所有開(kāi)發(fā)者面前的是這樣一個(gè)問(wèn)題:如何精打細(xì)算,讓每一個(gè)Token發(fā)揮出最大價(jià)值。

 

未來(lái)真正的贏家,毫無(wú)疑問(wèn)將是最先學(xué)會(huì)算Token賬的那個(gè)。

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com