欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

純Python開(kāi)源Hermes首次擊敗OpenAI Codex,解釋型語(yǔ)言實(shí)現(xiàn)逆襲

05-28 06:33

一個(gè)完全由Python編寫(xiě)的開(kāi)源項(xiàng)目,居然打敗了OpenAI用Rust開(kāi)發(fā)的王牌產(chǎn)品!最終對(duì)決比分6比5,Hermes用實(shí)打?qū)嵉墓こ虄?yōu)化上演逆襲,一直被詬病性能偏弱的解釋型語(yǔ)言,這次終于實(shí)現(xiàn)了突破。


一個(gè)純Python開(kāi)源項(xiàng)目擊潰OpenAI王牌產(chǎn)品的消息,今天直接刷爆了整個(gè)科技圈:


在針對(duì)真實(shí)場(chǎng)景命令行任務(wù)的11項(xiàng)基準(zhǔn)測(cè)試中,Hermes Agent以6:5的比分,成功超越了OpenAI的Codex。



在這場(chǎng)對(duì)比測(cè)試中,Hermes Agent展現(xiàn)出了非常驚艷的底層優(yōu)化能力。


通過(guò)一系列精準(zhǔn)的工程調(diào)整,它成功把項(xiàng)目啟動(dòng)時(shí)間從原本的701ms壓縮到了258ms。



更讓業(yè)內(nèi)意外的是,Hermes全程采用純Python開(kāi)發(fā),而Codex則是性能優(yōu)勢(shì)顯著的Rust編寫(xiě)。


這一次,Python贏了Rust!


在編程領(lǐng)域,這絕對(duì)算得上是一次顛覆性的突破。




三項(xiàng)工程優(yōu)化,砍掉63%啟動(dòng)耗時(shí)


在這次優(yōu)化之前,Hermes對(duì)Codex的戰(zhàn)績(jī)還是5勝6負(fù)處于下風(fēng)。


這次的逆轉(zhuǎn)既沒(méi)有更換大模型,也沒(méi)有堆砌額外算力,完全依靠三個(gè)純工程層面的優(yōu)化實(shí)現(xiàn),每一步都精準(zhǔn)命中了性能瓶頸。



我們來(lái)看看這些優(yōu)化具體是怎么實(shí)現(xiàn)的:


第一步:新增Bitwarden磁盤(pán)緩存


優(yōu)化前Hermes每次啟動(dòng),都需要調(diào)用Bitwarden Secrets Manager的API拉取憑據(jù),單次就需要消耗380毫秒。


之前的緩存只存在于進(jìn)程內(nèi)部,哪怕連續(xù)兩次執(zhí)行hermes chat -q命令,第二次啟動(dòng)仍然需要重新拉取憑據(jù),造成了大量不必要的耗時(shí)。


開(kāi)發(fā)團(tuán)隊(duì)給出的解決方案,就是新增二級(jí)磁盤(pán)緩存。


緩存文件權(quán)限設(shè)置為最安全的0600,存放在/cache/bws_cache.json路徑下,默認(rèn)有效期為300秒。


另外,訪問(wèn)令牌本身不會(huì)寫(xiě)入磁盤(pán),同樣默認(rèn)300秒有效期,過(guò)期后才會(huì)重新拉取。


這一步優(yōu)化,直接砍掉了380毫秒的啟動(dòng)耗時(shí)。



第二步:模型目錄延遲加載


hermes_cli.models._PROVIDER_MODELS是一個(gè)存儲(chǔ)了所有AI服務(wù)商模型信息的大型字典。


優(yōu)化前這個(gè)字典會(huì)在模塊加載階段就提前導(dǎo)入,直接占用了約55毫秒的啟動(dòng)時(shí)間。


但實(shí)際上,只有和model_flow相關(guān)的處理函數(shù)才會(huì)用到這個(gè)字典。


開(kāi)發(fā)團(tuán)隊(duì)借助PEP 562規(guī)范的模塊級(jí)getattr實(shí)現(xiàn)了懶加載,只有當(dāng)真正需要訪問(wèn)模型目錄的時(shí)候,才會(huì)執(zhí)行導(dǎo)入操作。


這一步,又節(jié)省了55毫秒。


第三步:配置文件讀取去重


優(yōu)化前main.py文件開(kāi)頭,重復(fù)讀取了兩次config.yaml配置文件。


第一次調(diào)用yaml.safe_load是為了實(shí)現(xiàn)密鑰脫敏橋接,第二次調(diào)用完整的load_config()方法(包含深度合并邏輯)僅僅是為了讀取一個(gè)布爾值。


開(kāi)發(fā)團(tuán)隊(duì)把兩次讀取合并為一次,又省下了17毫秒。


三項(xiàng)優(yōu)化加起來(lái),Hermes的啟動(dòng)時(shí)間從701ms大幅降到258ms,降幅高達(dá)63%。


不得不說(shuō),這就是實(shí)打?qū)嵉墓こ虄?yōu)化美學(xué):依靠性能分析找到瓶頸,再一步步把冗余開(kāi)銷(xiāo)全部砍掉。



最終6:5,Hermes成功實(shí)現(xiàn)翻盤(pán)

測(cè)試結(jié)果不會(huì)說(shuō)謊,優(yōu)化前后的表現(xiàn)對(duì)比非常明顯。


優(yōu)化之前,Hermes對(duì)陣Codex的總戰(zhàn)績(jī)是5勝6負(fù):?jiǎn)屋喨蝿?wù)被Codex壓制,多輪任務(wù)雖然略占優(yōu)勢(shì),但優(yōu)勢(shì)并不突出。


完成優(yōu)化之后,整個(gè)局面徹底反轉(zhuǎn)。


單輪任務(wù)(共8項(xiàng)):Hermes的中位框架開(kāi)銷(xiāo)降到了和Codex持平,甚至部分場(chǎng)景還要更低。原本被Codex拉開(kāi)差距的啟動(dòng)劣勢(shì),被徹底抹平。


多輪任務(wù)(共3項(xiàng)):優(yōu)化前Hermes在5輪對(duì)話(huà)的總開(kāi)銷(xiāo)上就已經(jīng)領(lǐng)先,優(yōu)化完成后優(yōu)勢(shì)進(jìn)一步擴(kuò)大。



最終總比分定格在6:5,Hermes成功實(shí)現(xiàn)反超。


這意味著,一個(gè)純Python編寫(xiě)的開(kāi)源項(xiàng)目,在框架開(kāi)銷(xiāo)——這個(gè)最考驗(yàn)底層開(kāi)發(fā)功力的維度,擊敗了用Rust編寫(xiě)、背靠萬(wàn)億市值科技公司的閉源產(chǎn)品。



Python憑什么贏下Rust?


這件事最反常識(shí)的點(diǎn)就是:Python怎么可能贏過(guò)Rust?


長(zhǎng)期以來(lái),Python在性能討論中幾乎一直處于弱勢(shì):解釋型語(yǔ)言、GIL全局鎖、動(dòng)態(tài)類(lèi)型開(kāi)銷(xiāo)……種種標(biāo)簽都讓大家默認(rèn)它性能不如編譯型語(yǔ)言。


當(dāng)初OpenAI選擇用Rust開(kāi)發(fā)Codex CLI的時(shí)候,業(yè)內(nèi)所有人都覺(jué)得順理成章——Rust本身就是為高性能設(shè)計(jì)的。



但Hermes這次逆襲,恰恰說(shuō)明了一個(gè)關(guān)鍵結(jié)論:在AI Agent賽道,框架層面的架構(gòu)選擇,比編程語(yǔ)言本身的原始性能更加重要。


開(kāi)發(fā)者netrunner的評(píng)論一針見(jiàn)血:「Python在多輪任務(wù)上打贏Rust,本質(zhì)上是架構(gòu)決策的勝利,而不是語(yǔ)言速度的勝利」,他還補(bǔ)充道「Codex很可能在上下文處理環(huán)節(jié),做了過(guò)度工程化的設(shè)計(jì)」。



有不少人提出疑問(wèn):「為什么不把Hermes也遷移到Rust?那樣不是更快嗎?」


Hermes聯(lián)合創(chuàng)始人兼首席科學(xué)家Teknium給出的回答非常直接:「那樣就沒(méi)法快速編輯代碼,也沒(méi)辦法做實(shí)時(shí)改進(jìn)和迭代了」。


換句話(huà)說(shuō),Python的核心優(yōu)勢(shì)本身就不是速度,而是靈活易用、快速迭代。



對(duì)于需要持續(xù)進(jìn)化、能從每次交互中學(xué)習(xí)的AI Agent來(lái)說(shuō),對(duì)開(kāi)發(fā)者友好的特性和快速迭代能力,本身就是最大的優(yōu)勢(shì)。


上線(xiàn)三月星標(biāo)破16萬(wàn),硬剛巨頭的開(kāi)源項(xiàng)目


Hermes Agent的增長(zhǎng)速度本身就足夠驚人:從2026年2月25日上線(xiàn)到現(xiàn)在,僅僅過(guò)去三個(gè)月,GitHub星標(biāo)就已經(jīng)突破16.7萬(wàn)。


日活Token消耗量達(dá)到3530億,接近同類(lèi)項(xiàng)目OpenClaw的兩倍。可以說(shuō),它是2026年增長(zhǎng)速度最快的開(kāi)源Agent框架,沒(méi)有之一。



GitHub開(kāi)源地址:https://github.com/nousresearch/hermes-agent


Hermes的核心優(yōu)勢(shì),是一套閉環(huán)自主學(xué)習(xí)架構(gòu):


每次完成復(fù)雜任務(wù)之后,Agent都會(huì)自動(dòng)把解決方案提煉成可以重復(fù)使用的Skill技能。下次遇到同類(lèi)任務(wù),直接調(diào)用已有技能即可,不需要從頭開(kāi)始推理。


NousResearch內(nèi)部基準(zhǔn)測(cè)試顯示:當(dāng)Hermes積累了20個(gè)以上自主生成的技能后,完成同類(lèi)任務(wù)的速度比全新實(shí)例快40%。



更驚艷的是v0.12版本新增的自治Curator模塊:這是一個(gè)在后臺(tái)自動(dòng)運(yùn)行的Agent,會(huì)定期對(duì)技能庫(kù)進(jìn)行評(píng)分、修剪和合并。


換句話(huà)說(shuō),Hermes不光能自主學(xué)習(xí)技能,還能自己整理歸納學(xué)到的內(nèi)容,不斷優(yōu)化自身技能庫(kù)。


編程語(yǔ)言不是天花板,架構(gòu)才是


Python贏了Rust這件事,看起來(lái)像是編程語(yǔ)言之間的逆襲爽文,但它背后揭示的道理其實(shí)更加深刻。


在AI Agent領(lǐng)域,底層編程語(yǔ)言的性能差異,其實(shí)已經(jīng)變得越來(lái)越不重要。


Hermes這次優(yōu)化總共擠出了443毫秒,已經(jīng)是框架層面能做到的極限了。而一次大語(yǔ)言模型調(diào)用的延遲,動(dòng)輒就是幾百毫秒甚至好幾秒。


這意味著,在通向通用人工智能的路上,真正的核心競(jìng)爭(zhēng)從來(lái)都不是「用什么語(yǔ)言寫(xiě)」,而是「怎么讓Agent越用越聰明」。


而Hermes這次用純Python干翻Rust開(kāi)發(fā)的Codex,恰恰證明了一件事:在Agent進(jìn)化的賽道上,開(kāi)放、可編輯、可快速迭代的架構(gòu),比「跑得更快」更接近通用人工智能的本質(zhì)需求。


Rust確實(shí)是一款性能優(yōu)秀的工具,但通用人工智能需要的,從來(lái)都不只是一把更快的刀。


參考資料:


https://x.com/Teknium/status/2058885472513065471?s=20


https://github.com/NousResearch/hermes-agent/pull/31968


本文來(lái)自微信公眾號(hào)“新智元”,作者:ASI啟示錄,編輯:桃子 David,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com