最近,一款名為OpenClaw的開源AI智能體在科技圈掀起熱潮,被網(wǎng)友戲稱為“龍蝦”。這款智能體只需接收一條消息,便能接管用戶設(shè)備,自動完成查資料、寫代碼、調(diào)試和優(yōu)化等任務(wù),全程無需人工干預(yù)。然而,隨著越來越多人嘗試“飼養(yǎng)”這只AI“牛馬”,不少用戶發(fā)現(xiàn),它的使用成本遠(yuǎn)超預(yù)期,甚至有人調(diào)侃要為它支付“窩囊費(fèi)”。
根據(jù)API服務(wù)平臺OpenRouter的統(tǒng)計,OpenClaw已成為單月消耗Token最多的應(yīng)用,一個月內(nèi)燒掉的Token高達(dá)10.2萬億。這一數(shù)字背后,是用戶為AI服務(wù)支付的高昂費(fèi)用。Token作為大模型處理和生成文本的基本單位,類似于人類交流中的“字”或“詞”,但它的計算方式更為復(fù)雜。每發(fā)送一條指令,用戶都需要向模型廠商支付按Token計算的費(fèi)用,而OpenClaw由于依賴外部大模型API運(yùn)轉(zhuǎn),成本進(jìn)一步疊加。
Token的本質(zhì)是什么?簡單來說,它是大模型理解人類語言的“數(shù)字密碼”。當(dāng)用戶輸入一段文本時,系統(tǒng)會先將其拆分成子詞片段(Token),再將每個Token轉(zhuǎn)換為唯一的數(shù)字ID。例如,英文單詞“unstoppable”可能被拆分為“un”“##stop”“##able”三個Token,而中文“你好世界”則直接對應(yīng)四個獨(dú)立Token。這種分詞方式既保留了常用詞的完整性,又能通過子詞組合處理生僻詞,確保模型即使遇到未見過的新詞,也能通過部分子詞推測含義。
為何不直接按單詞或字母分詞?原因在于平衡效率與成本。若按單詞分詞,詞匯表會因新詞和拼寫錯誤無限膨脹,導(dǎo)致模型無法訓(xùn)練;若按字母分詞,Token序列過長且語義分散,模型難以學(xué)習(xí)有效信息。子詞分詞因此成為最優(yōu)解,但這也帶來一個問題:中文因信息密度高、難以拆分,通常比英文更費(fèi)Token。例如,英文平均1個Token約等于0.75個單詞,而中文1個漢字可能對應(yīng)1-2個Token,直接推高了使用成本。
對于普通用戶而言,Token費(fèi)用是繞不開的現(xiàn)實問題。主流大模型API均按輸入和輸出的Token總數(shù)計費(fèi),且輸出Token通常更貴,因其生成內(nèi)容的計算成本更高。而OpenClaw這類自主智能體的“燒錢”速度遠(yuǎn)超傳統(tǒng)對話模型。傳統(tǒng)模型一次對話可能消耗幾千至幾萬Token,但OpenClaw需要拆解目標(biāo)、規(guī)劃步驟、調(diào)用工具、檢查結(jié)果,每一步都在消耗Token。更棘手的是,它的“記憶膨脹”問題會導(dǎo)致Token消耗持續(xù)攀升,若不及時清理歷史記錄,成本還會進(jìn)一步增加。
據(jù)IDC預(yù)測,到2030年,全球活躍AI智能體將達(dá)22.16億,年度Token消耗量將從2025年的0.0005 PetaTokens飆升至15.2萬PetaTokens,增長超3億倍。這意味著,當(dāng)前的高成本可能只是AI普及初期的“幼年期”現(xiàn)象,未來用戶需為智能體支付的費(fèi)用或?qū)⒊掷m(xù)攀升。
面對這一趨勢,普通人如何避免被Token賬單“背刺”?專家建議可從六方面入手:一是精簡提示詞,用簡潔指令替代冗長描述;二是限定輸出長度,避免模型生成無用內(nèi)容;三是及時開啟新對話,防止模型讀取無關(guān)歷史記錄;四是根據(jù)任務(wù)復(fù)雜度選擇合適模型,避免過度使用高端服務(wù);五是保護(hù)好API密鑰,防止盜刷導(dǎo)致額外費(fèi)用;六是建立高危操作確認(rèn)機(jī)制,避免智能體因權(quán)限失控造成資源浪費(fèi)。Token作為AI時代的“通用貨幣”,既衡量著模型的智能水平,也考驗著用戶的管理智慧。















