原文作者:深潮TechFlow
千呼萬喚始出來,Eliza 今天終於發布了它們的技術白皮書。
雖然我們常聽到許多AI Agent 是基於Eliza 開源框架製作,但Eliza 如何定義自己,在技術上一直都缺乏一個詳細且嚴肅的說明。
這份白皮書是一份很好的回答,對Eliza 如何讓 AI 與Web3 的深度融合、模組化的系統架構設計以及其作為開源框架的技術實現細節進行了描述。
白皮書由Shaw、多名Eliza Labs 成員和其他相關組織的技術人員一同撰寫,但由於白皮書涉及大量技術細節和專業概念,對一般讀者可能不太友善。
深潮TechFlow 對其進行了簡化和提煉,以求以通俗的語言,帶大家快速搞懂這份白皮書的內容。
1.為什麼要做Eliza ?
注意,小編認為思考的前提是劃定範圍--- 即在加密或Web3 領域,為什麼要做Eliza,而不是將該框架與更大範圍的類似AI 框架做對比。
順著這個思路,在科技白皮書的簡介和背景部分,其實對這個問題做了很好的回答:
在AI 與Web3 的交叉領域,一直存在著一個明顯的空白:缺乏一個能夠完美整合Web3 應用的代理框架。
具體來說,白皮書認為Web3 領域面臨三個主要的挑戰:
去中心化交易的複雜性隨著以太坊、Solana、BASE 等公鏈的蓬勃發展,在不同鏈上管理資產和執行交易變得越來越具有挑戰性。雖然市面上已有一些交易平台,但對於有客製化需求的中高階用戶來說,這些平台的基礎功能往往不夠用。
鏈上數據的價值挖掘區塊鏈上蘊含著海量的有價值訊息,從基礎的持幣地址變化、代幣價格、市值等指標,到更深層的鯨魚帳戶佔比、做市商風格等高級指標。如何有效地將這些複雜的數據轉化為有價值的洞察,是亟待解決的問題
社群媒體資訊的片段化對Web3 產業來說,Twitter、Discord、Farcaster 等社群平台是獲取資訊的重要管道。但隨著意見領袖(KOL)數量的增加,資訊變得越發碎片化,如何在資訊洪流中獲得有價值的洞察,成為每個交易者的普遍挑戰。
正是基於這些現實需求,Eliza 應運而生。作為首個開源的Web3 友善AI 代理作業系統,Eliza 採用模組化設計,讓開發者和使用者能夠根據自己的需求客製化解決方案。
Eliza 嘗試降低一般使用者使用進階AI 功能的門檻,無需深厚的程式設計經驗就能建立自己的AI 代理。
同時,白皮書也將自己和其他的幾個常見的AI 框架做了對比,下表可以很直觀的看出,在Web3 支持度上,Eliza 宣稱自己的是最適配的,而這也是整個白皮書所要傳達出來的關鍵點。
2.Eliza 的設計理念與技術創新
三大設計原則:簡單但不簡單
Eliza 的成功不是偶然的。在設計之初,團隊就確立了三個核心原則:
Web3 開發者優先考慮到Web3 主要使用JavaScript/TypeScript 進行開發,Eliza 選擇了TypeScript 作為開發語言。這不僅讓開發者能夠使用熟悉的工具,也讓他們能輕鬆地將區塊鏈功能整合到現有的網頁應用中。簡單來說,就是讓Web3 開發者能夠拿來即用。
模組化插件設計Eliza 將系統分解為核心運行時和四個關鍵組件:
Adapter(資料適配器)
Character(代理個性)
Client(訊息互動)
Plugin(通用功能)
這種設計讓開發者可以自由添加自己的插件、客戶端、角色和適配器,而無需關心核心運行時的細節。這也使得Eliza 能夠支援最廣泛的模型提供者(如OpenAI、Llama、Qwen 等)、平台整合(Twitter、Discord、Telegram 等)和鏈相容性(Solana、Ethereum、Ton 等。
寧簡單勿複雜:
在有限的工程資源下,保持簡單的內部實作可以節省時間用於開發新功能,適應新場景,並跟上AI 和Web3 領域的快速發展步伐。
技術創新:內外兼修
在具體實現上,Eliza 的創新分為內部增強和外部擴展兩個維度
1. 內部增強為了提升AI 模式的思考能力,Eliza 整合了多項尖端技術:
Chain-of-Thoughts(思維鏈):
技術定義:引入步驟式解釋
通俗理解:就像解數學題要寫過程一樣,AI 也會把思考過程一步步寫出來,而不是直接給答案。這樣不僅結果更準確,人類也能理解AI 是如何得出結論的
Tree-of-Thoughts(思維樹):
技術定義:允許分支探索多個解決方案
通俗理解:像下棋時要考慮多種可能的走法一樣,AI 會同時探索多個解,然後選擇最優的。這就像在思考的樹上,選擇最好的那個分支
Graph-of-Thoughts(思考圖):
技術定義:連接推理路徑
通俗理解:把問題看成一張網,各個想法之間互相連結。就像我們在解決複雜問題時,會把各種相關的想法連結起來,形成心智圖
Layer-of-Thoughts(思維層):
技術定義:分層推理AI
通俗理解:像過濾器一樣,把思考過程分成不同的層次。就像我們解決問題時,先考慮大方向,再精進到具體細節,層層遞進
2. 外部擴展為了增強實際問題解決能力,Eliza 整合了多種外部能力:
RAG(檢索增強生成):
技術定義:透過檢索來增強生成能力
通俗理解:就像學生做作業時可以查閱教科書一樣,AI 在回答問題時也可以查閱它的資料庫,確保答案更準確
向量資料庫:
技術定義:儲存和檢索結構化數據
通俗理解:相當於AI 的圖書館,可以快速找到類似的內容。例如你說我想找一首關於月亮的詩,它能快速找到所有相關的詩歌
網路搜尋:
技術定義:即時取得互聯網信息
通俗理解:讓AI 像人類一樣能夠上網搜尋最新訊息,不被限制在固定的知識範圍內
文字轉圖像/影片/3D 模型:
技術定義:將文字描述轉換為多媒體內容
通俗理解:就像畫家能根據文字描述畫出畫作一樣,AI 可以根據你的描述生成圖片、視頻,甚至3D 模型
與其他Web3 領域的框架的對比
在目前的Web3 AI 代理框架中,Eliza 展現出明顯的優勢。根據來自50 多位AI 研究人員和高階區塊鏈開發者的回饋,Eliza 在以下關鍵指標上都優於其他框架
模型提供者的支持度
鏈相容性狀況
功能完整性狀況
社群媒體整合情況
3.Eliza OS:一個精心打造的Web3 AI 生態系統
在了解了Eliza 的設計理念後,讓我們來看看這個框架究竟是如何運作的。可以把Eliza 想像成精心設計的樂高積木系統,每個部分都能完美配合,並保持著極強的彈性。
核心組件:五個關鍵角色
在Eliza 的世界裡,五個核心組件相互配合,構成了一個完整的智慧系統。
Agents(代理):系統的主角
它們就像是個獨立的數位助手,負責處理各種自主互動。每個代理商都擁有自己的記憶和性格,能透過Discord、Twitter 等不同管道與使用者進行連貫的對話和互動。
Character Files(角色配置):代理的人設
要讓這些代理商富有個性,就需要Character Files(角色配置)的支援。這相當於代理的個人簡歷,不僅定義了其身份和個性特徵,還規定了它能使用哪些模型(如OpenAI、Anthropic),以及可以執行哪些操作(如區塊鏈交易、NFT 鑄造)。透過精心設計的角色配置,每個代理商都能展現出獨特的專業專長和行為方式。
Providers(提供者):代理的感知系統
與外界互動時,代理人需要Providers(提供者)作為其感知系統。就像人類需要感官來感知世界一樣,提供者為代理提供市場數據、錢包詳情、情緒分析等即時訊息,幫助它們更好地理解當前環境和上下文。
Actions(行動):代理的技能庫
當需要採取具體行動時,Actions(行動)就成為代理的技能庫。從簡單的買賣訂單到複雜的NFT 生成,每個操作都經過嚴格的安全驗證,確保在處理金融相關任務時萬無一失。這些技能讓代理商能夠真正在Web3 世界中發揮作用。
Evaluators(評估器):代理人的決策系統
最後,Evaluators(評估器)則擔任代理的決策系統,負責評估對話內容,提取重要訊息,並幫助代理建立長期記憶。它不僅追蹤目標完成進度,還確保整個對話過程的連貫性。
智慧互動:不只是簡單的對話
在互動方面,Eliza 採用了多層次的理解系統,就像一個經驗豐富的翻譯官,不僅要理解字面意思,還要理解說話的背景和意圖。這個系統能夠準確理解使用者的真實需求,在不同的通訊平台中保持一致的體驗,並根據上下文靈活調整回應方式。
插件系統:無限擴充的可能
Eliza 的插件系統本質上是個工具箱,為整個框架帶來了強大的擴展性,這種擴展體現在多媒體生成、Web3 整合和基礎設施三個方向上:
在多媒體生成方面,它能夠生成圖片、影片、3D 模型,支援NFT 系列的自動生成,還提供圖片描述和分析能力。
在Web3 整合方面,它支援以太坊、Solana 等多鏈操作,提供完整的交易功能套件,並整合各類DeFi 操作。
在基礎設施方面,它提供了瀏覽器服務、文件處理、語音轉文字等基礎能力。
透過這種模組化的設計,Eliza 不僅保持了系統的穩定性,還為開發者提供了近乎無限的擴展可能。這也使得Eliza 能夠適應Web3 世界中不斷湧現的新需求和新場景。
4.Eliza 的實力幾何?從數據看真相
當一個新技術框架出現時,大家最關心的往往是它的實際表現。 Eliza 在這方面給了一個坦誠的答案。
在GAIA 基準測試(這是專門評估AI 代理解決現實問題能力的測試平台)中,Eliza 展現了不俗的實力。這個測驗不是在考察簡單的問答能力,而是要求AI 代理具備邏輯推理、多模態處理、網頁瀏覽和工具使用等多項技能。
雖然在測驗中,Eliza 的得分(19.42% )與目前最頂尖的方案還有一定差距,但考慮到它是一個專注於Web3 領域的框架,這個成績已經相當亮眼。特別是在基礎任務的處理上(Level 1),Eliza 達到了32.21% 的完成率,展現出其紮實的基礎能力。
Web3 領域:開創性的標準制定者
更值得關注的是,Eliza 在Web3 領域實際上扮演著標準制定者的角色。由於Web3 導向的AI 系統仍處於早期階段,Eliza 率先提出了一個完整的評估標準體系,為整個產業指明了發展方向。
這個評估體系分成三個層次,白皮書把它叫做Web3 AI 版本的「圖靈測試」:
基礎能力:包含錢包創建、代幣交易、智能合約互動等基本操作
進階功能:整合最新的AI 技術,如文字轉影片/3D、RAG 支援等
高階特性:能夠基於使用者指令自主規劃與推理,實現真正的智慧決策
目前,Eliza 已經成功實現了基礎層次的全部功能,並且正在向進階層次邁進。團隊表示,他們堅信在未來幾年內,將能夠實現完全自主的AI 代理系統。
5.實際應用:市場用真金白銀投票
原白皮書還有一節是關於代碼展示,用來說明目前能用該框架做出來的實際應用;考慮到理解難度以及技術細節,在此略過,僅展現更加宏觀的實際應用情況。
根據白皮書描述,截至2025 年1 月,已經有多個重要的Web3 專案基於Eliza 建立了他們的AI 代理系統,這些合作夥伴的總市值超過200 億美元。
這個數字或許本身就是市場對Eliza 技術實力的最佳背書。
更重要的是,Eliza 團隊對未來充滿信心。他們認為,隨著這些智能代理的不斷進化,我們將看到一個由多個AI 單元協同工作的新時代。正如Anthropic 的CEO Dario Amodei 所說的天才資料中心願景,Eliza 正在為這個未來鋪平道路。
6.現存限制與未來展望:誠懇的自我剖析
任何技術框架都不可能十全十美,Eliza 團隊在白皮書中也坦誠地指出了當前框架存在的局限性。
待解決的三大挑戰
工作流程系統的缺失:就像一個熟練的助手需要一套標準化的工作流程一樣,當開發者想要實現一些常規性的任務時(例如定期從多個源頭匯總資料),現有的Eliza 框架還無法提供現成的解決方案。對於這類需求,可能還是需要藉助Dify 或Coze 這樣帶有圖形介面的工作流程系統。
多代理系統的效能問題。隨著代理數量的增加,系統需要處理的上下文和記憶內容呈指數級增長。特別是在處理大量輸入輸出任務時,如何平衡計算開銷和運行效率,仍然是一個待解決的技術難題。
多語言支援的拓展需求。目前Eliza 主要基於TypeScript,但要吸引更多領域的開發者加入,還需要擴展對Python、Rust 等其他程式語言的支援。
展望:開創去中心化AI 新紀元
儘管有這些限制,但Eliza 的意義已經遠遠超出了一個技術框架本身。它代表了AI 技術和Web3 應用深度融合的一次開創性嘗試。
透過將每個功能模組設計成標準的TypeScript 程序,Eliza 確保了使用者對系統的完全控制權。同時,它也提供了與區塊鏈數據、智能合約的無縫整合能力。這種設計既保證了安全性,又維持了極強的擴展性。
正如白皮書結尾所說,Eliza 的可能性只受限於使用者的想像力。隨著AI 和Web3 技術的持續演進,Eliza 也將持續發展,並持續引領去中心化AI 的發展方向。