AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

本文約4098字,閱讀全文需要約6分鐘
重點解讀框架的「波粒二象性」以及Agent框架為何能成為最後一角。

原文作者: Kevin, the Researcher at BlockBooster

AI Agent 框架作為產業發展的關鍵拼圖,可能蘊藏著推動科技落地與生態成熟的雙重潛力。市場中熱議的架構有:Eliza, Rig, Swarms, ZerePy 等等。這些框架透過 Github Repo 吸引開發者,建立聲望。以「庫」發幣的形式讓這些框架,和光同時具備波和粒子的特質類似,Agent 框架同時具備嚴肅外部性和 Memecoin 的特性。本文將重點放在解讀框架的「波粒二象性」以及 Agent 框架為何能成為最後一角。

Agent 框架帶來的外部性能夠在泡沫消退後留下春芽

從 GOAT 誕生開始,Agent 敘事衝擊市場的力度不斷上升,如同一位功夫大師,左拳“Memecoin”,右掌“行業希望”,你總會在其中一招裡敗下陣來。其實,AI Agent 的應用場景並未嚴格區分,平台、框架與具體應用之間界線模糊,但根據代幣或協議的偏好仍可大致分類。但是,根據代幣或協議的發展偏好還是可以分為以下幾類:

  • Launchpad:資產髮型平台。 Base 鏈上的Virtuals Protocol 和clanker,Solana 鏈的Dasha。

  • AI Agent 應用:遊離於 Agent 和 Memecoin 之間,在記憶記憶體的配置上有出彩的地方,例如 GOAT,aixbt 等。這些應用一般來說是單向輸出的,輸入條件非常有限。

  • AI Agent 引擎:Solana 鏈的griffain 以及base 鏈的Spectre AI。 griffain 可以做到從讀寫模式進化到讀、寫、行動的模式;Spectre AI 是 RAG 引擎,鏈上搜尋。

  • AI Agent 框架:對框架平台來說,Agent 本身就是資產,所以 Agent 框架是 Agent 的資產發行平台,是 Agent 的 Launchpad。目前代表性的項目有ai 16 ,Zerebro , ARC 和這兩天熱議的 Swarms。

  • 其他小方向:綜合型 Agent Simmi;AgentFi 協定Mode;證偽類別 Agent Seraph;實時API Agent Creator.Bid。

進一步討論 Agent 框架,可以看出它具有充分的外部性。有別於各大公鍊和協議的開發者只能在不同開發語言環境中選擇,而產業內總的開發者規模並沒有呈現對應市值增速的成長。 Github Repo 是Web2和Web3開發者建立共識的之所,在這裡建立開發者社區,比任何一個協議單獨開發出來的「一插即用」包對Web2開發者的吸引力和影響力更強大。

本文提到的 4 種框架都已開源:ai16z的Eliza 框架獲得 6200 顆星;Zerebro 的 ZerePy 框架獲得 191 顆星;ARC 的 RIG 框架獲得 1700 顆星;Swarms 的 Swarms 框架獲得 2100 顆星。目前,Eliza 框架被廣泛用於各種 Agent 應用,是覆蓋範圍最廣的框架。 ZerePy 的開發程度不算高,發展方向主要在 X 上,尚且不支援本地 LLM 和整合記憶體。 RIG 的相對開發難度最高,但能給開發者最大限度地實現效能最佳化的自由。 Swarms 除了團隊推出 mcs 之外還沒有其他用例,但 Swarms 可以整合不同框架,有較大想像空間。

此外,在上述分類中,把 Agent 引擎和框架分割開來,或許或造成懷疑。但我認為二者是有差別的。首先,為什麼是引擎?聯想現實生活中的搜尋引擎來類比是相對契合的。不同於同質化的 Agent 應用,Agent 引擎的性能在其之上,但同時是完全封裝的,透過 api 介面來調整的黑盒。使用者可以以 fork 的形式來體驗 Agent 引擎的效能,但又不能像基礎架構那樣掌握全貌和客製化自由。每個使用者的引擎就像在調教好的 Agent 上產生一個鏡像,是對鏡像做互動。而框架本質上是為了適配鏈,因為在Agent 做Agent 框架,最終目的都是和對應的鏈有整合,怎樣定義數據交互方式,怎樣定義數據驗證方式,怎樣定義區塊大小,怎樣平衡共識和性能,這些是框架需要考慮的事情。而引擎呢?只需要在某一個方向,充分微調模型和設定資料互動還有記憶體之間的關係就行,效能是唯一評價標準,而框架則不然。

用「波粒二象性」的視角去評估 Agent 框架或許是確保走在正確方向上的前提

Agent 執行一次輸入輸出的生命週期中,需要三個部分。首先是底層模型決定了思考深度和方式,然後記憶體是自訂的地方,在基礎模型有了輸出之後,根據記憶體再修改,最後在不同的客戶端完成輸出操作。

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

來源:@SuhailKakar

為了證實Agent 框架具有“波粒二象性”,“波”具有“Memecoin”的特徵,代表社區文化和開發者活躍度,強調Agent 的吸引力和傳播能力;“粒”代表“行業預期”的特徵,代表底層效能、實際用例和技術深度。我會分別從兩個面向結合三個框架的開發教學為例進行說明:

快速拼接式的 Eliza 框架

1.設定環境

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

來源:@SuhailKakar

2.安裝 Eliza

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

來源:@SuhailKakar

3.設定檔

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

來源:@SuhailKakar

4.設定 Agent 性格

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

來源:@SuhailKakar

Eliza 的框架相對來說,易於上手。它是基於 TypeScript,這是大多數Web 和Web3 開發者都熟悉的語言。框架簡潔,沒有過度抽象,讓開發者輕鬆地加入自己想要的功能。透過步驟 3 ,看到 Eliza 可以多客戶端集成,可以將其理解為多客戶端集成的組裝器。 Eliza 支援 DC, TG 和 X 等平台,也支援多種大語言模型,可以透過上述社群媒體實現輸入,LLM 模型來輸出,並且支援內建記憶管理,可以讓任意習慣的開發者快速部署 AI Agent。

由於框架的簡潔性和介面的豐富性,Eliza 大大降低了存取的門檻,實現了相對統一的介面標準。

一鍵使用式的 ZerePy 框架

1.Fork ZerePy 的庫

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://replit.com/@blormdev/ZerePy?v=1

2.配置 X 和 GPT

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://replit.com/@blormdev/ZerePy?v=1

3.設定 Agent 性格

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://replit.com/@blormdev/ZerePy?v=1

效能優化式的 Rig 框架

以建構 RAG(檢索增強生成) Agent 為例:

1.配置環境和 OpenAI key

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

2.設定OpenAI 客戶端並使用Chunking 進行PDF 處理

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

3.設定文檔結構和嵌入

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

4.創建向量儲存和RAG agent

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

Rig(ARC)是一個基於Rust 語言面向LLM 工作流引擎的AI 系統建構框架,它要解決更底層的效能最佳化問題,換句話說,ARC 是一個AI 引擎「工具箱」,提供AI 呼叫、效能最佳化、資料儲存、異常處理等後台支撐服務。

Rig 要解決的是「呼叫」問題,以幫助開發者更好選擇LLM,更好優化提示詞,更有效管理token,以及如何處理並發處理、管理資源、降低延遲等,其重點在於AI LLM 模型和AI Agent 系統協作過程中如何「用好它」。

Rig是一個開源Rust 函式庫,旨在簡化LLM 驅動的應用(包括RAG Agent)的開發。因為 Rig 開放的程度更深,因此對開發者要求更高,對 Rust 和 Agent 的理解要求也更高。 這裡的教程是最基礎的 RAG Agent 的配置流程,RAG 透過將 LLM 與外部知識檢索結合來增強 LLM。在官網的其他 DEMO 中,可以看到 Rig 具備以下特徵:

  • LLM 介面統一:支援不同 LLM provider 的一致 api,簡化整合。

  • 抽象工作流程:預先建構的模組化元件讓 Rig 承接複雜 AI 系統的設計。

  • 整合向量儲存:內建對裁體儲存的支持,在 RAG Agent 等相似的搜尋類 Agent 中提供高效能。

  • 嵌入靈活:提供易於使用的API,用於處理嵌入,在 RAG Agent 等相似的搜尋類 Agent 開發時,降低語義理解的難度。

可以看出相比 Eliza,Rig 為開發者提供了額外的效能優化的空間,幫助開發者更好地調試 LLM 和 Agent 的呼叫和協作優化。 Rig 以Rust 驅動性的效能、利用Rust 優勢零成本抽象化和記憶體安全、高效能、低延遲的LLM 操作。能夠在底層層面上,提供更豐富的自由度。

分解組合式的 Swarms 框架

Swarms 旨在提供企業級生產級多 Agent 編排框架,官網提供了數十種 workflow 和 Agent 並行串行架構,這裡介紹其中一小部分。

Sequential Workflow

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://docs.swarms.world

順序Swarm 架構以線性順序處理任務。每個 Agent 在將結果傳遞給鏈中的下一個 Agent 之前完成其任務。此架構可確保有序處理,並且在任務具有依賴關係時非常有用。

用例:

  • 工作流程中的每個步驟都依賴前一個步驟,例如裝配線或順序資料處理。

  • 需要嚴格按照操作順序的場景。

層次化架構:

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://docs.swarms.world

實現自上而下的控制,由上級 Agent 協調各下級 Agent 之間的任務。其中 Agent 同時執行任務,然後將其結果回饋到循環中進行最終聚合。這對於高度可並行化的任務非常有用。

電子表格式架構:

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://docs.swarms.world

用於管理同時工作的多個代理的大規模群體架構。可同時管理數千個代理,每個代理都在自己的執行緒上運行。它是監督大規模代理輸出的理想選擇。

Swarms 不僅是 Agent 框架,還可以相容於上述 Eliza, ZerePy 和 Rig 框架,以模組化的思想,在不同工作流程和架構中最大化釋放 Agent 效能,以解決對應問題。 Swarms 的構思和開發者社群進展都沒問題。

AI Agent框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

  • Eliza:易用性最強,適合初學者和快速原型開發,特別適合社群媒體平台的 AI 互動。框架簡潔,方便快速整合和修改,適合不需要過度效能優化的場景。

  • ZerePy:一鍵部署,適合快速開發Web3和社群平台的 AI Agent 應用。適合輕量級 AI 應用,框架簡單,配置靈活,適用於快速建置和迭代。

  • Rig:專注於效能最佳化,尤其在高並發和高效能任務中表現出色,適用於需要細緻控制和最佳化的開發者。框架較為複雜,需要一定的 Rust 知識,適合更有經驗的開發者。

  • Swarms:適合企業級應用,支援多 Agent 協作和複雜任務管理。框架靈活,支援大規模並行處理,並提供多種架構配置,但由於其複雜性,可能需要更強的技術背景來有效應用。

總體來說,Eliza 和ZerePy 在易用性和快速開發方面具有優勢,而Rig 和Swarms 更適合需要高效能和大規模處理的專業開發者或企業應用。

這就是 Agent 框架具有「產業希望」特性的原因,上述框架仍處於早期階段,當務之急是搶佔先發優勢並建立活躍的開發者社群。框架本身的效能高低以及相對Web2流行應用來說是否落後都不是主要矛盾。只有源源不斷湧入開發者的框架才能最終勝出,因為Web3產業始終需要吸引市場的注意力,框架性能再強,基本面再雄厚,如果難以上手導致無人問津,則本末倒置。在能夠框架自身能夠吸引開發者的前提,具有更成熟和更完整的代幣經濟模型的框架會脫穎而出。

而 Agent 框架有著「Memecoin」特性這一點,則非常好理解。上述框架代幣都沒有合理的代幣經濟設計,代幣沒有用例或用例非常單一,沒有經過驗證的商業模式,也沒有行之有效的代幣飛輪,框架只是框架,和代幣之間沒有完成有機結合,代幣價格的成長除了FOMO 之外,難以獲得基本面上的助力,沒有足夠的護城河來確保穩定且持久的價值成長。同時,上述的框架本身也顯得比較粗糙,其實際價值和當前市值並不匹配,因此有著強烈的「Memecoin」的特性。

值得注意的是,Agent 框架的「波粒二象性」並不是缺點,不能將其粗暴的理解為既不是純粹的 Memecoin,又沒有代幣用例的半罐水。正如我在上一篇文章中提到的觀點:輕量化的Agent 覆蓋著模棱兩可的Memecoin 面紗,社區文化和基本面不會再成為矛盾,一種新的資產發展路徑在逐漸浮出水面;儘管Agent框架初期存在泡沫與不確定性,但其吸引開發者和推動應用程式落地的潛力不容忽視。未來,具備完善代幣經濟模型和強大開發者生態的框架,或將成為這條賽道的關鍵支柱。

關於 BlockBooster

BlockBooster 是一家由 OKX Ventures 及其他頂級機構支持的亞洲Web3創投工作室,致力於成為優秀創業家的可信賴夥伴。我們透過策略投資與深度孵化,連結Web3專案與現實世界,協助優質創業專案成長。

免責聲明

本文/部落格僅供參考,代表作者的個人觀點,並不代表 BlockBooster 的立場。本文無意提供:(i) 投資建議或投資推薦;(ii) 購買、出售或持有數位資產的要約或招攬;或(iii) 財務、會計、法律或稅務建議。持有數位資產,包括穩定幣和 NFT,風險極高,價格波動較大,甚至可能變得一文不值。您應根據自身的財務狀況,仔細考慮交易或持有數位資產是否適合您。如有具體情況方面的問題,請諮詢您的法律、稅務或投資顧問。本文提供的資訊(包括市場數據和統計信息,若有)僅供一般參考。在編寫這些數據和圖表時已盡合理注意,但對其中所表達的任何事實性錯誤或遺漏概不負責。

原創文章,作者:BlockBooster。轉載/內容合作/尋求報導請聯系 report@odaily.email;違規轉載法律必究。

ODAILY提醒,請廣大讀者樹立正確的貨幣觀念和投資理念,理性看待區塊鏈,切實提高風險意識; 對發現的違法犯罪線索,可積極向有關部門舉報反映。

推薦閱讀
星球精選