3月6日、中国の新興企業モニカが発表した世界初の汎用AIエージェント製品「Manus」が、国内のテクノロジーメディアやSNSで話題になった。開始初日には、ネットワーク全体で招待コードを入手するのが困難でした。仙遊の招待コードでも5万元かかります。しかし、多くの業界KOLが招待コードを事前に入手し、体験解説記事が大量に投稿されました。
Manusは汎用AIエージェント製品として、レポート作成や表作成など、計画から実行まで自律的にタスクを完了する機能を備えています。アイデアを生み出すだけでなく、自主的に考え、行動を起こします。独自に考え、複雑なタスクを計画し実行する強力な能力により、完全な結果を直接提供し、これまでにない汎用性と実行能力を発揮します。
Manus の人気は業界内で注目を集めただけでなく、さまざまな AI エージェントの開発に貴重な製品アイデアやデザインのインスピレーションを提供しました。 AI技術の急速な発展に伴い、人工知能分野の重要な部門であるAIエージェントは、概念から現実へと徐々に移行し、Web3業界を含むあらゆる分野で大きな応用可能性を示しています。
背景
AI エージェント、または人工知能エージェントは、環境、入力、および事前定義された目標に基づいて自律的に意思決定を行い、タスクを実行できるコンピュータ プログラムです。 AI エージェントのコアコンポーネントには、情報の処理、対話からの学習、意思決定、アクションの実行を可能にする「頭脳」としての大規模言語モデル (LLM) が含まれます。環境を知覚できるようにする観察および知覚メカニズム。観察と記憶の内容を分析し、可能な行動を考慮する推論思考プロセス。思考と観察に対する明確な反応としての行動の実行。学習に使用するために過去の経験を保存する記憶と検索。
AI エージェントの設計パターンは ReAct から始まり、2 つの開発ルートがあります。1 つは、REWOO、Plan Execute、LLM コンパイラーなど、AI エージェントの計画機能に重点を置いています。もう 1 つは、基本的な反省、内省、自己発見、LATS などの反省能力に重点を置いています。
その中でも、ReAct モードは最も初期の AI エージェント設計モードであり、現在最も広く使用されているため、この記事では主に ReAct の概念を紹介します。 ReAct は、言語モデルにおける推論と動作を組み合わせることで、さまざまな言語推論および意思決定タスクを解決する方法です。その典型的なプロセスは下の図に示されており、TAO サイクルと呼ばれる興味深いサイクルで説明できます。思考 → 行動 → 観察。
思考: 問題に直面したときは、深く考える必要があります。この思考プロセスは、問題を定義し、問題を解決するために必要な主要な情報と推論手順を決定する方法に関するものです。
行動:思考の方向を決定したら、次のステップは行動を起こすことです。私たちは自分の考えに基づいて、問題を解決に導くために、適切な対策を講じたり、特定のタスクを実行したりします。
観察: 行動を起こした後は、その結果を注意深く観察しなければなりません。このステップは、私たちの行動が効果的かどうか、そして問題に対する答えに近づいているかどうかをテストすることです。
ループの繰り返し
AI エージェントは、インテリジェント エージェントの数に応じて、シングル エージェントとマルチ エージェントに分けられます。シングル エージェントの中核は LLM とツール間の調整にあり、タスクを完了するプロセスで、エージェントはユーザーと複数回対話する場合があります。マルチエージェントは、異なるエージェントに異なる役割を割り当て、エージェント間のコラボレーションを通じて複雑なタスクを完了します。ただし、タスクを完了するプロセスでは、シングル エージェントと比較して、ユーザーとのやり取りが少なくなります。現在、ほとんどのフレームワークは単一エージェントのシナリオに重点を置いています。
モデル コンテキスト プロトコル (MCP) は、2024 年 11 月 25 日に Anthropic によって開始されたオープン ソース プロトコルであり、LLM と外部データ ソース間の接続と相互作用の問題を解決することを目的としています。 LLM はオペレーティング システムに例えることができ、MCP は USB インターフェイスに例えることができます。これらは外部データとツールの柔軟な挿入をサポートし、ユーザーはこれらの外部データとツールを読み取って使用できます。
MCP は、LLM を拡張するための 3 つの機能を提供します。リソース (知識の拡張)、ツール (関数の実行、外部システムの呼び出し)、およびプロンプト (事前に作成されたプロンプト テンプレート) です。 MCP プロトコルはクライアント サーバー アーキテクチャを採用しており、基盤となる伝送には JSON-RPC プロトコルが使用されます。誰でも MCP サーバーを開発およびホストでき、いつでもサービスをシャットダウンできます。
Web3におけるAIエージェントの現状
Web3業界では、AIエージェントの人気は今年1月にピークを迎えて以来大幅に低下し、全体の市場価値は90%以上縮小しました。現在、最も人気があり時価総額の高い Web3 の探求は、依然として AI エージェント フレームワーク、つまり「Virtuals Protocol に代表されるローンチ プラットフォーム モデル」、「ElizaOS に代表される DAO モデル」、および「Swarms に代表される商業会社モデル」に集中しています。
ローンチ プラットフォームは、Meme の pump.fun に似た、AI エージェント向けの AI エージェントをユーザーが作成、展開、収益化できるプラットフォームです。 Virtuals Protocol は現在、100,000 を超えるエージェントが発行されている最大のローンチ プラットフォームです。人気の「暗号通貨KOL」AIXBTはVirtualsをベースに作成されました。 Virtuals Protocol には、GAME と呼ばれるモジュール式エージェント フレームワークが含まれています。 GAME の中心的な位置付けは、効率的でオープンなフレームワークを開発者に提供し、AI エージェントの開発と起動を WordPress ウェブサイトの構築と同じくらい簡単にすることです。
DAO は、Decentralized Autonomous Organization (分散型自律組織) の略です。 ElizaOS (旧称 ai16z) は、daos.fun プラットフォーム上で @shawmakesmagic によって設立されました。当初のアイデアは、AIモデルを使用して、有名なベンチャーキャピタル会社a16zとその共同創設者マーク・アンドリーセンの投資決定をシミュレートし、DAOメンバーのアドバイスに基づいて投資するというものでした。その後、Elizaフレームワークを中核としたAIエージェント開発者向けのDAOへと発展しました。 TypeScript で構築された Eliza フレームワークは、一貫した個性と知識を維持しながら複数のプラットフォーム間で対話できる AI エージェントを開発するための柔軟で拡張可能なプラットフォームを提供します。
Swarms は、2022 年に 20 歳の @KyeGomezB によって開始されました。これは、エンタープライズ レベルのマルチ エージェント フレームワークです。 Swarms は、インテリジェントなオーケストレーションと効率的なコラボレーションを通じて、複数の AI エージェントがチームのように連携して、複雑なビジネス運用のニーズを解決できるようにします。当初、Swarms は単なる Web2 AI エージェント プロジェクトでした。創設者によれば、Swarms には実稼働環境で稼働しているエージェントが 4,500 万以上あり、世界最大規模の金融機関、保険機関、医療機関にサービスを提供しているという。 2024年12月にトークン$SWARMSを発行した後、Web2からWeb3に正式に切り替わります。
経済モデルの観点からのみ言えば、現時点では、自立した経済の閉ループを実現できるのは打ち上げプラットフォームだけです。 Virtuals を例に挙げます。
エージェントの作成:作成者は Virtuals プラットフォーム上で新しい AI エージェントを起動します。
結合曲線の設定:作成者は 100 個の $VIRTUAL トークンを支払い、新しく仲介されたトークンに対して結合曲線が作成され、$VIRTUAL とペアになります。
流動性プールの作成:結合曲線の制限に達すると、プロキシは「卒業」し、プロキシ トークンが $VIRTUAL トークンとペアになっている流動性プールを作成します。これは、事前マイニングや内部割り当てがなく、総供給量が固定され、流動性が長期間ロックアップされるという、インサイダーなしの公正なローンチの原則に準拠しています。
Virtuals では、AI エージェントの起動料金の請求に加え、エージェント トークンのトランザクションごとにトランザクション料金、および AI エージェントが Virtuals API を通じて LLM にアクセスするための推論料金も請求します。現在、ElizaOS と Swarms は独自の起動プラットフォームの構築を計画しています。
もちろん、打ち上げプラットフォームにも問題があります。この種の資産発行では、正のフライホイールを形成するために、発行される資産自体が「魅力的」である必要があります。現在、立ち上げられた AI エージェントのほとんどは本質的にミームであり、本質的な価値のサポートはありません。市場の注目を失えば、すぐにゼロに戻ってしまいます。現在の冷え込んだ市場環境では、ローンチプラットフォームはクリエイターを引き付けることすらできず、経済モデルは本質的に機能しません。
MCP の Web3 探索
MCP の出現により、現在の Web3 AI エージェントに新たな探索方向がもたらされました。最も直感的な指示は次のとおりです。
MCP サーバーをブロックチェーン ネットワークに展開して、MCP サーバーの単一ポイント問題を解決し、検閲耐性を提供します。
MCP サーバーは、DeFi トランザクションや管理の実行など、ブロックチェーンと対話する機能を備えており、技術的なハードルを下げます。
最初の方向では、基盤となるブロックチェーンのストレージ システム、データ管理機能、非同期コンピューティング機能に対する要件が非常に高く、0G のようなブロックチェーンを選択できます。 0G は、AI dapps に適したスケーラブルでプログラム可能な DA レイヤーを備えたモジュール式 AI ブロックチェーンです。モジュール式テクノロジーにより、セキュリティを確保しながらチェーン間のスムーズな相互運用が可能になり、断片化を排除し、接続性を最大限に高めて分散型 AI エコシステムを構築できます。
2 番目の方向は DeFAI のバリアントに似ていますが、現在 DeFAI のバックエンドは、それ自体でカプセル化された Function Call 内の一連のツールです。 UnifAI は、車輪の再発明を避けるために、統合された DeFAI MCP サーバーを作成します。 UnifAI は、自律型 AI エージェントが Web3 エコシステム内でオンチェーンおよびオフチェーンのタスクを実行できるようにするプラットフォームです。タスク自動化のための UniQ、ブローカー サービス マーケットプレイス、ツール検出のためのインフラストラクチャを備えています。
上記2つの方向性に加えて、LXDAOとETHPandaの創設者である@brucexu_ethは、EthereumをベースにしたOpenMCP.Networkクリエイターインセンティブネットワークを構築する計画を提案しました。 MCP サーバーは安定したサービスをホストして提供する必要があります。ユーザーは LLM プロバイダーに料金を支払い、LLM プロバイダーはネットワークを通じて呼び出された MCP サーバーに実際のインセンティブを配布して、ネットワーク全体の持続可能性と安定性を維持し、MCP 作成者が高品質のコンテンツを継続的に作成して提供できるように促します。このネットワークでは、インセンティブを自動化し、透明性、信頼性、検閲耐性を高めるためにスマート コントラクトを使用する必要があります。署名、権限の検証、操作中のプライバシー保護はすべて、Ethereum ウォレットや ZK などのテクノロジーを使用して実現できます。
理論的には、MCP と Web3 を組み合わせることで、AI エージェント アプリケーションに分散型の信頼メカニズムと経済的インセンティブ レイヤーを組み込むことができますが、現在のゼロ知識証明 (ZKP) テクノロジでは、エージェントの動作の信頼性を検証することが依然として困難であり、分散型ネットワークには依然として効率性の問題があります。これは短期的には成功する解決策ではありません。
要約する
Manus のリリースは、一般的な AI エージェント製品にとって重要なマイルストーンとなります。 Web3 の世界にも、Web3 には実用性がなく、単なる誇大宣伝に過ぎないという外の世界の疑念を払拭するための画期的な製品が必要です。
MCP の出現により、MCP サーバーをブロックチェーン ネットワークに展開すること、MCP サーバーがブロックチェーンと対話できるようにする、MCP サーバー作成者インセンティブ ネットワークを構築することなど、Web3 AI エージェントに新たな探索方向がもたらされました。
AIは歴史上最も壮大な物語です。 Web3ではAIとの統合は避けられません。私たちは忍耐と自信を維持し、探求を続ける必要があります。
この記事は、ZAN チーム (X アカウント@zan_team ) の pignard.eth (X アカウント@pignard_web3 ) によって書かれました。
注: この記事は技術的な共有のみを目的としており、いかなる推奨や提案も構成するものではありません。