1 はじめに
2017 年の dApps Etheroll、ETHLend、CryptoKitties の第一波から始まり、今日のさまざまなブロックチェーンに基づくさまざまな金融、ゲーム、ソーシャル dApps の急増に至るまで、分散型オンチェーン アプリケーションについて話すとき、私たちはそれについて考えたことがあるでしょうか?これらの dApp がやり取りの中で使用するさまざまなデータのソースは何ですか?
2024 年には、AI と Web3 に焦点が当てられます。人工知能の世界では、データは成長と進化のための生命の源のようなものです。植物が成長するために太陽光と湿気に依存しているのと同じように、AI システムも継続的に「学習」し「思考」するために大量のデータに依存しています。データがなければ、AI アルゴリズムは、どれほど洗練されていても、空中の城にすぎず、本来の知性と有効性を発揮できません。
この記事では、ブロックチェーン データ アクセシビリティ (データ アクセシビリティ) の観点から、業界の発展におけるブロックチェーン データ インデックスの進化を詳細に分析し、古いデータ インデックス プロトコルである The Graph と新興のブロックチェーン データ サービス プロトコルである Chainbase を比較します。と「空間と時間」では、特に AI テクノロジーを組み合わせたこれら 2 つの新しいプロトコルのデータ サービスと製品アーキテクチャの機能の類似点と相違点を調査します。
2 データインデックスの複雑さとシンプルさ: ブロックチェーンノードからフルチェーンデータベースまで
2.1 データソース: ブロックチェーンノード
「ブロックチェーンとは何か」を理解する初めから、よくこの文章を目にします: ブロックチェーンは分散型会計帳簿です。ブロックチェーン ノードはブロックチェーン ネットワーク全体の基盤であり、チェーン上のすべてのトランザクション データを記録、保存、配布する責任を負います。各ノードにはブロックチェーン データの完全なコピーがあり、ネットワークの分散型の性質が維持されます。ただし、一般のユーザーがブロックチェーン ノードを構築して維持するのは簡単ではありません。これには専門的な技術スキルが必要なだけでなく、ハードウェアと帯域幅のコストも高くなります。同時に、通常のノードのクエリ機能は限られており、開発者が必要とする形式でデータをクエリすることはできません。したがって、理論上は誰もが独自のノードを実行できますが、実際にはユーザーはサードパーティのサービスに依存することを好むことがよくあります。
この問題を解決するために、RPC (リモート プロシージャ コール) ノード プロバイダーが登場しました。これらのプロバイダーはノードのコストと管理を担当し、RPC エンドポイントを通じてデータを提供します。これにより、ユーザーは独自のノードを構築せずにブロックチェーン データに簡単にアクセスできるようになります。パブリック RPC エンドポイントは無料ですが、dApp のユーザー エクスペリエンスに悪影響を与える可能性のあるレート制限があります。プライベート RPC エンドポイントは輻輳を軽減することでパフォーマンスを向上させますが、単純なデータの取得でも大量の往復通信が必要になります。そのため、リクエストが多くなり、複雑なデータ クエリに対して非効率的になります。さらに、プライベート RPC エンドポイントは多くの場合、拡張が難しく、異なるネットワーク間の互換性がありません。ただし、ノード プロバイダーの標準化された API インターフェイスにより、ユーザーはチェーン上のデータにアクセスするためのしきい値が低くなり、その後のデータ分析とアプリケーションの基礎が築かれます。
2.2 データ分析:プロトタイプデータから使えるデータへ
ブロックチェーン ノードから取得されるデータは、多くの場合、暗号化およびエンコードされた生データです。これらのデータはブロックチェーンの完全性とセキュリティを保持していますが、その複雑さによりデータ分析の難易度も高まります。一般のユーザーや開発者にとって、これらのプロトタイプ データを直接処理するには、多くの技術的知識とコンピューティング リソースが必要です。
この文脈では、データ分析のプロセスが特に重要です。複雑なプロトタイプデータを理解しやすく操作しやすい形式に解析することで、ユーザーはデータをより直感的に理解して活用できるようになります。データ分析の成功は、ブロックチェーン データ アプリケーションの効率と効果を直接決定し、データ インデックス作成プロセス全体における重要なステップです。
2.3 データインデクサーの進化
ブロックチェーン データの量が増加するにつれて、データ インデクサーの必要性も増加します。インデクサーは、オンチェーン データを整理し、簡単にクエリできるようにデータベースに送信する上で重要な役割を果たします。インデクサーは、ブロックチェーン データのインデックスを作成し、SQL に似たクエリ言語 (GraphQL などの API) を通じてそのデータをすぐに利用できるようにすることで機能します。データをクエリするための統合インターフェイスを提供するインデクサーにより、開発者は標準化されたクエリ言語を使用して必要な情報を迅速かつ正確に取得できるようになり、プロセスが大幅に簡素化されます。
さまざまな種類のインデクサーにより、さまざまな方法でデータ取得が最適化されます。
フルノード インデクサー: これらのインデクサーはフル ブロックチェーン ノードを実行し、そこから直接データを取得し、データが完全で正確であることを保証しますが、大量のストレージと処理能力を必要とします。
軽量のインデクサー: これらのインデクサーはフルノードに依存してオンデマンドで特定のデータをフェッチするため、ストレージ要件は軽減されますが、クエリ時間が増加する可能性があります。
特化したインデクサー: これらのインデクサーは、特定の種類のデータまたは特定のブロックチェーンに特化し、NFT データや DeFi トランザクションなどの特定のユースケースに合わせて取得を最適化します。
集約インデクサー: これらのインデクサーは、オフチェーン情報を含む複数のブロックチェーンおよびソースからデータを取得し、特にマルチチェーン dApps に役立つ統合クエリ インターフェイスを提供します。
現在、Geth クライアントの Ethereum アーカイブ ノードのアーカイブ モードは約 13.5 TB のストレージ スペースを占有しますが、Erigon クライアントでは、アーカイブ要件は約 3 TB です。ブロックチェーンが成長し続けるにつれて、アーカイブ ノード内のデータ ストレージの量も増加します。このような膨大な量のデータに直面して、主流のインデクサー プロトコルはマルチチェーン インデックス作成をサポートするだけでなく、さまざまなアプリケーションのデータ ニーズに応じてデータ解析フレームワークをカスタマイズします。たとえば、The Graph の「サブグラフ」フレームワークは典型的なケースです。
インデクサーの出現により、データのインデックス作成とクエリの効率が大幅に向上しました。インデクサーは、従来の RPC エンドポイントと比較して、大量のデータのインデックスを効率的に作成し、高速クエリをサポートできます。これらのインデクサーを使用すると、ユーザーは複雑なクエリを実行し、データを簡単にフィルタリングし、抽出後に分析することができます。さらに、一部のインデクサーは複数のブロックチェーンからのデータ ソースの集約もサポートしており、マルチチェーン dApp に複数の API をデプロイする必要があるという問題を回避します。インデクサーは複数のノードに分散して実行することで、セキュリティとパフォーマンスが向上するだけでなく、集中型 RPC プロバイダーが引き起こす可能性のある中断やダウンタイムのリスクも軽減されます。
対照的に、インデクサーは事前定義されたクエリ言語を使用して、ユーザーが基礎となる複雑なデータを処理せずに必要な情報を直接取得できるようにします。このメカニズムは、データ取得の効率と信頼性を大幅に向上させ、ブロックチェーン データ アクセスにおける重要な革新です。
2.4 フルチェーンデータベース: ストリームファーストアラインメント
インデックス ノードを使用してデータをクエリすることは、多くの場合、API がチェーン内のデータをダイジェストする唯一のポータルになることを意味します。ただし、プロジェクトが拡張フェーズに入ると、多くの場合、標準化された API では提供できない、より柔軟なデータ ソースが必要になります。アプリケーションの要件が複雑になるにつれて、プライマリ データ インデクサーとその標準化されたインデックス形式は、検索、クロスチェーン アクセス、オフチェーン データ マッピングなど、ますます多様化するクエリ要件を満たすことができなくなります。
最新のデータ パイプライン アーキテクチャでは、従来のバッチ処理の制限に対する解決策として「ストリーム ファースト」アプローチが登場し、リアルタイムのデータの取り込み、処理、分析が可能になります。このパラダイム シフトにより、組織は受信データに即座に対応できるようになり、ほぼ即時の洞察と意思決定が得られます。同様に、ブロックチェーン データ サービス プロバイダーの開発も、ブロックチェーン データ ストリームを構築する方向に進んでいます。従来のインデクサー サービス プロバイダーは、The Graph の Substreams や Goldsky の Mirror など、データ ストリーム方式でリアルタイムのブロックチェーン データを取得する製品を次々と発表してきました。 、およびブロックチェーンに基づいてデータ ストリームを生成する Chainbase や SubSquid などの他のリアルタイム データ レイク。
これらのサービスは、ブロックチェーン トランザクションのリアルタイム解析とより包括的なクエリ機能のニーズに対処するように設計されています。 「ストリームファースト」アーキテクチャが、レイテンシを短縮し応答性を向上させることで、従来のデータ パイプラインでのデータの処理と消費の方法に革命をもたらすのと同様に、これらのブロックチェーン データ ストリーミング サービス プロバイダーも、より高度で成熟したデータ ソースの開発を通じて、より多くのサポートを期待しています。オンチェーンデータ分析を支援します。
最新のデータ パイプラインのレンズを通してオンチェーン データの課題を再定義することで、まったく新しい視点からオンチェーン データの管理、保存、提供の可能性を最大限に理解できるようになります。サブグラフやイーサリアム ETL などのインデクサーを、最終的な出力ではなく、データ パイプライン内のデータ フローとして考え始めると、あらゆるビジネス ユース ケースに合わせて高性能のデータ セットを調整できる世界を思い描くことができます。
3 AI + データベース、グラフ、チェーンベース、空間、時間の詳細な比較
3.1 グラフ
Graph ネットワークは、分散ノード ネットワークを通じてマルチチェーン データのインデックス作成とクエリ サービスを実装し、開発者がブロックチェーン データのインデックスを作成し、分散アプリケーションを構築できるようにします。その主な製品モデルは、データ クエリ実行市場とデータ インデックス キャッシング市場です。これら 2 つの市場は、基本的にユーザーの製品クエリのニーズに応えます。データ クエリ実行市場とは、特に、必要なデータに対して適切なプロバイダーを選択する消費者を指します。データの一部が支払われ、データ インデックス キャッシュ市場は、サブグラフの過去のインデックス作成の人気、請求されるクエリ料金、およびサブグラフ出力に対するオンチェーン キュレーターのニーズに基づいてインデックス ノードがリソースを動員する市場です。 。
サブグラフは、グラフ ネットワークの基本的なデータ構造です。これらは、ブロックチェーンからデータを抽出してクエリ可能な形式 (GraphQL スキーマなど) に変換する方法を定義します。誰でもサブグラフを作成でき、複数のアプリケーションがこれらのサブグラフを再利用できるため、データの再利用性と使用効率が向上します。
The Graph 製品構造 (出典: The Graph ホワイトペーパー)
Graph ネットワークは、インデクサー、キュレーター、デリゲート、開発者の 4 つの主要な役割で構成されており、これらの役割が連携して Web3 アプリケーションにデータ サポートを提供します。それぞれの責任は次のとおりです。
インデクサー: インデクサーは、The Graph ネットワークのノード オペレーターです。インデックス ノードは、GRT (The Graph のネイティブ トークン) をステーキングすることでネットワークに参加し、インデックス作成およびクエリ処理サービスを提供します。
委任者: 委任者は、操作をサポートするためにインデックス ノードに GRT トークンを誓約するユーザーです。委任者は、委任先の i ノードを通じて報酬の一部を獲得します。
キュレーター: キュレーターは、ネットワークによってどのサブグラフにインデックスを付ける必要があるかを通知する責任があります。キュレーターは、貴重なサブプロットに優先順位を付けるのに役立ちます。
開発者: 供給側である最初の 3 人とは異なり、開発者は需要側であり、The Graph の主要なユーザーです。彼らはサブグラフを作成して The Graph ネットワークに送信し、ネットワークが需要データを満たすのを待ちます。
現在、The Graph は包括的な分散型サブグラフ ホスティング サービスに移行しており、システムの運用を確保するためにさまざまな参加者間で経済的インセンティブが循環しています。
インデックス ノードの報酬: インデックス ノードは、消費者のクエリ料金と GRT トークン ブロック報酬の一部を通じて収益を獲得します。
委任者報酬: 委任者は、サポートする i ノードを通じて報酬の一部を受け取ります。
キュレーターの報酬: キュレーターが貴重なサブグラフをシグナルした場合、クエリ料金から部分的な報酬を受け取ることができます。
実際、The Graphの製品もAIの波の中で急速に発展しています。 The Graph エコシステムの中核開発チームの 1 つとして、Semiotic Labs は AI テクノロジーを使用してインデックスの価格設定とユーザーのクエリ エクスペリエンスを最適化することに取り組んできました。現在、Semiotic Labs が開発した AutoAgora、Allocation Optimizer、AgentC ツールは、多くの面でエコシステムのパフォーマンスを向上させています。
AutoAgora は、クエリ量とリソース使用量に基づいてリアルタイムで価格を調整し、価格設定戦略を最適化し、インデクサーの競争力と収益の最大化を確保するための動的な価格設定メカニズムを導入しています。
Allocation Optimizer は、サブグラフのリソース割り当ての複雑な問題を解決し、インデクサーがリソースの最適な割り当てを達成して収益とパフォーマンスを向上できるように支援します。
AgentC は、ユーザーが自然言語を通じて The Graph のブロックチェーン データにアクセスできるようにすることで、ユーザー エクスペリエンスを向上させる実験的なツールです。
これらのツールを適用することで、The Graph は AI 支援によりシステムのインテリジェンスと使いやすさをさらに向上させることができます。
3.2 チェーンベース
Chainbase は、すべてのブロックチェーン データを 1 つのプラットフォームに統合するフルチェーン データ ネットワークであり、開発者によるアプリケーションの構築と保守が容易になります。そのユニークな機能は次のとおりです。
リアルタイム データ レイク: Chainbase は、ブロックチェーン データ ストリーミングに特化したリアルタイム データ レイクを提供し、生成されたデータに即座にアクセスできるようにします。
デュアルチェーン アーキテクチャ: Chainbase は、Eigenlayer AVS に基づいて実行層を構築し、CometBFT のコンセンサス アルゴリズムを使用して並列デュアルチェーン アーキテクチャを形成します。この設計により、クロスチェーン データのプログラマビリティと構成可能性が強化され、高スループット、低遅延、ファイナリティがサポートされ、二重担保モデルを通じてネットワーク セキュリティが向上します。
革新的なデータ形式標準: Chainbase は、暗号業界でデータが構造化および利用される方法を最適化するために、「マニュスクリプト」と呼ばれる新しいデータ形式標準を導入しました。
Cryptoworld モデル: Chainbase は、その膨大なブロックチェーン データ リソースを利用して AI モデル テクノロジーを組み合わせて、ブロックチェーン トランザクションを効果的に理解し、予測し、対話できる AI モデルを作成します。現在、ベーシックモデルのTheiaが一般公開されています。
これらの機能により、Chainbase はブロックチェーン インデックス プロトコルの中で際立っており、リアルタイム データへのアクセス、革新的なデータ形式、オンチェーン データとオフチェーン データの組み合わせを通じて洞察力を向上させるスマートなモデルの作成に特に重点を置いています。
Chainbase の AI モデル Theia は、他のデータ サービス プロトコルと区別する重要なハイライトです。 Theia は、NVIDIA が開発した DORA モデルに基づいており、オンチェーンとオフチェーンのデータ、および時空間アクティビティを結合し、暗号化パターンを学習して分析し、因果推論を通じて応答することで、オンチェーンの潜在的な価値とパターンを深く調査します。 -データをチェーンし、よりインテリジェント化されたデータ サービスをユーザーに提供します。
AI を活用したデータ サービスにより、Chainbase はもはや単なるブロックチェーン データ サービス プラットフォームではなく、より競争力のあるインテリジェント データ サービス プロバイダーになります。 Chainbase は、強力なデータ リソースと AI のプロアクティブな分析を通じて、より広範なデータの洞察を提供し、ユーザーのデータ処理プロセスを最適化できます。
3.3 空間と時間
Space and Time (SxT) は、分散型データ ウェアハウス上でゼロ知識証明を拡張し、スマート コントラクト、大規模な言語モデル、および企業に信頼できるデータ処理を提供する検証可能なコンピューティング レイヤーを作成することを目的としています。現在、Space and Time は Framework Ventures、Lightspeed Faction、Arrington Capital、Hivemind Capital が主導するシリーズ A の最新ラウンドで 2,000 万米ドルの資金調達を受けています。
データのインデックス作成と検証の分野で、Space and Time は新しい技術パスである Proof of SQL を導入しています。これは、Space and Time によって開発された革新的なゼロ知識証明 (ZKP) テクノロジーで、分散型データ ウェアハウスで実行される SQL クエリの改ざん防止と検証可能性を保証します。クエリが実行されると、Proof of SQL はクエリ結果の整合性と正確性を検証する暗号証明を生成します。この証明はクエリ結果に添付され、任意の検証者 (スマート コントラクトなど) が処理中にデータが改ざんされていないことを独立して確認できるようになります。従来のブロックチェーン ネットワークは通常、データの信頼性を検証するためにコンセンサス メカニズムに依存していますが、Space and Time の Proof of SQL はより効率的なデータ検証方法を実装しています。具体的には、Space and Time のシステムでは、1 つのノードがデータの取得を担当し、他のノードが zk テクノロジーを通じてデータの信頼性を検証します。この方法では、最終的にデータを取得するための合意に達するまで、合意メカニズムに基づいて同じデータに繰り返しインデックスを作成する複数のノードのリソース消費量が変更され、システム全体のパフォーマンスが向上します。このテクノロジーが成熟するにつれて、データの信頼性を重視するさまざまな伝統的な業界がブロックチェーン上のデータ構造化製品を使用するための足掛かりとなります。
同時に、SxT は Microsoft AI Joint Innovation Lab と緊密に連携して、ユーザーが自然言語を通じてブロックチェーン データを簡単に処理できるようにする生成 AI ツールの開発を加速しています。現在、Space and Time Studio では、ユーザーは自然言語クエリの入力を体験でき、AI がそれを自動的に SQL に変換し、ユーザーに代わってクエリ ステートメントを実行して、ユーザーが必要とする最終結果を提示します。
3.4 違いの比較
結論と展望
要約すると、ブロックチェーン データ インデックス技術は、ノード データの最初のソースから、データ解析とインデクサーの開発を経て、最終的には AI を活用したフルチェーン データ サービスに至るまで、段階的な改善プロセスを経てきました。これらのテクノロジーの継続的な進化により、データ アクセスの効率と精度が向上するだけでなく、ユーザーに前例のないインテリジェントなエクスペリエンスがもたらされます。
将来に目を向けると、AI テクノロジーやゼロ知識証明などの新技術の継続的な開発により、ブロックチェーン データ サービスはさらにインテリジェントで安全になります。ブロックチェーン データ サービスは今後もインフラとして重要な役割を果たし、業界の進歩と革新を強力にサポートすると信じています。