読み取り、インデックス作成から分析、Web3 データインデックス作成トラックの簡単な紹介-web3资讯-ODAILY

1 はじめに

2017 年の dApps Etheroll、ETHLend、CryptoKitties の第一波から始まり、今日のさまざまなブロックチェーンに基づくさまざまな金融、ゲーム、ソーシャル dApps の急増に至るまで、分散型オンチェーンアプリケーションについて話すとき、私たちはそれについて考えたことがあるでしょうか?これらの dApp がやり取りの中で使用するさまざまなデータのソースは何ですか?

2024 年には、AI と Web3 に焦点が当てられます。人工知能の世界では、データは成長と進化のための生命の源のようなものです。植物が成長するために太陽光と湿気に依存しているのと同じように、AI システムも継続的に「学習」し「思考」するために大量のデータに依存しています。データがなければ、AI アルゴリズムは、どれほど洗練されていても、空中の城にすぎず、本来の知性と有効性を発揮できません。

この記事では、ブロックチェーンデータアクセシビリティ (データアクセシビリティ) の観点から、業界の発展におけるブロックチェーンデータインデックスの進化を詳細に分析し、古いデータインデックスプロトコルである The Graph と新興のブロックチェーンデータサービスプロトコルである Chainbase を比較します。と「空間と時間」では、特に AI テクノロジーを組み合わせたこれら 2 つの新しいプロトコルのデータサービスと製品アーキテクチャの機能の類似点と相違点を調査します。

2 データインデックスの複雑さとシンプルさ: ブロックチェーンノードからフルチェーンデータベースまで

2.1 データソース: ブロックチェーンノード

「ブロックチェーンとは何か」を理解する初めから、よくこの文章を目にします: ブロックチェーンは分散型会計帳簿です。ブロックチェーンノードはブロックチェーンネットワーク全体の基盤であり、チェーン上のすべてのトランザクションデータを記録、保存、配布する責任を負います。各ノードにはブロックチェーンデータの完全なコピーがあり、ネットワークの分散型の性質が維持されます。ただし、一般のユーザーがブロックチェーンノードを構築して維持するのは簡単ではありません。これには専門的な技術スキルが必要なだけでなく、ハードウェアと帯域幅のコストも高くなります。同時に、通常のノードのクエリ機能は限られており、開発者が必要とする形式でデータをクエリすることはできません。したがって、理論上は誰もが独自のノードを実行できますが、実際にはユーザーはサードパーティのサービスに依存することを好むことがよくあります。

この問題を解決するために、RPC (リモートプロシージャコール) ノードプロバイダーが登場しました。これらのプロバイダーはノードのコストと管理を担当し、RPC エンドポイントを通じてデータを提供します。これにより、ユーザーは独自のノードを構築せずにブロックチェーンデータに簡単にアクセスできるようになります。パブリック RPC エンドポイントは無料ですが、dApp のユーザーエクスペリエンスに悪影響を与える可能性のあるレート制限があります。プライベート RPC エンドポイントは輻輳を軽減することでパフォーマンスを向上させますが、単純なデータの取得でも大量の往復通信が必要になります。そのため、リクエストが多くなり、複雑なデータクエリに対して非効率的になります。さらに、プライベート RPC エンドポイントは多くの場合、拡張が難しく、異なるネットワーク間の互換性がありません。ただし、ノードプロバイダーの標準化された API インターフェイスにより、ユーザーはチェーン上のデータにアクセスするためのしきい値が低くなり、その後のデータ分析とアプリケーションの基礎が築かれます。

2.2 データ分析：プロトタイプデータから使えるデータへ

ブロックチェーンノードから取得されるデータは、多くの場合、暗号化およびエンコードされた生データです。これらのデータはブロックチェーンの完全性とセキュリティを保持していますが、その複雑さによりデータ分析の難易度も高まります。一般のユーザーや開発者にとって、これらのプロトタイプデータを直接処理するには、多くの技術的知識とコンピューティングリソースが必要です。

この文脈では、データ分析のプロセスが特に重要です。複雑なプロトタイプデータを理解しやすく操作しやすい形式に解析することで、ユーザーはデータをより直感的に理解して活用できるようになります。データ分析の成功は、ブロックチェーンデータアプリケーションの効率と効果を直接決定し、データインデックス作成プロセス全体における重要なステップです。

2.3 データインデクサーの進化

ブロックチェーンデータの量が増加するにつれて、データインデクサーの必要性も増加します。インデクサーは、オンチェーンデータを整理し、簡単にクエリできるようにデータベースに送信する上で重要な役割を果たします。インデクサーは、ブロックチェーンデータのインデックスを作成し、SQL に似たクエリ言語 (GraphQL などの API) を通じてそのデータをすぐに利用できるようにすることで機能します。データをクエリするための統合インターフェイスを提供するインデクサーにより、開発者は標準化されたクエリ言語を使用して必要な情報を迅速かつ正確に取得できるようになり、プロセスが大幅に簡素化されます。

さまざまな種類のインデクサーにより、さまざまな方法でデータ取得が最適化されます。

フルノードインデクサー: これらのインデクサーはフルブロックチェーンノードを実行し、そこから直接データを取得し、データが完全で正確であることを保証しますが、大量のストレージと処理能力を必要とします。
軽量のインデクサー: これらのインデクサーはフルノードに依存してオンデマンドで特定のデータをフェッチするため、ストレージ要件は軽減されますが、クエリ時間が増加する可能性があります。
特化したインデクサー: これらのインデクサーは、特定の種類のデータまたは特定のブロックチェーンに特化し、NFT データや DeFi トランザクションなどの特定のユースケースに合わせて取得を最適化します。
集約インデクサー: これらのインデクサーは、オフチェーン情報を含む複数のブロックチェーンおよびソースからデータを取得し、特にマルチチェーン dApps に役立つ統合クエリインターフェイスを提供します。

現在、Geth クライアントの Ethereum アーカイブノードのアーカイブモードは約 13.5 TB のストレージスペースを占有しますが、Erigon クライアントでは、アーカイブ要件は約 3 TB です。ブロックチェーンが成長し続けるにつれて、アーカイブノード内のデータストレージの量も増加します。このような膨大な量のデータに直面して、主流のインデクサープロトコルはマルチチェーンインデックス作成をサポートするだけでなく、さまざまなアプリケーションのデータニーズに応じてデータ解析フレームワークをカスタマイズします。たとえば、The Graph の「サブグラフ」フレームワークは典型的なケースです。

インデクサーの出現により、データのインデックス作成とクエリの効率が大幅に向上しました。インデクサーは、従来の RPC エンドポイントと比較して、大量のデータのインデックスを効率的に作成し、高速クエリをサポートできます。これらのインデクサーを使用すると、ユーザーは複雑なクエリを実行し、データを簡単にフィルタリングし、抽出後に分析することができます。さらに、一部のインデクサーは複数のブロックチェーンからのデータソースの集約もサポートしており、マルチチェーン dApp に複数の API をデプロイする必要があるという問題を回避します。インデクサーは複数のノードに分散して実行することで、セキュリティとパフォーマンスが向上するだけでなく、集中型 RPC プロバイダーが引き起こす可能性のある中断やダウンタイムのリスクも軽減されます。

対照的に、インデクサーは事前定義されたクエリ言語を使用して、ユーザーが基礎となる複雑なデータを処理せずに必要な情報を直接取得できるようにします。このメカニズムは、データ取得の効率と信頼性を大幅に向上させ、ブロックチェーンデータアクセスにおける重要な革新です。

2.4 フルチェーンデータベース: ストリームファーストアラインメント

インデックスノードを使用してデータをクエリすることは、多くの場合、API がチェーン内のデータをダイジェストする唯一のポータルになることを意味します。ただし、プロジェクトが拡張フェーズに入ると、多くの場合、標準化された API では提供できない、より柔軟なデータソースが必要になります。アプリケーションの要件が複雑になるにつれて、プライマリデータインデクサーとその標準化されたインデックス形式は、検索、クロスチェーンアクセス、オフチェーンデータマッピングなど、ますます多様化するクエリ要件を満たすことができなくなります。

読み取り、インデックス作成から分析、Web3 データインデックス作成トラックの簡単な紹介

最新のデータパイプラインアーキテクチャでは、従来のバッチ処理の制限に対する解決策として「ストリームファースト」アプローチが登場し、リアルタイムのデータの取り込み、処理、分析が可能になります。このパラダイムシフトにより、組織は受信データに即座に対応できるようになり、ほぼ即時の洞察と意思決定が得られます。同様に、ブロックチェーンデータサービスプロバイダーの開発も、ブロックチェーンデータストリームを構築する方向に進んでいます。従来のインデクサーサービスプロバイダーは、The Graph の Substreams や Goldsky の Mirror など、データストリーム方式でリアルタイムのブロックチェーンデータを取得する製品を次々と発表してきました。、およびブロックチェーンに基づいてデータストリームを生成する Chainbase や SubSquid などの他のリアルタイムデータレイク。

これらのサービスは、ブロックチェーントランザクションのリアルタイム解析とより包括的なクエリ機能のニーズに対処するように設計されています。「ストリームファースト」アーキテクチャが、レイテンシを短縮し応答性を向上させることで、従来のデータパイプラインでのデータの処理と消費の方法に革命をもたらすのと同様に、これらのブロックチェーンデータストリーミングサービスプロバイダーも、より高度で成熟したデータソースの開発を通じて、より多くのサポートを期待しています。オンチェーンデータ分析を支援します。

最新のデータパイプラインのレンズを通してオンチェーンデータの課題を再定義することで、まったく新しい視点からオンチェーンデータの管理、保存、提供の可能性を最大限に理解できるようになります。サブグラフやイーサリアム ETL などのインデクサーを、最終的な出力ではなく、データパイプライン内のデータフローとして考え始めると、あらゆるビジネスユースケースに合わせて高性能のデータセットを調整できる世界を思い描くことができます。

3 AI + データベース、グラフ、チェーンベース、空間、時間の詳細な比較

3.1 グラフ

Graph ネットワークは、分散ノードネットワークを通じてマルチチェーンデータのインデックス作成とクエリサービスを実装し、開発者がブロックチェーンデータのインデックスを作成し、分散アプリケーションを構築できるようにします。その主な製品モデルは、データクエリ実行市場とデータインデックスキャッシング市場です。これら 2 つの市場は、基本的にユーザーの製品クエリのニーズに応えます。データクエリ実行市場とは、特に、必要なデータに対して適切なプロバイダーを選択する消費者を指します。データの一部が支払われ、データインデックスキャッシュ市場は、サブグラフの過去のインデックス作成の人気、請求されるクエリ料金、およびサブグラフ出力に対するオンチェーンキュレーターのニーズに基づいてインデックスノードがリソースを動員する市場です。。

サブグラフは、グラフネットワークの基本的なデータ構造です。これらは、ブロックチェーンからデータを抽出してクエリ可能な形式 (GraphQL スキーマなど) に変換する方法を定義します。誰でもサブグラフを作成でき、複数のアプリケーションがこれらのサブグラフを再利用できるため、データの再利用性と使用効率が向上します。

読み取り、インデックス作成から分析、Web3 データインデックス作成トラックの簡単な紹介

The Graph 製品構造 (出典: The Graph ホワイトペーパー)

Graph ネットワークは、インデクサー、キュレーター、デリゲート、開発者の 4 つの主要な役割で構成されており、これらの役割が連携して Web3 アプリケーションにデータサポートを提供します。それぞれの責任は次のとおりです。

インデクサー: インデクサーは、The Graph ネットワークのノードオペレーターです。インデックスノードは、GRT (The Graph のネイティブトークン) をステーキングすることでネットワークに参加し、インデックス作成およびクエリ処理サービスを提供します。
委任者: 委任者は、操作をサポートするためにインデックスノードに GRT トークンを誓約するユーザーです。委任者は、委任先の i ノードを通じて報酬の一部を獲得します。
キュレーター: キュレーターは、ネットワークによってどのサブグラフにインデックスを付ける必要があるかを通知する責任があります。キュレーターは、貴重なサブプロットに優先順位を付けるのに役立ちます。
開発者: 供給側である最初の 3 人とは異なり、開発者は需要側であり、The Graph の主要なユーザーです。彼らはサブグラフを作成して The Graph ネットワークに送信し、ネットワークが需要データを満たすのを待ちます。

読み取り、インデックス作成から分析、Web3 データインデックス作成トラックの簡単な紹介

現在、The Graph は包括的な分散型サブグラフホスティングサービスに移行しており、システムの運用を確保するためにさまざまな参加者間で経済的インセンティブが循環しています。

インデックスノードの報酬: インデックスノードは、消費者のクエリ料金と GRT トークンブロック報酬の一部を通じて収益を獲得します。
委任者報酬: 委任者は、サポートする i ノードを通じて報酬の一部を受け取ります。
キュレーターの報酬: キュレーターが貴重なサブグラフをシグナルした場合、クエリ料金から部分的な報酬を受け取ることができます。

実際、The Graphの製品もAIの波の中で急速に発展しています。 The Graph エコシステムの中核開発チームの 1 つとして、Semiotic Labs は AI テクノロジーを使用してインデックスの価格設定とユーザーのクエリエクスペリエンスを最適化することに取り組んできました。現在、Semiotic Labs が開発した AutoAgora、Allocation Optimizer、AgentC ツールは、多くの面でエコシステムのパフォーマンスを向上させています。

AutoAgora は、クエリ量とリソース使用量に基づいてリアルタイムで価格を調整し、価格設定戦略を最適化し、インデクサーの競争力と収益の最大化を確保するための動的な価格設定メカニズムを導入しています。
Allocation Optimizer は、サブグラフのリソース割り当ての複雑な問題を解決し、インデクサーがリソースの最適な割り当てを達成して収益とパフォーマンスを向上できるように支援します。
AgentC は、ユーザーが自然言語を通じて The Graph のブロックチェーンデータにアクセスできるようにすることで、ユーザーエクスペリエンスを向上させる実験的なツールです。

これらのツールを適用することで、The Graph は AI 支援によりシステムのインテリジェンスと使いやすさをさらに向上させることができます。

3.2 チェーンベース

Chainbase は、すべてのブロックチェーンデータを 1 つのプラットフォームに統合するフルチェーンデータネットワークであり、開発者によるアプリケーションの構築と保守が容易になります。そのユニークな機能は次のとおりです。

リアルタイムデータレイク: Chainbase は、ブロックチェーンデータストリーミングに特化したリアルタイムデータレイクを提供し、生成されたデータに即座にアクセスできるようにします。
デュアルチェーンアーキテクチャ: Chainbase は、Eigenlayer AVS に基づいて実行層を構築し、CometBFT のコンセンサスアルゴリズムを使用して並列デュアルチェーンアーキテクチャを形成します。この設計により、クロスチェーンデータのプログラマビリティと構成可能性が強化され、高スループット、低遅延、ファイナリティがサポートされ、二重担保モデルを通じてネットワークセキュリティが向上します。
革新的なデータ形式標準: Chainbase は、暗号業界でデータが構造化および利用される方法を最適化するために、「マニュスクリプト」と呼ばれる新しいデータ形式標準を導入しました。
Cryptoworld モデル: Chainbase は、その膨大なブロックチェーンデータリソースを利用して AI モデルテクノロジーを組み合わせて、ブロックチェーントランザクションを効果的に理解し、予測し、対話できる AI モデルを作成します。現在、ベーシックモデルのTheiaが一般公開されています。

読み取り、インデックス作成から分析、Web3 データインデックス作成トラックの簡単な紹介

これらの機能により、Chainbase はブロックチェーンインデックスプロトコルの中で際立っており、リアルタイムデータへのアクセス、革新的なデータ形式、オンチェーンデータとオフチェーンデータの組み合わせを通じて洞察力を向上させるスマートなモデルの作成に特に重点を置いています。

Chainbase の AI モデル Theia は、他のデータサービスプロトコルと区別する重要なハイライトです。 Theia は、NVIDIA が開発した DORA モデルに基づいており、オンチェーンとオフチェーンのデータ、および時空間アクティビティを結合し、暗号化パターンを学習して分析し、因果推論を通じて応答することで、オンチェーンの潜在的な価値とパターンを深く調査します。 -データをチェーンし、よりインテリジェント化されたデータサービスをユーザーに提供します。

AI を活用したデータサービスにより、Chainbase はもはや単なるブロックチェーンデータサービスプラットフォームではなく、より競争力のあるインテリジェントデータサービスプロバイダーになります。 Chainbase は、強力なデータリソースと AI のプロアクティブな分析を通じて、より広範なデータの洞察を提供し、ユーザーのデータ処理プロセスを最適化できます。

3.3 空間と時間

Space and Time (SxT) は、分散型データウェアハウス上でゼロ知識証明を拡張し、スマートコントラクト、大規模な言語モデル、および企業に信頼できるデータ処理を提供する検証可能なコンピューティングレイヤーを作成することを目的としています。現在、Space and Time は Framework Ventures、Lightspeed Faction、Arrington Capital、Hivemind Capital が主導するシリーズ A の最新ラウンドで 2,000 万米ドルの資金調達を受けています。

データのインデックス作成と検証の分野で、Space and Time は新しい技術パスである Proof of SQL を導入しています。これは、Space and Time によって開発された革新的なゼロ知識証明 (ZKP) テクノロジーで、分散型データウェアハウスで実行される SQL クエリの改ざん防止と検証可能性を保証します。クエリが実行されると、Proof of SQL はクエリ結果の整合性と正確性を検証する暗号証明を生成します。この証明はクエリ結果に添付され、任意の検証者 (スマートコントラクトなど) が処理中にデータが改ざんされていないことを独立して確認できるようになります。従来のブロックチェーンネットワークは通常、データの信頼性を検証するためにコンセンサスメカニズムに依存していますが、Space and Time の Proof of SQL はより効率的なデータ検証方法を実装しています。具体的には、Space and Time のシステムでは、1 つのノードがデータの取得を担当し、他のノードが zk テクノロジーを通じてデータの信頼性を検証します。この方法では、最終的にデータを取得するための合意に達するまで、合意メカニズムに基づいて同じデータに繰り返しインデックスを作成する複数のノードのリソース消費量が変更され、システム全体のパフォーマンスが向上します。このテクノロジーが成熟するにつれて、データの信頼性を重視するさまざまな伝統的な業界がブロックチェーン上のデータ構造化製品を使用するための足掛かりとなります。

読み取り、インデックス作成から分析、Web3 データインデックス作成トラックの簡単な紹介

同時に、SxT は Microsoft AI Joint Innovation Lab と緊密に連携して、ユーザーが自然言語を通じてブロックチェーンデータを簡単に処理できるようにする生成 AI ツールの開発を加速しています。現在、Space and Time Studio では、ユーザーは自然言語クエリの入力を体験でき、AI がそれを自動的に SQL に変換し、ユーザーに代わってクエリステートメントを実行して、ユーザーが必要とする最終結果を提示します。

3.4 違いの比較

読み取り、インデックス作成から分析、Web3 データインデックス作成トラックの簡単な紹介

結論と展望

要約すると、ブロックチェーンデータインデックス技術は、ノードデータの最初のソースから、データ解析とインデクサーの開発を経て、最終的には AI を活用したフルチェーンデータサービスに至るまで、段階的な改善プロセスを経てきました。これらのテクノロジーの継続的な進化により、データアクセスの効率と精度が向上するだけでなく、ユーザーに前例のないインテリジェントなエクスペリエンスがもたらされます。

将来に目を向けると、AI テクノロジーやゼロ知識証明などの新技術の継続的な開発により、ブロックチェーンデータサービスはさらにインテリジェントで安全になります。ブロックチェーンデータサービスは今後もインフラとして重要な役割を果たし、業界の進歩と革新を強力にサポートすると信じています。

読み取り、インデックス作成から分析、Web3 データ インデックス作成トラックの簡単な紹介

1 はじめに

2 データインデックスの複雑さとシンプルさ: ブロックチェーンノードからフルチェーンデータベースまで

2.1 データソース: ブロックチェーンノード

2.2 データ分析：プロトタイプデータから使えるデータへ

2.3 データインデクサーの進化

2.4 フルチェーンデータベース: ストリームファーストアラインメント

3 AI + データベース、グラフ、チェーンベース、空間、時間の詳細な比較

3.1 グラフ

3.2 チェーンベース

3.3 空間と時間

3.4 違いの比較

結論と展望

読み取り、インデックス作成から分析、Web3 データインデックス作成トラックの簡単な紹介