著者:ジェイ・ユー; 編集:ブロックユニコーン##序文
現在、私たちは分散型人工知能(deAI)の「ネットワークプロトコルスタック」が徐々に構築されているのを目にしています。インターネットが一連の相互運用可能な標準の上で動作しているように——トランスポート層はTCP/IPを使用し、サービス発見層はDNSを使用し、アプリケーションロジックはHTTPを使用しています——deAIプロトコルスタックもこれらの3つのモジュールに分解できます:アプリケーション層はx402を使用し、サービス発見層はERC 8004を使用し、トランスポート層はA2Aを使用します——これらすべては従来のHTTPネットワークプロトコルスタックの上で動作しています。
要するに、deAIプロトコルスタックは、エージェントがどのように料金を支払い、リソースを発見し、互いに通信するかを定義します。では、それぞれの部分を一つずつ分析していきましょう:
! 画像
去中心化人工知能(deAI)プロトコルスタックの頂点は x402 であり、これは代理人間でさまざまなサービス(例えば、ファイルストレージ、電子商取引、ウェブスクレイピングなど)に対して支払いを行うアプリケーションレイヤープロトコルを表しています。x402 は Coinbase と Cloudflare によって構築されており、元々の「HTTP 402:支払いが必要」というステータスコードを根本的に拡張し、ワークフローの一部として機能させ、代理人が安定コインを使用してサービス料金を支払うことを可能にします。
私は以前、x402について詳細に書いた記事があります。記事のタイトルは《HTTP 402の現代的改造》で、内容にはそのビジョン、アーキテクチャ、機会、そして課題が含まれています。
基本的に、x402は三者間の合意に基づいて動作します。この合意は3つの部分で構成されています:クライアントがリソースを要求する → サーバーが402ステータスコードを返す → 支払い調整者(facilitator)がクライアントの支払い承認を確認し、実際に資金を移転します(例えば、署名されたトランザクションをブロックチェーンに提出する)。これらのステップが完了した後、サーバーはプレミアムコンテンツを解除します。
現在、x402scanは、x402サーバーが実際に稼働している際のパフォーマンスを観察するための最良のリソースの一つかもしれません。長期的には、x402が高品質コンテンツのマイクロペイメント(例えば、ウェブスクレイピング、ペイド記事、計算リソース)に大いに貢献するでしょうが、その最近の台頭(x402scanを通じて明確に見ることができます)は、主に一連のミームコイン、例えば……$PINGに起因しています。これらのコインは、債券曲線に沿って鋳造するためにx402での支払いを要求します。
それにもかかわらず、x402は新興の分散型人工知能(deAI)プロトコルスタックにおけるアプリケーション層の標準の良い例です。従来のネットワークプロトコルスタックにおける「アプリケーション層」が多くのプロトコル(HTTP、FTP、SMTP、VoIPなど)を含むように、今後もアプリケーション層の標準がさらに現れることが期待されます。
x402を使用する際に、よくある質問は「どのサービスが利用可能かを人々はどのように発見するのか?」です。これが、Ethereum Foundationが主導して開発したERC 8004が「発見層」で機能するところです。
DNSがドメイン名をIPアドレス(google.com → 8.8.8.8)にマッピングするのと同様に、ERC 8004はチェーン上のレジストリを作成することによって、プロキシIDをプロキシのさまざまなリンクや機能にマッピングし、AIプロキシの発見の問題を解決します。ERC 8004は「プロキシカード」をプロキシのアイデンティティとして使用し、信頼スコアや検証などの追加機能を提供します。
ERC 8004はERC721(NFT)とURIStorageを基盤として使用しています。これには、Name、A2A、MCP、OASF、ENS、DID、およびサポートされている信頼の種類(たとえば、信用、暗号経済学、TEE証明)などのパラメータが含まれています。これらの異なるパラメータはすべて、さまざまなエージェントID標準を指しており、エージェントの機能をより包括的に示しています。
ERC 8004は、deAIの発見層としての発展の軌跡が、インターネットプロトコルスタックにおけるDNSに似ていると考えています。つまり、全員が参照する一般的なプロトコルが存在しますが、ユーザーは特定の問い合わせに関する詳細情報を得るために、さまざまなピアノード(ここでは異なるプロキシカードリンクを指します)にリダイレクトされます。
これで、アプリケーション層と発見層について紹介しました。プロトコルスタックの最後の段階はトランスポート層であり、これはアプリケーションがERC 8004のようなプロトコルを介して発見を完了した後、どのように相互に通信するかを処理します。従来のインターネットネットワークプロトコルスタックでは、TCP/IPプロトコルがネットワークデータパケットをクライアントからサーバーに転送する役割を果たします。一方、分散型人工知能(deAI)プロトコルスタックでは、Googleが最近発表したA2Aプロトコルが、エージェント間の通信を実現するために特別に設計されています。
クライアント代理(A2A クライアント)とリモート代理(A2A サーバー)は、HTTPSを介してJSON-RPC 2.0を使用して通信します。本質的に、2つの代理はそれぞれのHTTPエンドポイントにアクセスすることで「対話」を行い、計算やさまざまな機能をリクエストします。A2Aはまた、各代理がその機能、フレームワーク、MCP 添付ファイルなどの情報を公開するための代理カードを持つことを規定しています。
A2Aプロトコルでは、クライアントとリモートプロキシが互いに確認した後、クライアントはHTTPエンドポイントを取得するためにプロキシカードを確認し、対応するサービスをリクエストします。リモートプロキシは、MCPツールや計算リソースなどを利用し、タスク処理中に非同期更新を送信します(推論モデルにおける「思考過程」に似ています)。最後に、最終応答とアーティファクトを送信します。
ここでお勧めする素晴らしい入門記事は、IBMの「A2Aプロトコル(Agent2Agent)とは?」です。
x402、8004、A2Aなどの要素を総合的に考慮すると、Coinbaseが提供するデモの例を参考にできます——Lowe'sから新しい冷蔵庫を購入する場合です。ユーザーがチャットボットと対話し、Lowe'sから冷蔵庫を購入する方法を尋ねたと仮定します。
もちろん、これらすべては従来のHTTP-DNS-TCP/IPネットワークプロトコルスタック上で行われます!
総合的に見て、このスタックはエージェンティックインターネット(のプロトコルバックボーンを構成しており、エージェントはデータを伝送するだけでなく、オンチェーンリソースと取引、検証、および調整を行うことができます。
95.79K 人気度
79.86K 人気度
86.12K 人気度
24.52K 人気度
33.93K 人気度
deAI プロトコルスタックの分解 - x402 / ERC 8004 / A2A
著者:ジェイ・ユー; 編集:ブロックユニコーン##序文
現在、私たちは分散型人工知能(deAI)の「ネットワークプロトコルスタック」が徐々に構築されているのを目にしています。インターネットが一連の相互運用可能な標準の上で動作しているように——トランスポート層はTCP/IPを使用し、サービス発見層はDNSを使用し、アプリケーションロジックはHTTPを使用しています——deAIプロトコルスタックもこれらの3つのモジュールに分解できます:アプリケーション層はx402を使用し、サービス発見層はERC 8004を使用し、トランスポート層はA2Aを使用します——これらすべては従来のHTTPネットワークプロトコルスタックの上で動作しています。
要するに、deAIプロトコルスタックは、エージェントがどのように料金を支払い、リソースを発見し、互いに通信するかを定義します。では、それぞれの部分を一つずつ分析していきましょう:
! 画像
1. アプリケーション層 - x402
去中心化人工知能(deAI)プロトコルスタックの頂点は x402 であり、これは代理人間でさまざまなサービス(例えば、ファイルストレージ、電子商取引、ウェブスクレイピングなど)に対して支払いを行うアプリケーションレイヤープロトコルを表しています。x402 は Coinbase と Cloudflare によって構築されており、元々の「HTTP 402:支払いが必要」というステータスコードを根本的に拡張し、ワークフローの一部として機能させ、代理人が安定コインを使用してサービス料金を支払うことを可能にします。
私は以前、x402について詳細に書いた記事があります。記事のタイトルは《HTTP 402の現代的改造》で、内容にはそのビジョン、アーキテクチャ、機会、そして課題が含まれています。
基本的に、x402は三者間の合意に基づいて動作します。この合意は3つの部分で構成されています:クライアントがリソースを要求する → サーバーが402ステータスコードを返す → 支払い調整者(facilitator)がクライアントの支払い承認を確認し、実際に資金を移転します(例えば、署名されたトランザクションをブロックチェーンに提出する)。これらのステップが完了した後、サーバーはプレミアムコンテンツを解除します。
! 画像
現在、x402scanは、x402サーバーが実際に稼働している際のパフォーマンスを観察するための最良のリソースの一つかもしれません。長期的には、x402が高品質コンテンツのマイクロペイメント(例えば、ウェブスクレイピング、ペイド記事、計算リソース)に大いに貢献するでしょうが、その最近の台頭(x402scanを通じて明確に見ることができます)は、主に一連のミームコイン、例えば……$PINGに起因しています。これらのコインは、債券曲線に沿って鋳造するためにx402での支払いを要求します。
それにもかかわらず、x402は新興の分散型人工知能(deAI)プロトコルスタックにおけるアプリケーション層の標準の良い例です。従来のネットワークプロトコルスタックにおける「アプリケーション層」が多くのプロトコル(HTTP、FTP、SMTP、VoIPなど)を含むように、今後もアプリケーション層の標準がさらに現れることが期待されます。
2. ディスカバリーレイヤー - ERC 8004
x402を使用する際に、よくある質問は「どのサービスが利用可能かを人々はどのように発見するのか?」です。これが、Ethereum Foundationが主導して開発したERC 8004が「発見層」で機能するところです。
DNSがドメイン名をIPアドレス(google.com → 8.8.8.8)にマッピングするのと同様に、ERC 8004はチェーン上のレジストリを作成することによって、プロキシIDをプロキシのさまざまなリンクや機能にマッピングし、AIプロキシの発見の問題を解決します。ERC 8004は「プロキシカード」をプロキシのアイデンティティとして使用し、信頼スコアや検証などの追加機能を提供します。
! 画像
ERC 8004はERC721(NFT)とURIStorageを基盤として使用しています。これには、Name、A2A、MCP、OASF、ENS、DID、およびサポートされている信頼の種類(たとえば、信用、暗号経済学、TEE証明)などのパラメータが含まれています。これらの異なるパラメータはすべて、さまざまなエージェントID標準を指しており、エージェントの機能をより包括的に示しています。
ERC 8004は、deAIの発見層としての発展の軌跡が、インターネットプロトコルスタックにおけるDNSに似ていると考えています。つまり、全員が参照する一般的なプロトコルが存在しますが、ユーザーは特定の問い合わせに関する詳細情報を得るために、さまざまなピアノード(ここでは異なるプロキシカードリンクを指します)にリダイレクトされます。
3. トランスポート層 - A2A プロトコル
これで、アプリケーション層と発見層について紹介しました。プロトコルスタックの最後の段階はトランスポート層であり、これはアプリケーションがERC 8004のようなプロトコルを介して発見を完了した後、どのように相互に通信するかを処理します。従来のインターネットネットワークプロトコルスタックでは、TCP/IPプロトコルがネットワークデータパケットをクライアントからサーバーに転送する役割を果たします。一方、分散型人工知能(deAI)プロトコルスタックでは、Googleが最近発表したA2Aプロトコルが、エージェント間の通信を実現するために特別に設計されています。
クライアント代理(A2A クライアント)とリモート代理(A2A サーバー)は、HTTPSを介してJSON-RPC 2.0を使用して通信します。本質的に、2つの代理はそれぞれのHTTPエンドポイントにアクセスすることで「対話」を行い、計算やさまざまな機能をリクエストします。A2Aはまた、各代理がその機能、フレームワーク、MCP 添付ファイルなどの情報を公開するための代理カードを持つことを規定しています。
! 画像
A2Aプロトコルでは、クライアントとリモートプロキシが互いに確認した後、クライアントはHTTPエンドポイントを取得するためにプロキシカードを確認し、対応するサービスをリクエストします。リモートプロキシは、MCPツールや計算リソースなどを利用し、タスク処理中に非同期更新を送信します(推論モデルにおける「思考過程」に似ています)。最後に、最終応答とアーティファクトを送信します。
ここでお勧めする素晴らしい入門記事は、IBMの「A2Aプロトコル(Agent2Agent)とは?」です。
すべての要因を総合して……
x402、8004、A2Aなどの要素を総合的に考慮すると、Coinbaseが提供するデモの例を参考にできます——Lowe'sから新しい冷蔵庫を購入する場合です。ユーザーがチャットボットと対話し、Lowe'sから冷蔵庫を購入する方法を尋ねたと仮定します。
もちろん、これらすべては従来のHTTP-DNS-TCP/IPネットワークプロトコルスタック上で行われます!
総合的に見て、このスタックはエージェンティックインターネット(のプロトコルバックボーンを構成しており、エージェントはデータを伝送するだけでなく、オンチェーンリソースと取引、検証、および調整を行うことができます。