Une analyse de pourquoi CZ est haussier sur Vana pour construire une meilleure IA

Intermédiaire
4/1/2025, 12:51:29 AM
À l'ère de la rareté des données en IA, comment Vana utilise-t-elle la blockchain pour briser le monopole des géants de la technologie ? Cet article explore la manière dont le mécanisme DataDAO donne aux utilisateurs le contrôle de la souveraineté des données, leur permet de gagner des parts de bénéfices de modèle et favorise un écosystème d'IA démocratisé. Des données de conduite de Tesla aux batailles sur la confidentialité génétique, découvrez pourquoi CZ et les principaux VC investissent dans l'infrastructure de données de nouvelle génération.

Il y a un mois, YZi Labs a annoncé son investissement dans Vana, avec le fondateur de Binance CZ rejoignant en tant que conseiller, consolidant ainsi la position de leader de Vana dans le secteur des données IA. Quatre jours plus tard, lors d'une AMA avec Vana, CZ a déclaré que les données sont le carburant essentiel pour l'IA, que les données publiques ont été épuisées et que les données privées restent inexploitées. Il a exprimé son optimisme quant à l'adéquation produit-marché (PMF) de Vana et à la croissance des utilisateurs.

Pourquoi YZi Labs, Coinbase Ventures et Paradigm ont-ils investi dans Vana ? Pourquoi CZ est-il optimiste quant au développement de Vana ?

Ce rapport analyse systématiquement les défis des données de l'IA, la proposition de valeur principale de Vana, les applications pratiques et la trajectoire de croissance future, révélant comment Vana devient une infrastructure critique pour l'écosystème de l'IA.

01 IA et le dilemme des données : franchir les barrières fermées

Selon les données de PitchBook, l'industrie de l'IA aux États-Unis a attiré près de 20 milliards de dollars d'investissements au T1 2025. D'ici 2024, les startups en IA représentaient un tiers du capital-risque mondial, totalisant 131,5 milliards de dollars, avec près d'un quart des nouvelles entreprises se concentrant sur l'IA. Les données de Statista confirment également cette croissance explosive : le financement de capital-risque pour l'IA et l'apprentissage automatique est passé de 670 millions de dollars en 2011 à 36 milliards de dollars en 2020, soit une augmentation de 50 fois. Cette tendance indique clairement que l'IA est devenue le choix partagé du capital intelligent et des meilleurs entrepreneurs.

Cependant, l'architecture fondamentale de l'IA - « données + modèles + calcul » - rencontre des goulots d'étranglement structurels. Le principal moteur des performances des modèles d'IA n'est pas la puissance de calcul ou les percées algorithmiques, mais la qualité et l'échelle des ensembles de données d'entraînement. Les modèles linguistiques de grande taille actuels approchent d'un point critique d'épuisement des données. Le Llama 3 de Meta a été entraîné sur environ 15 billions de jetons, épuisant presque toutes les données de haute qualité disponibles sur internet public. Malgré le vaste volume de données disponibles sur internet public, cela ne représente que la pointe de l'iceberg. Un fait largement négligé est que les données de grande valeur sont principalement verrouillées derrière des systèmes propriétaires nécessitant un accès autorisé. Les données disponibles sur internet public ne représentent pas plus de 0,1 % de toutes les données. Ce problème dépasse la capacité de l'industrie de l'IA à le résoudre seule et nécessite la technologie blockchain pour redéfinir les relations de production des données, établir de nouveaux mécanismes d'incitation et catalyser l'émergence de données de haute qualité à grande échelle.

D'autre part, de nos jours, la plupart des données sont contrôlées par des entreprises technologiques Web2 au sein d'écosystèmes fermés. Le développement de l'IA est confronté au défi des murs de données, une barrière qui existe car ces entreprises reconnaissent l'immense valeur des données. Les modèles d'IA de haute qualité génèrent des retours économiques significatifs - par exemple, le chiffre d'affaires annuel d'OpenAI a atteint environ 3,4 milliards de dollars. La construction de modèles d'IA supérieurs nécessite des quantités massives de données, souvent à des coûts d'acquisition élevés.

Par exemple, Reddit gagne environ 200 millions de dollars par an en vendant des données, facture les photos de 1 à 2 dollars US par image, et les transactions de données d'actualités d'Apple s'élèvent à 50 millions de dollars US. La propriété des données a évolué d'une simple préférence en matière de confidentialité à un problème économique majeur. Dans un monde où les modèles d'IA stimulent une grande partie de l'économie, la propriété des données équivaut à détenir des actions dans les futurs modèles d'IA.

À mesure que la commercialisation des données devient plus courante, l'accès aux données devient de plus en plus difficile. De nombreuses plateformes ajustent leurs conditions de service et leurs politiques d'API pour restreindre l'accès des développeurs externes. Par exemple, Reddit et Stack Overflow ont modifié les règles de leur API, rendant l'acquisition de données plus difficile. Cette tendance s'accentue, avec des plateformes riches en données se tournant vers une plus grande exclusivité.

Pourtant, un groupe conserve un accès libre à ces données : les utilisateurs eux-mêmes. Beaucoup de personnes ignorent qu'en droit, ils conservent la pleine propriété de leurs données. Tout comme le fait de garer une voiture dans un parking ne confère pas au parking les droits sur le véhicule, les données des utilisateurs stockées sur les plateformes sociales restent leur propriété.

Lors de l'inscription, les utilisateurs cocheront généralement des cases permettant aux plateformes de "utiliser leurs données", ce qui accorde aux plateformes l'autorisation d'exploiter des services mais ne renonce pas à la propriété. Les utilisateurs peuvent demander leurs données à tout moment. Même si les plateformes restreignent l'accès API aux développeurs, les utilisateurs individuels peuvent toujours légalement récupérer leurs données. Par exemple, Instagram permet aux utilisateurs d'exporter des données de compte, y compris des photos, des commentaires et même des balises marketing générées par l'IA. Sur 23andMe, les utilisateurs peuvent demander leurs données génétiques, bien que le processus puisse ne pas être intuitif.

Au niveau mondial, les réglementations s'améliorent pour garantir aux utilisateurs la possibilité de récupérer leurs données. À mesure que la valeur des données augmente, les utilisateurs doivent reconnaître et exercer leurs droits de propriété.

02 Concepts Fondamentaux de VANA

Les entreprises technologiques construisent des systèmes fermés pour protéger leurs précieux actifs de données. La mission de VANA est de déverrouiller ces données et de redonner le contrôle aux utilisateurs, permettant la souveraineté des données.

En d'autres termes, les utilisateurs peuvent extraire leurs données de différentes plateformes et créer des ensembles de données supérieurs à ceux proposés par toute plateforme existante.

Le cadre de VANA est construit sur deux concepts fondamentaux :

  • Données non détenues : les utilisateurs contrôlent l'accès aux données comme la gestion des actifs cryptographiques dans un portefeuille numérique. Dans l'écosystème de VANA, les utilisateurs autorisent les applications à accéder à leurs données via des transactions signées, garantissant autonomie et sécurité.
  • Preuve de contribution : Alors qu'un seul point de données a une valeur négligeable, la valeur des données agrégées augmente de manière exponentielle. Ce mécanisme garantit des pools de données de haute qualité et crée de la valeur pour les contributeurs.

Lorsque les développeurs paient pour accéder aux données, les contributeurs reçoivent des jetons de gouvernance proportionnels à leur contribution. Cela permet aux contributeurs de gagner des récompenses continues et de participer à la prise de décision, remodelant ainsi la tarification et l'efficacité du marché des données.

Applications de l'écosystème 03 de VANA

3.1 DataDAO

DataDAO est un marché de données décentralisé au sein de l'écosystème VANA, permettant aux utilisateurs de contribuer, de tokeniser et d'utiliser des données. Les utilisateurs peuvent sélectionner des pools de minage de données adaptés (par exemple, des données de fitness, des données de recherche) pour contribuer à leurs données. Les données contribuées font l'objet d'une validation par le mécanisme de preuve de contribution de Vana, qui évalue leur qualité et leur valeur pour assurer une rémunération équitable pour les contributeurs.

Une fois vérifiées, les données sont tokenisées en actifs numériques qui peuvent être échangés ou utilisés pour l'entraînement de l'IA, tandis que les contributeurs conservent le contrôle sur leur utilisation. Chaque fois que les données sont utilisées, les contributeurs reçoivent des récompenses en jetons et des droits de gouvernance, ce qui leur permet de bénéficier économiquement et d'influencer la direction du pool de données. En agrégeant des ensembles de données diversifiés, DataDAO crée un marché de données liquide, facilitant la circulation sécurisée et efficace des données au sein de l'écosystème VANA.

Au cœur de DataDAO se trouve le Data Liquidity Pool (DLP) - une collection d'ensembles de données validés liés à des jetons. Les DLP sont gérés par les membres de DataDAO, qui détiennent des droits de gouvernance. Chaque DLP définit clairement sa structure de données et ses normes de contribution. Par exemple, Sleep.com, un DataDAO axé sur le sommeil, a établi un schéma de données bien défini pour garantir que toutes les données sur la chaîne sont structurées et exploitables. La valeur des données réside non seulement dans leur volume, mais aussi dans leur structure et leur accessibilité.

DataDAO accorde une grande importance à l'authenticité et à la validité des données. Actuellement, la plupart des DataDAO utilisent des Environnements d'Exécution de Confiance (TEEs) pour exécuter des scripts Python afin de valider les données, garantissant ainsi la qualité tout en préservant la confidentialité. Par exemple, Amazon DataDAO utilise des extensions de navigateur pour générer des preuves de qualité des données. Toutes les DataDAO publient publiquement leurs mécanismes de Preuve-de-Contribution, permettant aux utilisateurs de comprendre comment la qualité des données est assurée.

Les 16 meilleurs DLP de l'écosystème VANA reçoivent des incitations supplémentaires, permettant aux utilisateurs de gagner des récompenses en contribuant des données de haute qualité. Les récompenses sont distribuées en fonction de métriques telles que la fréquence d'accès aux données, la qualité et la rentabilité. Actuellement, le Reddit DataDAO est le plus important, attirant environ 140 000 utilisateurs et formant avec succès un modèle d'IA appartenant à la communauté. Le DataDAO de DLP Labs permet aux conducteurs de connecter leurs comptes DIMO_Network, partageant les données des véhicules pour gagner des récompenses et faire avancer l'innovation en matière d'IA dans le secteur automobile. Pendant ce temps, 23andWE vise à acquérir 23andMe pour empêcher l'exploitation des données génétiques.

DataDAO représente une approche révolutionnaire de la gestion des données, permettant aux individus de prendre le contrôle de leurs données et de les monétiser grâce à la tokenisation. Cet écosystème en constante évolution ouvre la voie à des possibilités plus ouvertes et démocratiques pour la gouvernance des données et la formation en IA.

3.2 DataFi

S'appuyant sur les pools de liquidité des données, la DeFi est progressivement appliquée au domaine des jetons de données. Les pools de liquidité des données servent de couche fondamentale à l'ensemble de l'écosystème, sur laquelle diverses applications DeFi peuvent être construites à l'aide de jetons de données.

Actuellement, certaines applications précoces ont émergé dans l'écosystème Data DeFi. Par exemple, des échanges décentralisés comme @VanaDataDexet@flur_protocolpermettre aux utilisateurs de négocier des jetons de données et de suivre les dynamiques du marché pour des jetons de données spécifiques. L'émergence de ces plateformes a facilité le libre flux des actifs de données et a dynamisé le marché des données.

Il convient de noter que la plupart des mécanismes de récompense DLP déposent principalement les récompenses dans le trésor DLP plutôt que de brûler directement des jetons de données ou d'affecter leur offre et leur demande. Cependant, avec l'introduction de la mise à jour VRC-13, ce mécanisme a évolué. Le nouveau modèle introduit une approche plus axée sur le marché : en incitant les récompenses VANA pour promouvoir la tokenisation des données, qui sont ensuite injectées dans les pools DEX pour améliorer le trading de jetons de données et activer davantage l'écosystème DeFi.

En regardant vers l'avenir, les fonctionnalités actuellement réalisables dans l'espace DeFi - telles que le prêt, le staking, l'exploitation de liquidités et même l'assurance - peuvent être introduites sur le marché des jetons de données, créant ainsi des scénarios d'application entièrement nouveaux.

Du point de vue des industries traditionnelles du Web2, tout comme les entreprises achètent des contrats à terme sur le pétrole pour se couvrir contre les fluctuations de prix, le marché des données pourrait développer des contrats à terme sur les données, permettant aux utilisateurs de verrouiller les prix futurs des ensembles de données à l'avance et de réduire l'incertitude des coûts d'acquisition.

Certaines sociétés de trading ont déjà commencé à traiter les données comme une nouvelle classe d'actifs, recherchant des méthodes d'évaluation telles que l'évaluation de la valeur de jetons de données spécifiques, la probabilité d'utilisation des ventes et l'analyse du cycle de vie. Ces facteurs influent directement sur le prix des jetons de données et la liquidité du marché, laissant ainsi ample place à l'innovation.

3.3 Accès simplifié aux données

Actuellement, l'accès aux ensembles de données sur le mainnet reste relativement fastidieux. Les utilisateurs doivent soumettre des demandes détaillées spécifiant leurs besoins, les montants de paiement et le code du projet, puis attendre l'approbation avant d'obtenir l'accès. Bien que cela garantisse la transparence et la standardisation, cela crée des frictions opérationnelles.

Pour améliorer l'efficacité, Vana développe des méthodes d'accès aux données plus efficaces qui permettent un accès automatisé à l'API et une récupération directe des données à travers plusieurs DataDAOs. Par exemple, à l'avenir, les utilisateurs pourraient combiner les données de sommeil avec les données de trading de Coinbase ou Binance pour analyser les habitudes de sommeil des détenteurs de jetons spécifiques et découvrir de nouvelles perspectives de marché.

De plus, Gate avance une nouvelle proposition qui met en œuvre un ratio standard de 80-20 pour la combustion des jetons de données et VANA en échange des droits d'accès aux données.

Vana a également développé une nouvelle interface de requête de données qui simplifie considérablement le processus d’accès aux données. Les utilisateurs peuvent s’authentifier via la connexion au portefeuille et générer des signatures numériques pour vérifier leurs autorisations d’accès. Étant donné que les pools de liquidité de données (DLP) enregistrent des formats de données, les utilisateurs peuvent clairement comprendre les structures de données et récupérer les informations nécessaires à l’aide de requêtes SQL. Au cours de ce processus, les utilisateurs peuvent d’abord recevoir des échantillons de données synthétiques pour tester et vérifier l’exactitude des requêtes. Lorsque vous travaillez avec des données réelles, tous les calculs sont effectués dans des environnements d’exécution approuvés (TEE) pour garantir la sécurité des données. Ce mécanisme permet d’éviter efficacement le « problème des données à double usage » (où les utilisateurs peuvent revendre les données achetées), protégeant ainsi la valeur économique des données et assurant le développement durable du marché des données.

Analyse de la valeur de 04 Vana

Les données émergent rapidement comme l'actif principal de l'ère numérique. Alors que les technologies de collecte et de stockage de données ont atteint une maturité considérable, le véritable défi réside dans l'évaluation efficace de la qualité des données, la maximisation de leur valeur et la garantie de la protection de la vie privée. Vana aborde élégamment ce défi grâce à son mécanisme d'incitation innovant : les utilisateurs peuvent miser des jetons VANA pour soutenir des DataDAOs de grande valeur tout en gagnant des récompenses correspondantes, créant ainsi un cycle vertueux de création de valeur.

4.1 Franchir le "Mur de données"

Le développement de l'IA a atteint le "mur des données" - les ressources publiques de données de haute qualité sont sur le point de s'épuiser. Les futures percées en matière d'IA dépendront inévitablement de l'accès et de l'utilisation efficaces de données privées à haute valeur, telles que les dossiers de santé personnels, les données d'utilisation des appareils intelligents et les vidéos de conduite de Tesla en tant que ressources potentielles de formation.

Un paradoxe existe dans la valeur des données : les données conservent leur valeur grâce à leur exclusivité, mais deviennent des marchandises et se déprécient une fois largement disponibles. Alors que les modèles d'IA subissent eux-mêmes une marchandisation, l'avantage concurrentiel à long terme viendra du contrôle de ensembles de données uniques qui permettent des performances supérieures dans des domaines spécialisés. Une fois que les données deviennent publiques, la concurrence des prix émerge presque immédiatement, provoquant une rapide érosion de la valeur.

Le DataDAO de Vana exploite les environnements d'exécution de confiance (TEEs) pour permettre le transfert de données privées de grande valeur tout en préservant la confidentialité. Cette percée élargit le champ d'application des actifs de données précieuses des ensembles de données publics limités au vaste domaine des données privées, ouvrant de nouvelles possibilités pour l'avancement de l'IA.

4.2 La courbe de valeur unique des données

Les données présentent une courbe de valeur distinctive : les points de données individuels ont une valeur négligeable, mais lorsqu'ils sont agrégés à une masse critique, leur valeur augmente de manière exponentielle. Cette caractéristique présente des défis importants pour la monétisation des données - des rendements substantiels ne se matérialisent qu'après la formation de jeux de données collectifs.

Le mécanisme DataDAO de Vana offre une solution innovante à ce dilemme. En regroupant des données similaires, les DataDAO créent un pouvoir de négociation collective pour les contributeurs. Prenons l'exemple des propriétaires de Tesla : si tous les propriétaires partagent collectivement les données de conduite via un DataDAO, ils acquièrent un important pouvoir de négociation avec tout acheteur potentiel. En revanche, si les propriétaires tentent individuellement de monétiser leurs données, cela entraîne inévitablement une concurrence sur les prix où les acheteurs peuvent simplement acquérir suffisamment d'échantillons auprès des plus offrants.

Les ensembles de données de haute qualité structurés et vérifiés (comme les données de conduite de Tesla authentifiées) commandent une valeur marchande premium, et le cadre de Vana permet une réalisation complète de cette valeur.

4.3 La Percée de l'Aggrégation de Données Multiplateformes

L'aspect le plus puissant des DataDAOs est leur capacité à réaliser une agrégation de données interplateformes - quelque chose de presque impossible dans les écosystèmes clos d'aujourd'hui. Imaginez des chercheurs ayant besoin d'accéder aux messages combinés d'un utilisateur sur Facebook, à l'historique iMessage et au contenu Google Docs. L'approche traditionnelle nécessiterait une coopération entre Facebook, Apple et Google - des plateformes qui n'ont ni l'incitation à intégrer les données des utilisateurs (ce qui affaiblirait leurs fossés de données) ni l'autorisation réglementaire pour le faire.

Les DataDAO contournent élégamment cet obstacle grâce à une intégration de données dirigée par l'utilisateur, débloquant la valeur des données interplateformes et créant des opportunités sans précédent pour la formation et la recherche en IA.

4.4 Nouveau Modèle de Participation Économique

La vision de Vana va bien au-delà de l'innovation technologique pure - elle est à la pointe d'un tout nouveau paradigme de participation économique. Selon ce modèle, les utilisateurs peuvent s'engager dans l'économie numérique sans les exigences en capital traditionnelles, car ils possèdent déjà la ressource la plus précieuse : leurs données personnelles. Les utilisateurs n'ont pas besoin d'apporter de capital financier ; le partage de leurs données devient leur capital. Les DataDAOs fournissent aux utilisateurs de Web3 des flux de revenus passifs dérivés de leurs données personnelles uniques, abaissant considérablement la barrière à l'entrée pour participer à l'économie numérique.

4.5 Reshaping AI Distribution des bénéfices

Ce modèle pourrait fondamentalement restructurer la manière dont la valeur des avancées en matière d'IA est distribuée. Plutôt que les profits ne profitent principalement aux grandes entreprises technologiques, la propriété des données et les mécanismes de gouvernance de Vana permettent une participation large dans l'économie de l'IA. Les premiers indicateurs montrent une forte résonance avec cette approche - plus de 300 DataDAOs sont déjà en développement sur les testnets.

En regardant 3 à 5 ans à l'avance, nous pourrions assister à l'émergence de modèles d'IA entièrement gouvernés par les utilisateurs construits par 100 millions de contributeurs de données - des modèles qui pourraient surpasser les principaux systèmes d'IA centralisés d'aujourd'hui. Ces modèles détenus par la communauté créent un engagement et des connexions plus forts avec les utilisateurs. La souveraineté des données permet aux utilisateurs de soutenir sélectivement le développement éthique de l'IA tout en refusant l'accès aux entreprises non éthiques.

L'IA décentralisée offre un cadre plus démocratique où la société détermine collectivement ce que l'IA devrait apprendre et croire, plutôt que de laisser ces décisions à quelques grandes entreprises. La propriété des données des utilisateurs se traduit non seulement par des avantages économiques, mais aussi par un contrôle substantiel sur le comportement du modèle d'IA, y compris la résolution de problèmes critiques tels que les politiques de modération du contenu.

05 Conclusion

Au niveau commercial, Vana s'engage à construire une chaîne de valeur des données complète qui couvre l'ensemble du processus, de l'agrégation des données à la formation des modèles d'IA en passant par la vente de données. Actuellement, le marché des données est monopolisé par quelques plateformes et courtiers en données. Vana vise à résoudre cette inefficacité en créant un écosystème de trading de données plus équitable.

Vana n'est pas simplement une nouvelle plateforme, elle représente un changement fondamental dans la propriété des données et le développement de l'IA. En permettant aux utilisateurs de participer à la création de valeur collective tout en conservant leur souveraineté sur leurs données, Vana pose les bases d'un avenir de l'IA plus équitable et innovant.

Sur le marché actuel de l'IA, qui regorge d'enthousiasme conceptuel, Vana se distingue par ses mécanismes innovants qui s'attaquent directement aux défis fondamentaux de l'industrie. Il a le potentiel de devenir une force pivot dans la définition de la trajectoire future de l'IA.

Clause de non-responsabilité :

  1. Cet article est reproduit à partir de [GateBiteye], les droits d'auteur appartiennent à l'auteur original [Biteye] si vous avez des objections à la reproduction, veuillez contacter le Apprendre Gatel'équipe, et l'équipe le traitera dès que possible selon les procédures pertinentes.

  2. Avertissement: Les points de vue et opinions exprimés dans cet article ne représentent que les points de vue personnels de l'auteur et ne constituent pas des conseils en investissement.

  3. Les autres versions linguistiques de l'article sont traduites par l'équipe Gate Learn. L'article traduit ne peut être copié, distribué ou plagié sans mentionner Gate.io.

Une analyse de pourquoi CZ est haussier sur Vana pour construire une meilleure IA

Intermédiaire4/1/2025, 12:51:29 AM
À l'ère de la rareté des données en IA, comment Vana utilise-t-elle la blockchain pour briser le monopole des géants de la technologie ? Cet article explore la manière dont le mécanisme DataDAO donne aux utilisateurs le contrôle de la souveraineté des données, leur permet de gagner des parts de bénéfices de modèle et favorise un écosystème d'IA démocratisé. Des données de conduite de Tesla aux batailles sur la confidentialité génétique, découvrez pourquoi CZ et les principaux VC investissent dans l'infrastructure de données de nouvelle génération.

Il y a un mois, YZi Labs a annoncé son investissement dans Vana, avec le fondateur de Binance CZ rejoignant en tant que conseiller, consolidant ainsi la position de leader de Vana dans le secteur des données IA. Quatre jours plus tard, lors d'une AMA avec Vana, CZ a déclaré que les données sont le carburant essentiel pour l'IA, que les données publiques ont été épuisées et que les données privées restent inexploitées. Il a exprimé son optimisme quant à l'adéquation produit-marché (PMF) de Vana et à la croissance des utilisateurs.

Pourquoi YZi Labs, Coinbase Ventures et Paradigm ont-ils investi dans Vana ? Pourquoi CZ est-il optimiste quant au développement de Vana ?

Ce rapport analyse systématiquement les défis des données de l'IA, la proposition de valeur principale de Vana, les applications pratiques et la trajectoire de croissance future, révélant comment Vana devient une infrastructure critique pour l'écosystème de l'IA.

01 IA et le dilemme des données : franchir les barrières fermées

Selon les données de PitchBook, l'industrie de l'IA aux États-Unis a attiré près de 20 milliards de dollars d'investissements au T1 2025. D'ici 2024, les startups en IA représentaient un tiers du capital-risque mondial, totalisant 131,5 milliards de dollars, avec près d'un quart des nouvelles entreprises se concentrant sur l'IA. Les données de Statista confirment également cette croissance explosive : le financement de capital-risque pour l'IA et l'apprentissage automatique est passé de 670 millions de dollars en 2011 à 36 milliards de dollars en 2020, soit une augmentation de 50 fois. Cette tendance indique clairement que l'IA est devenue le choix partagé du capital intelligent et des meilleurs entrepreneurs.

Cependant, l'architecture fondamentale de l'IA - « données + modèles + calcul » - rencontre des goulots d'étranglement structurels. Le principal moteur des performances des modèles d'IA n'est pas la puissance de calcul ou les percées algorithmiques, mais la qualité et l'échelle des ensembles de données d'entraînement. Les modèles linguistiques de grande taille actuels approchent d'un point critique d'épuisement des données. Le Llama 3 de Meta a été entraîné sur environ 15 billions de jetons, épuisant presque toutes les données de haute qualité disponibles sur internet public. Malgré le vaste volume de données disponibles sur internet public, cela ne représente que la pointe de l'iceberg. Un fait largement négligé est que les données de grande valeur sont principalement verrouillées derrière des systèmes propriétaires nécessitant un accès autorisé. Les données disponibles sur internet public ne représentent pas plus de 0,1 % de toutes les données. Ce problème dépasse la capacité de l'industrie de l'IA à le résoudre seule et nécessite la technologie blockchain pour redéfinir les relations de production des données, établir de nouveaux mécanismes d'incitation et catalyser l'émergence de données de haute qualité à grande échelle.

D'autre part, de nos jours, la plupart des données sont contrôlées par des entreprises technologiques Web2 au sein d'écosystèmes fermés. Le développement de l'IA est confronté au défi des murs de données, une barrière qui existe car ces entreprises reconnaissent l'immense valeur des données. Les modèles d'IA de haute qualité génèrent des retours économiques significatifs - par exemple, le chiffre d'affaires annuel d'OpenAI a atteint environ 3,4 milliards de dollars. La construction de modèles d'IA supérieurs nécessite des quantités massives de données, souvent à des coûts d'acquisition élevés.

Par exemple, Reddit gagne environ 200 millions de dollars par an en vendant des données, facture les photos de 1 à 2 dollars US par image, et les transactions de données d'actualités d'Apple s'élèvent à 50 millions de dollars US. La propriété des données a évolué d'une simple préférence en matière de confidentialité à un problème économique majeur. Dans un monde où les modèles d'IA stimulent une grande partie de l'économie, la propriété des données équivaut à détenir des actions dans les futurs modèles d'IA.

À mesure que la commercialisation des données devient plus courante, l'accès aux données devient de plus en plus difficile. De nombreuses plateformes ajustent leurs conditions de service et leurs politiques d'API pour restreindre l'accès des développeurs externes. Par exemple, Reddit et Stack Overflow ont modifié les règles de leur API, rendant l'acquisition de données plus difficile. Cette tendance s'accentue, avec des plateformes riches en données se tournant vers une plus grande exclusivité.

Pourtant, un groupe conserve un accès libre à ces données : les utilisateurs eux-mêmes. Beaucoup de personnes ignorent qu'en droit, ils conservent la pleine propriété de leurs données. Tout comme le fait de garer une voiture dans un parking ne confère pas au parking les droits sur le véhicule, les données des utilisateurs stockées sur les plateformes sociales restent leur propriété.

Lors de l'inscription, les utilisateurs cocheront généralement des cases permettant aux plateformes de "utiliser leurs données", ce qui accorde aux plateformes l'autorisation d'exploiter des services mais ne renonce pas à la propriété. Les utilisateurs peuvent demander leurs données à tout moment. Même si les plateformes restreignent l'accès API aux développeurs, les utilisateurs individuels peuvent toujours légalement récupérer leurs données. Par exemple, Instagram permet aux utilisateurs d'exporter des données de compte, y compris des photos, des commentaires et même des balises marketing générées par l'IA. Sur 23andMe, les utilisateurs peuvent demander leurs données génétiques, bien que le processus puisse ne pas être intuitif.

Au niveau mondial, les réglementations s'améliorent pour garantir aux utilisateurs la possibilité de récupérer leurs données. À mesure que la valeur des données augmente, les utilisateurs doivent reconnaître et exercer leurs droits de propriété.

02 Concepts Fondamentaux de VANA

Les entreprises technologiques construisent des systèmes fermés pour protéger leurs précieux actifs de données. La mission de VANA est de déverrouiller ces données et de redonner le contrôle aux utilisateurs, permettant la souveraineté des données.

En d'autres termes, les utilisateurs peuvent extraire leurs données de différentes plateformes et créer des ensembles de données supérieurs à ceux proposés par toute plateforme existante.

Le cadre de VANA est construit sur deux concepts fondamentaux :

  • Données non détenues : les utilisateurs contrôlent l'accès aux données comme la gestion des actifs cryptographiques dans un portefeuille numérique. Dans l'écosystème de VANA, les utilisateurs autorisent les applications à accéder à leurs données via des transactions signées, garantissant autonomie et sécurité.
  • Preuve de contribution : Alors qu'un seul point de données a une valeur négligeable, la valeur des données agrégées augmente de manière exponentielle. Ce mécanisme garantit des pools de données de haute qualité et crée de la valeur pour les contributeurs.

Lorsque les développeurs paient pour accéder aux données, les contributeurs reçoivent des jetons de gouvernance proportionnels à leur contribution. Cela permet aux contributeurs de gagner des récompenses continues et de participer à la prise de décision, remodelant ainsi la tarification et l'efficacité du marché des données.

Applications de l'écosystème 03 de VANA

3.1 DataDAO

DataDAO est un marché de données décentralisé au sein de l'écosystème VANA, permettant aux utilisateurs de contribuer, de tokeniser et d'utiliser des données. Les utilisateurs peuvent sélectionner des pools de minage de données adaptés (par exemple, des données de fitness, des données de recherche) pour contribuer à leurs données. Les données contribuées font l'objet d'une validation par le mécanisme de preuve de contribution de Vana, qui évalue leur qualité et leur valeur pour assurer une rémunération équitable pour les contributeurs.

Une fois vérifiées, les données sont tokenisées en actifs numériques qui peuvent être échangés ou utilisés pour l'entraînement de l'IA, tandis que les contributeurs conservent le contrôle sur leur utilisation. Chaque fois que les données sont utilisées, les contributeurs reçoivent des récompenses en jetons et des droits de gouvernance, ce qui leur permet de bénéficier économiquement et d'influencer la direction du pool de données. En agrégeant des ensembles de données diversifiés, DataDAO crée un marché de données liquide, facilitant la circulation sécurisée et efficace des données au sein de l'écosystème VANA.

Au cœur de DataDAO se trouve le Data Liquidity Pool (DLP) - une collection d'ensembles de données validés liés à des jetons. Les DLP sont gérés par les membres de DataDAO, qui détiennent des droits de gouvernance. Chaque DLP définit clairement sa structure de données et ses normes de contribution. Par exemple, Sleep.com, un DataDAO axé sur le sommeil, a établi un schéma de données bien défini pour garantir que toutes les données sur la chaîne sont structurées et exploitables. La valeur des données réside non seulement dans leur volume, mais aussi dans leur structure et leur accessibilité.

DataDAO accorde une grande importance à l'authenticité et à la validité des données. Actuellement, la plupart des DataDAO utilisent des Environnements d'Exécution de Confiance (TEEs) pour exécuter des scripts Python afin de valider les données, garantissant ainsi la qualité tout en préservant la confidentialité. Par exemple, Amazon DataDAO utilise des extensions de navigateur pour générer des preuves de qualité des données. Toutes les DataDAO publient publiquement leurs mécanismes de Preuve-de-Contribution, permettant aux utilisateurs de comprendre comment la qualité des données est assurée.

Les 16 meilleurs DLP de l'écosystème VANA reçoivent des incitations supplémentaires, permettant aux utilisateurs de gagner des récompenses en contribuant des données de haute qualité. Les récompenses sont distribuées en fonction de métriques telles que la fréquence d'accès aux données, la qualité et la rentabilité. Actuellement, le Reddit DataDAO est le plus important, attirant environ 140 000 utilisateurs et formant avec succès un modèle d'IA appartenant à la communauté. Le DataDAO de DLP Labs permet aux conducteurs de connecter leurs comptes DIMO_Network, partageant les données des véhicules pour gagner des récompenses et faire avancer l'innovation en matière d'IA dans le secteur automobile. Pendant ce temps, 23andWE vise à acquérir 23andMe pour empêcher l'exploitation des données génétiques.

DataDAO représente une approche révolutionnaire de la gestion des données, permettant aux individus de prendre le contrôle de leurs données et de les monétiser grâce à la tokenisation. Cet écosystème en constante évolution ouvre la voie à des possibilités plus ouvertes et démocratiques pour la gouvernance des données et la formation en IA.

3.2 DataFi

S'appuyant sur les pools de liquidité des données, la DeFi est progressivement appliquée au domaine des jetons de données. Les pools de liquidité des données servent de couche fondamentale à l'ensemble de l'écosystème, sur laquelle diverses applications DeFi peuvent être construites à l'aide de jetons de données.

Actuellement, certaines applications précoces ont émergé dans l'écosystème Data DeFi. Par exemple, des échanges décentralisés comme @VanaDataDexet@flur_protocolpermettre aux utilisateurs de négocier des jetons de données et de suivre les dynamiques du marché pour des jetons de données spécifiques. L'émergence de ces plateformes a facilité le libre flux des actifs de données et a dynamisé le marché des données.

Il convient de noter que la plupart des mécanismes de récompense DLP déposent principalement les récompenses dans le trésor DLP plutôt que de brûler directement des jetons de données ou d'affecter leur offre et leur demande. Cependant, avec l'introduction de la mise à jour VRC-13, ce mécanisme a évolué. Le nouveau modèle introduit une approche plus axée sur le marché : en incitant les récompenses VANA pour promouvoir la tokenisation des données, qui sont ensuite injectées dans les pools DEX pour améliorer le trading de jetons de données et activer davantage l'écosystème DeFi.

En regardant vers l'avenir, les fonctionnalités actuellement réalisables dans l'espace DeFi - telles que le prêt, le staking, l'exploitation de liquidités et même l'assurance - peuvent être introduites sur le marché des jetons de données, créant ainsi des scénarios d'application entièrement nouveaux.

Du point de vue des industries traditionnelles du Web2, tout comme les entreprises achètent des contrats à terme sur le pétrole pour se couvrir contre les fluctuations de prix, le marché des données pourrait développer des contrats à terme sur les données, permettant aux utilisateurs de verrouiller les prix futurs des ensembles de données à l'avance et de réduire l'incertitude des coûts d'acquisition.

Certaines sociétés de trading ont déjà commencé à traiter les données comme une nouvelle classe d'actifs, recherchant des méthodes d'évaluation telles que l'évaluation de la valeur de jetons de données spécifiques, la probabilité d'utilisation des ventes et l'analyse du cycle de vie. Ces facteurs influent directement sur le prix des jetons de données et la liquidité du marché, laissant ainsi ample place à l'innovation.

3.3 Accès simplifié aux données

Actuellement, l'accès aux ensembles de données sur le mainnet reste relativement fastidieux. Les utilisateurs doivent soumettre des demandes détaillées spécifiant leurs besoins, les montants de paiement et le code du projet, puis attendre l'approbation avant d'obtenir l'accès. Bien que cela garantisse la transparence et la standardisation, cela crée des frictions opérationnelles.

Pour améliorer l'efficacité, Vana développe des méthodes d'accès aux données plus efficaces qui permettent un accès automatisé à l'API et une récupération directe des données à travers plusieurs DataDAOs. Par exemple, à l'avenir, les utilisateurs pourraient combiner les données de sommeil avec les données de trading de Coinbase ou Binance pour analyser les habitudes de sommeil des détenteurs de jetons spécifiques et découvrir de nouvelles perspectives de marché.

De plus, Gate avance une nouvelle proposition qui met en œuvre un ratio standard de 80-20 pour la combustion des jetons de données et VANA en échange des droits d'accès aux données.

Vana a également développé une nouvelle interface de requête de données qui simplifie considérablement le processus d’accès aux données. Les utilisateurs peuvent s’authentifier via la connexion au portefeuille et générer des signatures numériques pour vérifier leurs autorisations d’accès. Étant donné que les pools de liquidité de données (DLP) enregistrent des formats de données, les utilisateurs peuvent clairement comprendre les structures de données et récupérer les informations nécessaires à l’aide de requêtes SQL. Au cours de ce processus, les utilisateurs peuvent d’abord recevoir des échantillons de données synthétiques pour tester et vérifier l’exactitude des requêtes. Lorsque vous travaillez avec des données réelles, tous les calculs sont effectués dans des environnements d’exécution approuvés (TEE) pour garantir la sécurité des données. Ce mécanisme permet d’éviter efficacement le « problème des données à double usage » (où les utilisateurs peuvent revendre les données achetées), protégeant ainsi la valeur économique des données et assurant le développement durable du marché des données.

Analyse de la valeur de 04 Vana

Les données émergent rapidement comme l'actif principal de l'ère numérique. Alors que les technologies de collecte et de stockage de données ont atteint une maturité considérable, le véritable défi réside dans l'évaluation efficace de la qualité des données, la maximisation de leur valeur et la garantie de la protection de la vie privée. Vana aborde élégamment ce défi grâce à son mécanisme d'incitation innovant : les utilisateurs peuvent miser des jetons VANA pour soutenir des DataDAOs de grande valeur tout en gagnant des récompenses correspondantes, créant ainsi un cycle vertueux de création de valeur.

4.1 Franchir le "Mur de données"

Le développement de l'IA a atteint le "mur des données" - les ressources publiques de données de haute qualité sont sur le point de s'épuiser. Les futures percées en matière d'IA dépendront inévitablement de l'accès et de l'utilisation efficaces de données privées à haute valeur, telles que les dossiers de santé personnels, les données d'utilisation des appareils intelligents et les vidéos de conduite de Tesla en tant que ressources potentielles de formation.

Un paradoxe existe dans la valeur des données : les données conservent leur valeur grâce à leur exclusivité, mais deviennent des marchandises et se déprécient une fois largement disponibles. Alors que les modèles d'IA subissent eux-mêmes une marchandisation, l'avantage concurrentiel à long terme viendra du contrôle de ensembles de données uniques qui permettent des performances supérieures dans des domaines spécialisés. Une fois que les données deviennent publiques, la concurrence des prix émerge presque immédiatement, provoquant une rapide érosion de la valeur.

Le DataDAO de Vana exploite les environnements d'exécution de confiance (TEEs) pour permettre le transfert de données privées de grande valeur tout en préservant la confidentialité. Cette percée élargit le champ d'application des actifs de données précieuses des ensembles de données publics limités au vaste domaine des données privées, ouvrant de nouvelles possibilités pour l'avancement de l'IA.

4.2 La courbe de valeur unique des données

Les données présentent une courbe de valeur distinctive : les points de données individuels ont une valeur négligeable, mais lorsqu'ils sont agrégés à une masse critique, leur valeur augmente de manière exponentielle. Cette caractéristique présente des défis importants pour la monétisation des données - des rendements substantiels ne se matérialisent qu'après la formation de jeux de données collectifs.

Le mécanisme DataDAO de Vana offre une solution innovante à ce dilemme. En regroupant des données similaires, les DataDAO créent un pouvoir de négociation collective pour les contributeurs. Prenons l'exemple des propriétaires de Tesla : si tous les propriétaires partagent collectivement les données de conduite via un DataDAO, ils acquièrent un important pouvoir de négociation avec tout acheteur potentiel. En revanche, si les propriétaires tentent individuellement de monétiser leurs données, cela entraîne inévitablement une concurrence sur les prix où les acheteurs peuvent simplement acquérir suffisamment d'échantillons auprès des plus offrants.

Les ensembles de données de haute qualité structurés et vérifiés (comme les données de conduite de Tesla authentifiées) commandent une valeur marchande premium, et le cadre de Vana permet une réalisation complète de cette valeur.

4.3 La Percée de l'Aggrégation de Données Multiplateformes

L'aspect le plus puissant des DataDAOs est leur capacité à réaliser une agrégation de données interplateformes - quelque chose de presque impossible dans les écosystèmes clos d'aujourd'hui. Imaginez des chercheurs ayant besoin d'accéder aux messages combinés d'un utilisateur sur Facebook, à l'historique iMessage et au contenu Google Docs. L'approche traditionnelle nécessiterait une coopération entre Facebook, Apple et Google - des plateformes qui n'ont ni l'incitation à intégrer les données des utilisateurs (ce qui affaiblirait leurs fossés de données) ni l'autorisation réglementaire pour le faire.

Les DataDAO contournent élégamment cet obstacle grâce à une intégration de données dirigée par l'utilisateur, débloquant la valeur des données interplateformes et créant des opportunités sans précédent pour la formation et la recherche en IA.

4.4 Nouveau Modèle de Participation Économique

La vision de Vana va bien au-delà de l'innovation technologique pure - elle est à la pointe d'un tout nouveau paradigme de participation économique. Selon ce modèle, les utilisateurs peuvent s'engager dans l'économie numérique sans les exigences en capital traditionnelles, car ils possèdent déjà la ressource la plus précieuse : leurs données personnelles. Les utilisateurs n'ont pas besoin d'apporter de capital financier ; le partage de leurs données devient leur capital. Les DataDAOs fournissent aux utilisateurs de Web3 des flux de revenus passifs dérivés de leurs données personnelles uniques, abaissant considérablement la barrière à l'entrée pour participer à l'économie numérique.

4.5 Reshaping AI Distribution des bénéfices

Ce modèle pourrait fondamentalement restructurer la manière dont la valeur des avancées en matière d'IA est distribuée. Plutôt que les profits ne profitent principalement aux grandes entreprises technologiques, la propriété des données et les mécanismes de gouvernance de Vana permettent une participation large dans l'économie de l'IA. Les premiers indicateurs montrent une forte résonance avec cette approche - plus de 300 DataDAOs sont déjà en développement sur les testnets.

En regardant 3 à 5 ans à l'avance, nous pourrions assister à l'émergence de modèles d'IA entièrement gouvernés par les utilisateurs construits par 100 millions de contributeurs de données - des modèles qui pourraient surpasser les principaux systèmes d'IA centralisés d'aujourd'hui. Ces modèles détenus par la communauté créent un engagement et des connexions plus forts avec les utilisateurs. La souveraineté des données permet aux utilisateurs de soutenir sélectivement le développement éthique de l'IA tout en refusant l'accès aux entreprises non éthiques.

L'IA décentralisée offre un cadre plus démocratique où la société détermine collectivement ce que l'IA devrait apprendre et croire, plutôt que de laisser ces décisions à quelques grandes entreprises. La propriété des données des utilisateurs se traduit non seulement par des avantages économiques, mais aussi par un contrôle substantiel sur le comportement du modèle d'IA, y compris la résolution de problèmes critiques tels que les politiques de modération du contenu.

05 Conclusion

Au niveau commercial, Vana s'engage à construire une chaîne de valeur des données complète qui couvre l'ensemble du processus, de l'agrégation des données à la formation des modèles d'IA en passant par la vente de données. Actuellement, le marché des données est monopolisé par quelques plateformes et courtiers en données. Vana vise à résoudre cette inefficacité en créant un écosystème de trading de données plus équitable.

Vana n'est pas simplement une nouvelle plateforme, elle représente un changement fondamental dans la propriété des données et le développement de l'IA. En permettant aux utilisateurs de participer à la création de valeur collective tout en conservant leur souveraineté sur leurs données, Vana pose les bases d'un avenir de l'IA plus équitable et innovant.

Sur le marché actuel de l'IA, qui regorge d'enthousiasme conceptuel, Vana se distingue par ses mécanismes innovants qui s'attaquent directement aux défis fondamentaux de l'industrie. Il a le potentiel de devenir une force pivot dans la définition de la trajectoire future de l'IA.

Clause de non-responsabilité :

  1. Cet article est reproduit à partir de [GateBiteye], les droits d'auteur appartiennent à l'auteur original [Biteye] si vous avez des objections à la reproduction, veuillez contacter le Apprendre Gatel'équipe, et l'équipe le traitera dès que possible selon les procédures pertinentes.

  2. Avertissement: Les points de vue et opinions exprimés dans cet article ne représentent que les points de vue personnels de l'auteur et ne constituent pas des conseils en investissement.

  3. Les autres versions linguistiques de l'article sont traduites par l'équipe Gate Learn. L'article traduit ne peut être copié, distribué ou plagié sans mentionner Gate.io.

Start Now
Sign up and get a
$100
Voucher!