Há um mês, a YZi Labs anunciou seu investimento na Vana, com o fundador da Binance, CZ, se juntando como consultor, solidificando a posição de liderança da Vana no setor de dados de IA. Quatro dias depois, durante uma AMA com a Vana, CZ afirmou que os dados são o combustível principal para a IA, os dados públicos foram esgotados e os dados privados permanecem inexplorados. Ele expressou otimismo sobre o encaixe produto-mercado (PMF) da Vana e o crescimento de usuários.
Por que YZi Labs, Coinbase Ventures e Paradigm investiram na Vana? Por que CZ está otimista sobre o desenvolvimento da Vana?
Este relatório analisa sistematicamente os desafios dos dados de IA, a proposta de valor central da Vana, as aplicações práticas e a trajetória de crescimento futuro, revelando como a Vana está se tornando uma infraestrutura crítica para o ecossistema de IA.
De acordo com os dados da PitchBook, a indústria de IA dos EUA atraiu quase 20 bilhões em investimentos no primeiro trimestre de 2025. Até 2024, as startups de IA representavam um terço do capital de risco global, totalizando 131,5 bilhões, com quase um quarto das novas empresas focadas em IA. Os dados da Statista confirmam ainda mais esse crescimento explosivo—o financiamento de risco para IA e aprendizado de máquina disparou de 670 milhões em 2011 para 36 bilhões em 2020, um aumento de 50 vezes. Essa tendência indica claramente que a IA se tornou a escolha compartilhada do capital inteligente e dos principais empreendedores.
No entanto, a arquitetura fundamental da IA - “dados + modelos + computação” - enfrenta gargalos estruturais. O principal impulsionador do desempenho do modelo de IA não é a potência de cálculo ou avanços algorítmicos, mas sim a qualidade e escala dos conjuntos de dados de treinamento. Os modelos de linguagem grandes atuais estão se aproximando de um ponto crítico de exaustão de dados. O Llama 3 da Meta foi treinado com aproximadamente 15 trilhões de tokens, quase esgotando todos os dados de alta qualidade da internet pública. Apesar do grande volume de dados da internet pública, ele representa apenas a ponta do iceberg. Um fato amplamente ignorado é que dados de alto valor estão principalmente bloqueados atrás de sistemas proprietários que requerem acesso autorizado. Os dados da internet pública representam menos de 0,1% de todos os dados. Essa questão transcende a capacidade da indústria de IA de resolver sozinha e requer a tecnologia blockchain para redefinir as relações de produção de dados, estabelecer novos mecanismos de incentivo e catalisar o surgimento de dados de alta qualidade em escala.
Por outro lado, hoje em dia, a maioria dos dados é controlada por empresas de tecnologia Web2 dentro de ecossistemas fechados. O desenvolvimento de IA enfrenta o desafio das barreiras de dados, uma barreira que existe porque essas empresas reconhecem o imenso valor dos dados. Modelos de IA de alta qualidade geram retornos econômicos significativos, por exemplo, a receita anual da OpenAI atingiu aproximadamente $3.4 bilhões. A construção de modelos de IA superiores requer vastas quantidades de dados, muitas vezes a custos de aquisição elevados.
Por exemplo, o Reddit ganha cerca de US$ 200 milhões anualmente vendendo dados, cobrando US$ 1–US$ 2 por imagem e as transações de dados de notícias da Apple chegam a US$ 50 milhões. A propriedade de dados evoluiu de uma simples preferência de privacidade para uma questão econômica importante. Em um mundo onde os modelos de IA impulsionam grande parte da economia, a propriedade de dados equivale a deter participação em futuros modelos de IA.
À medida que a comercialização de dados se torna mais prevalente, o acesso aos dados se torna cada vez mais difícil. Muitas plataformas estão ajustando seus termos de serviço e políticas de API para restringir o acesso de desenvolvedores externos. Por exemplo, Reddit e Stack Overflow modificaram as regras da API, tornando a aquisição de dados mais desafiadora. Essa tendência está se expandindo, com plataformas ricas em dados caminhando para uma maior exclusividade.
No entanto, um grupo mantém acesso livre a esses dados: os próprios usuários. Muitas pessoas não têm consciência de que, legalmente, mantêm a propriedade total de seus dados. Assim como estacionar um carro em um estacionamento não concede ao estacionamento direitos sobre o veículo, os dados dos usuários armazenados em plataformas sociais permanecem sua propriedade.
Ao se registrar, os usuários geralmente marcam caixas permitindo que as plataformas 'usem seus dados', o que concede autorização às plataformas para operar serviços, mas não renuncia à propriedade. Os usuários podem solicitar seus dados a qualquer momento. Mesmo que as plataformas restrinjam o acesso à API para desenvolvedores, os usuários individuais ainda podem legalmente recuperar seus dados. Por exemplo, o Instagram permite que os usuários exportem dados da conta, incluindo fotos, comentários e até tags de marketing geradas por IA. No 23 and Me, os usuários podem solicitar seus dados genéticos, embora o processo possa não ser intuitivo.
Globalmente, as regulamentações estão melhorando para garantir que os usuários possam reivindicar seus dados. À medida que o valor dos dados cresce, os usuários devem reconhecer e exercer seus direitos de propriedade.
Empresas de tecnologia estão construindo sistemas fechados para proteger seus valiosos ativos de dados. A missão da VANA é desbloquear esses dados e devolver o controle aos usuários, possibilitando a soberania dos dados.
Em outras palavras, os usuários podem extrair seus dados de várias plataformas e criar conjuntos de dados superiores às ofertas de qualquer plataforma existente.
A estrutura da VANA é construída em dois conceitos fundamentais:
Quando os desenvolvedores pagam para acessar dados, os contribuidores recebem tokens de governança proporcionais à sua contribuição. Isso permite que os contribuidores ganhem recompensas contínuas e participem da tomada de decisões, reformulando o preço e a eficiência do mercado de dados.
DataDAO é um mercado de dados descentralizado dentro do ecossistema VANA, permitindo aos usuários contribuir, tokenizar e utilizar dados. Os usuários podem selecionar pools de mineração de dados adequados (por exemplo, dados de fitness, dados de pesquisa) para contribuir com seus dados. Os dados contribuídos passam por validação pelo mecanismo de Prova de Contribuição da Vana, que avalia sua qualidade e valor para garantir uma compensação justa para os contribuintes.
Uma vez verificada, os dados são tokenizados em ativos digitais que podem ser negociados ou usados para treinamento de IA, enquanto os contribuintes mantêm o controle sobre sua utilização. Cada vez que os dados são utilizados, os contribuintes recebem recompensas de tokens e direitos de governança, permitindo-lhes beneficiar economicamente e influenciar a direção do pool de dados. Ao agregar conjuntos de dados diversos, a DataDAO cria um mercado de dados líquido, facilitando a circulação segura e eficiente de dados dentro do ecossistema VANA.
No núcleo do DataDAO está o Pool de Liquidez de Dados (DLP) - uma coleção de conjuntos de dados validados vinculados a tokens. Os DLPs são gerenciados pelos membros do DataDAO, que detêm direitos de governança. Cada DLP define claramente sua estrutura de dados e padrões de contribuição. Por exemplo, o Sleep.com, um DataDAO focado em sono, estabeleceu um esquema de dados bem definido para garantir que todos os dados on-chain sejam estruturados e utilizáveis. O valor dos dados não está apenas em seu volume, mas também em sua estrutura e acessibilidade.
DataDAO enfatiza fortemente a autenticidade e validade dos dados. Atualmente, a maioria dos DataDAOs utiliza Ambientes de Execução Confiável (TEEs) para executar scripts Python para validação de dados, garantindo qualidade enquanto preserva a privacidade. Por exemplo, a DataDAO da Amazon emprega extensões do navegador para gerar provas de qualidade de dados. Todos os DataDAOs divulgam publicamente seus mecanismos de Prova de Contribuição, permitindo que os usuários compreendam como a qualidade dos dados é assegurada.
Os 16 principais DLPs no ecossistema VANA recebem incentivos adicionais, permitindo que os usuários ganhem recompensas ao contribuir com dados de alta qualidade. As recompensas são distribuídas com base em métricas como frequência de acesso aos dados, qualidade e eficiência de custos. Atualmente, o Reddit DataDAO é o maior, atraindo cerca de 140.000 usuários e treinando com sucesso um modelo de IA de propriedade da comunidade. O DataDAO da DLP Labs permite que os motoristas conectem suas contas da DIMO_Network, compartilhando dados do veículo para ganhar recompensas e avançar a inovação em IA no setor automotivo. Enquanto isso, a 23andWE visa adquirir o 23andMe para evitar que os dados genéticos sejam explorados.
DataDAO representa uma abordagem inovadora para a gestão de dados, capacitando indivíduos a assumir o controle de seus dados e monetizá-los por meio da tokenização. Este ecossistema em rápida evolução introduz possibilidades mais abertas e democráticas para a governança de dados e treinamento de IA.
Construindo sobre a base dos pools de liquidez de dados, DeFi está gradualmente sendo aplicado ao reino dos tokens de dados. Os pools de liquidez de dados servem como a camada fundamental de todo o ecossistema, sobre a qual várias aplicações DeFi podem ser construídas usando tokens de dados.
Atualmente, algumas aplicações iniciais surgiram no ecossistema Data DeFi. Por exemplo, exchanges descentralizadas como @VanaDataDexe@flur_protocolpermitir aos usuários negociar tokens de dados e acompanhar a dinâmica do mercado para tokens de dados específicos. O surgimento dessas plataformas facilitou o livre fluxo de ativos de dados e revigorou o mercado de dados.
Vale ressaltar que a maioria dos mecanismos de recompensa do DLP deposita principalmente as recompensas no tesouro do DLP, em vez de queimar diretamente tokens de dados ou afetar sua oferta e demanda. No entanto, com a introdução da atualização VRC-13, esse mecanismo evoluiu. O novo modelo introduz uma abordagem mais orientada pelo mercado: incentivando as recompensas VANA para promover a tokenização de dados, que são então injetadas nas pools DEX para aprimorar a negociação de tokens de dados e ativar ainda mais o ecossistema DeFi.
Olhando para o futuro, funcionalidades atualmente alcançáveis no espaço DeFi—como empréstimos, staking, mineração de liquidez e até mesmo seguros—podem ser introduzidas no mercado de tokens de dados, criando cenários de aplicação totalmente novos.
Sob a perspectiva das indústrias tradicionais da Web2, semelhante à forma como as empresas compram futuros de petróleo para se proteger contra flutuações de preços, o mercado de dados pode desenvolver futuros de dados, permitindo aos usuários fixar preços futuros para conjuntos de dados com antecedência e reduzir a incerteza nos custos de aquisição.
Algumas empresas de negociação já começaram a tratar os dados como uma nova classe de ativos, pesquisando métodos de valoração, como avaliar o valor de tokens de dados específicos, a probabilidade de uso em vendas e análise do ciclo de vida. Esses fatores influenciam diretamente o preço dos tokens de dados e a liquidez do mercado, deixando amplo espaço para inovação.
Atualmente, acessar conjuntos de dados na mainnet ainda é relativamente complicado. Os usuários devem enviar solicitações detalhadas especificando suas necessidades, valores de pagamento e código do projeto, e depois aguardar a aprovação antes de obter acesso. Embora isso garanta transparência e padronização, cria atrito operacional.
Para melhorar a eficiência, a Vana está desenvolvendo métodos de acesso a dados mais eficientes que permitem acesso automatizado à API e recuperação direta de dados em vários DataDAOs. Por exemplo, no futuro, os usuários poderiam combinar dados de sono com dados de negociação da Coinbase ou Binance para analisar os padrões de sono de detentores de tokens específicos e descobrir novas percepções de mercado.
Além disso, Vana está avançando com uma nova proposta que implementa uma proporção padrão de 80-20 para a queima de tokens de dados e VANA em troca de direitos de acesso a dados.
Vana também desenvolveu uma nova interface de consulta de dados que simplifica significativamente o processo de acesso aos dados. Os usuários podem autenticar-se via login na carteira e gerar assinaturas digitais para verificar suas permissões de acesso. Como os Pools de Liquidez de Dados (DLPs) registram formatos de dados, os usuários podem entender claramente as estruturas de dados e recuperar as informações necessárias usando consultas SQL. Durante este processo, os usuários podem primeiro receber amostras de dados sintéticos para testar e verificar a precisão da consulta. Ao trabalhar com dados reais, todos os cálculos são realizados dentro de Ambientes de Execução Confiáveis (TEEs) para garantir a segurança dos dados. Esse mecanismo impede efetivamente o “problema de uso duplo de dados” (onde os usuários podem revender dados comprados), protegendo assim o valor econômico dos dados e garantindo o desenvolvimento sustentável do mercado de dados.
Os dados estão rapidamente se tornando o ativo principal da era digital. Embora as tecnologias de coleta e armazenamento de dados tenham atingido considerável maturidade, o verdadeiro desafio está em avaliar efetivamente a qualidade dos dados, maximizar seu valor e garantir a proteção da privacidade. Vana aborda elegantemente esse desafio por meio de seu inovador mecanismo de incentivo: os usuários podem apostar tokens VANA para apoiar DataDAOs de alto valor, enquanto ganham recompensas correspondentes, criando um ciclo virtuoso de criação de valor.
O desenvolvimento da IA atingiu a “parede de dados” - os recursos públicos de dados de alta qualidade estão se esgotando. As futuras descobertas em IA inevitavelmente dependerão do acesso e utilização eficazes de dados privados de alto valor, como registros de saúde pessoal, dados de uso de dispositivos inteligentes e vídeos de direção da Tesla como recursos de treinamento potenciais.
Existe uma paradoxo no valor dos dados: os dados mantêm seu valor por meio da exclusividade, mas se tornam mercantilizados e desvalorizam uma vez que estão amplamente disponíveis. À medida que os modelos de IA passam por mercantilização, a vantagem competitiva de longo prazo virá do controle de conjuntos de dados únicos que possibilitam um desempenho superior em domínios especializados. Uma vez que os dados se tornam públicos, a competição de preços surge quase imediatamente, causando uma rápida erosão de valor.
O DataDAO da Vana aproveita Ambientes de Execução Confiável (TEEs) para permitir a transferência de dados privados de alto valor, preservando a privacidade. Essa inovação expande o escopo de ativos de dados valiosos de conjuntos de dados públicos limitados para o vasto universo de dados privados, abrindo novas possibilidades para o avanço da IA.
Os dados exibem uma curva de valor distinta: pontos de dados individuais têm pouco valor, mas quando agregados em massa crítica, seu valor cresce exponencialmente. Essa característica apresenta desafios significativos para a monetização de dados - retornos substanciais só se materializam após a formação de conjuntos de dados coletivos.
O mecanismo DataDAO da Vana fornece uma solução inovadora para esse dilema. Ao agrupar dados semelhantes, os DataDAOs criam poder de barganha coletiva para os contribuintes. Considere os proprietários de Tesla: se todos os proprietários compartilharem coletivamente os dados de direção por meio de um DataDAO, eles ganham uma forte alavancagem de preços com qualquer comprador em potencial. Em contraste, se os proprietários tentarem individualmente monetizar seus dados, isso inevitavelmente leva a uma competição de preços onde os compradores podem simplesmente adquirir amostras suficientes dos licitantes mais baixos.
Conjuntos de dados estruturados e verificados de alta qualidade (como os dados de direção autenticados da Tesla) comandam um valor de mercado premium, e o framework da Vana permite a realização plena desse valor.
O aspecto mais poderoso dos DataDAOs é sua capacidade de realizar a agregação de dados entre plataformas - algo quase impossível nos ecossistemas de jardins murados de hoje. Imagine pesquisadores precisando acessar as mensagens combinadas do Facebook de um usuário, o histórico do iMessage e o conteúdo do Google Docs. A abordagem tradicional exigiria a cooperação entre Facebook, Apple e Google - plataformas que não têm incentivo para integrar dados de usuários (o que enfraqueceria suas trincheiras de dados) nem a autorização regulatória para fazê-lo.
DataDAOs contornam elegantemente esse obstáculo por meio da integração de dados liderada pelo usuário, desbloqueando o valor de dados entre plataformas e criando oportunidades sem precedentes para treinamento e pesquisa em IA.
A visão da Vana vai muito além da mera inovação tecnológica - ela está pioneira em um paradigma de participação econômica inteiramente novo. Sob este modelo, os usuários podem se envolver na economia digital sem os requisitos de capital tradicionais, pois já possuem o recurso mais valioso: seus dados pessoais. Os usuários não precisam trazer capital financeiro; compartilhar seus dados se torna seu capital. Os DataDAOs fornecem aos usuários da Web3 fluxos de renda passiva derivados de seus dados pessoais exclusivos, diminuindo significativamente a barreira de entrada para participar da economia digital.
Este modelo poderia reestruturar fundamentalmente como o valor dos avanços da IA é distribuído. Em vez dos lucros fluírem principalmente para as grandes corporações de tecnologia, os mecanismos de propriedade de dados e governança da Vana permitem uma ampla participação na economia de IA. Indicadores iniciais mostram forte ressonância com essa abordagem - mais de 300 DataDAOs já estão em desenvolvimento em testnets.
Olhando para os próximos 3-5 anos, podemos testemunhar o surgimento de modelos de IA totalmente governados pelos usuários construídos por 100 milhões de contribuintes de dados - modelos que poderiam superar os principais sistemas de IA centralizados de hoje. Esses modelos de propriedade da comunidade criam um engajamento e conexões de usuários mais fortes. A soberania dos dados capacita os usuários a apoiar seletivamente o desenvolvimento ético da IA, ao mesmo tempo que nega acesso a empresas antiéticas.
IA descentralizada fornece um quadro mais democrático em que a sociedade determina coletivamente o que a IA deve aprender e acreditar, em vez de deixar essas decisões para um punhado de corporações. A propriedade dos dados do usuário se traduz não apenas em benefícios econômicos, mas também em controle substancial sobre o comportamento do modelo de IA - incluindo a abordagem de questões críticas como políticas de moderação de conteúdo.
No nível comercial, a Vana está comprometida em construir uma cadeia de valor de dados abrangente que abrange todo o processo, desde a agregação de dados e treinamento de modelos de IA até a venda de dados. Atualmente, o mercado de dados é monopolizado por um punhado de plataformas e corretores de dados. A Vana tem como objetivo abordar essa ineficiência criando um ecossistema de negociação de dados mais justo.
Vana é mais do que apenas uma nova plataforma - representa uma mudança fundamental na propriedade de dados e no desenvolvimento de IA. Ao permitir que os usuários participem da criação de valor coletivo mantendo a soberania sobre seus dados, a Vana está lançando as bases para um futuro de IA mais equitativo e inovador.
No mercado de IA de hoje, repleto de hype conceitual, Vana se destaca com seus mecanismos inovadores que enfrentam diretamente os desafios centrais da indústria. Tem o potencial de se tornar uma força crucial na formação da trajetória futura da IA.
Este artigo é reproduzido a partir de [GateBiteye], the copyright belongs to the original author [Biteye], se tiver alguma objeção à reprodução, entre em contato com o Gate Learnequipe e a equipe lidará com isso o mais rápido possível de acordo com os procedimentos relevantes.
Aviso Legal: As visões e opiniões expressas neste artigo representam apenas as visões pessoais do autor e não constituem qualquer conselho de investimento.
Outras versões do artigo em outros idiomas são traduzidas pela equipe da Gate Learn. O artigo traduzido não pode ser copiado, distribuído ou plagiado sem mencionar Gate.io.
Há um mês, a YZi Labs anunciou seu investimento na Vana, com o fundador da Binance, CZ, se juntando como consultor, solidificando a posição de liderança da Vana no setor de dados de IA. Quatro dias depois, durante uma AMA com a Vana, CZ afirmou que os dados são o combustível principal para a IA, os dados públicos foram esgotados e os dados privados permanecem inexplorados. Ele expressou otimismo sobre o encaixe produto-mercado (PMF) da Vana e o crescimento de usuários.
Por que YZi Labs, Coinbase Ventures e Paradigm investiram na Vana? Por que CZ está otimista sobre o desenvolvimento da Vana?
Este relatório analisa sistematicamente os desafios dos dados de IA, a proposta de valor central da Vana, as aplicações práticas e a trajetória de crescimento futuro, revelando como a Vana está se tornando uma infraestrutura crítica para o ecossistema de IA.
De acordo com os dados da PitchBook, a indústria de IA dos EUA atraiu quase 20 bilhões em investimentos no primeiro trimestre de 2025. Até 2024, as startups de IA representavam um terço do capital de risco global, totalizando 131,5 bilhões, com quase um quarto das novas empresas focadas em IA. Os dados da Statista confirmam ainda mais esse crescimento explosivo—o financiamento de risco para IA e aprendizado de máquina disparou de 670 milhões em 2011 para 36 bilhões em 2020, um aumento de 50 vezes. Essa tendência indica claramente que a IA se tornou a escolha compartilhada do capital inteligente e dos principais empreendedores.
No entanto, a arquitetura fundamental da IA - “dados + modelos + computação” - enfrenta gargalos estruturais. O principal impulsionador do desempenho do modelo de IA não é a potência de cálculo ou avanços algorítmicos, mas sim a qualidade e escala dos conjuntos de dados de treinamento. Os modelos de linguagem grandes atuais estão se aproximando de um ponto crítico de exaustão de dados. O Llama 3 da Meta foi treinado com aproximadamente 15 trilhões de tokens, quase esgotando todos os dados de alta qualidade da internet pública. Apesar do grande volume de dados da internet pública, ele representa apenas a ponta do iceberg. Um fato amplamente ignorado é que dados de alto valor estão principalmente bloqueados atrás de sistemas proprietários que requerem acesso autorizado. Os dados da internet pública representam menos de 0,1% de todos os dados. Essa questão transcende a capacidade da indústria de IA de resolver sozinha e requer a tecnologia blockchain para redefinir as relações de produção de dados, estabelecer novos mecanismos de incentivo e catalisar o surgimento de dados de alta qualidade em escala.
Por outro lado, hoje em dia, a maioria dos dados é controlada por empresas de tecnologia Web2 dentro de ecossistemas fechados. O desenvolvimento de IA enfrenta o desafio das barreiras de dados, uma barreira que existe porque essas empresas reconhecem o imenso valor dos dados. Modelos de IA de alta qualidade geram retornos econômicos significativos, por exemplo, a receita anual da OpenAI atingiu aproximadamente $3.4 bilhões. A construção de modelos de IA superiores requer vastas quantidades de dados, muitas vezes a custos de aquisição elevados.
Por exemplo, o Reddit ganha cerca de US$ 200 milhões anualmente vendendo dados, cobrando US$ 1–US$ 2 por imagem e as transações de dados de notícias da Apple chegam a US$ 50 milhões. A propriedade de dados evoluiu de uma simples preferência de privacidade para uma questão econômica importante. Em um mundo onde os modelos de IA impulsionam grande parte da economia, a propriedade de dados equivale a deter participação em futuros modelos de IA.
À medida que a comercialização de dados se torna mais prevalente, o acesso aos dados se torna cada vez mais difícil. Muitas plataformas estão ajustando seus termos de serviço e políticas de API para restringir o acesso de desenvolvedores externos. Por exemplo, Reddit e Stack Overflow modificaram as regras da API, tornando a aquisição de dados mais desafiadora. Essa tendência está se expandindo, com plataformas ricas em dados caminhando para uma maior exclusividade.
No entanto, um grupo mantém acesso livre a esses dados: os próprios usuários. Muitas pessoas não têm consciência de que, legalmente, mantêm a propriedade total de seus dados. Assim como estacionar um carro em um estacionamento não concede ao estacionamento direitos sobre o veículo, os dados dos usuários armazenados em plataformas sociais permanecem sua propriedade.
Ao se registrar, os usuários geralmente marcam caixas permitindo que as plataformas 'usem seus dados', o que concede autorização às plataformas para operar serviços, mas não renuncia à propriedade. Os usuários podem solicitar seus dados a qualquer momento. Mesmo que as plataformas restrinjam o acesso à API para desenvolvedores, os usuários individuais ainda podem legalmente recuperar seus dados. Por exemplo, o Instagram permite que os usuários exportem dados da conta, incluindo fotos, comentários e até tags de marketing geradas por IA. No 23 and Me, os usuários podem solicitar seus dados genéticos, embora o processo possa não ser intuitivo.
Globalmente, as regulamentações estão melhorando para garantir que os usuários possam reivindicar seus dados. À medida que o valor dos dados cresce, os usuários devem reconhecer e exercer seus direitos de propriedade.
Empresas de tecnologia estão construindo sistemas fechados para proteger seus valiosos ativos de dados. A missão da VANA é desbloquear esses dados e devolver o controle aos usuários, possibilitando a soberania dos dados.
Em outras palavras, os usuários podem extrair seus dados de várias plataformas e criar conjuntos de dados superiores às ofertas de qualquer plataforma existente.
A estrutura da VANA é construída em dois conceitos fundamentais:
Quando os desenvolvedores pagam para acessar dados, os contribuidores recebem tokens de governança proporcionais à sua contribuição. Isso permite que os contribuidores ganhem recompensas contínuas e participem da tomada de decisões, reformulando o preço e a eficiência do mercado de dados.
DataDAO é um mercado de dados descentralizado dentro do ecossistema VANA, permitindo aos usuários contribuir, tokenizar e utilizar dados. Os usuários podem selecionar pools de mineração de dados adequados (por exemplo, dados de fitness, dados de pesquisa) para contribuir com seus dados. Os dados contribuídos passam por validação pelo mecanismo de Prova de Contribuição da Vana, que avalia sua qualidade e valor para garantir uma compensação justa para os contribuintes.
Uma vez verificada, os dados são tokenizados em ativos digitais que podem ser negociados ou usados para treinamento de IA, enquanto os contribuintes mantêm o controle sobre sua utilização. Cada vez que os dados são utilizados, os contribuintes recebem recompensas de tokens e direitos de governança, permitindo-lhes beneficiar economicamente e influenciar a direção do pool de dados. Ao agregar conjuntos de dados diversos, a DataDAO cria um mercado de dados líquido, facilitando a circulação segura e eficiente de dados dentro do ecossistema VANA.
No núcleo do DataDAO está o Pool de Liquidez de Dados (DLP) - uma coleção de conjuntos de dados validados vinculados a tokens. Os DLPs são gerenciados pelos membros do DataDAO, que detêm direitos de governança. Cada DLP define claramente sua estrutura de dados e padrões de contribuição. Por exemplo, o Sleep.com, um DataDAO focado em sono, estabeleceu um esquema de dados bem definido para garantir que todos os dados on-chain sejam estruturados e utilizáveis. O valor dos dados não está apenas em seu volume, mas também em sua estrutura e acessibilidade.
DataDAO enfatiza fortemente a autenticidade e validade dos dados. Atualmente, a maioria dos DataDAOs utiliza Ambientes de Execução Confiável (TEEs) para executar scripts Python para validação de dados, garantindo qualidade enquanto preserva a privacidade. Por exemplo, a DataDAO da Amazon emprega extensões do navegador para gerar provas de qualidade de dados. Todos os DataDAOs divulgam publicamente seus mecanismos de Prova de Contribuição, permitindo que os usuários compreendam como a qualidade dos dados é assegurada.
Os 16 principais DLPs no ecossistema VANA recebem incentivos adicionais, permitindo que os usuários ganhem recompensas ao contribuir com dados de alta qualidade. As recompensas são distribuídas com base em métricas como frequência de acesso aos dados, qualidade e eficiência de custos. Atualmente, o Reddit DataDAO é o maior, atraindo cerca de 140.000 usuários e treinando com sucesso um modelo de IA de propriedade da comunidade. O DataDAO da DLP Labs permite que os motoristas conectem suas contas da DIMO_Network, compartilhando dados do veículo para ganhar recompensas e avançar a inovação em IA no setor automotivo. Enquanto isso, a 23andWE visa adquirir o 23andMe para evitar que os dados genéticos sejam explorados.
DataDAO representa uma abordagem inovadora para a gestão de dados, capacitando indivíduos a assumir o controle de seus dados e monetizá-los por meio da tokenização. Este ecossistema em rápida evolução introduz possibilidades mais abertas e democráticas para a governança de dados e treinamento de IA.
Construindo sobre a base dos pools de liquidez de dados, DeFi está gradualmente sendo aplicado ao reino dos tokens de dados. Os pools de liquidez de dados servem como a camada fundamental de todo o ecossistema, sobre a qual várias aplicações DeFi podem ser construídas usando tokens de dados.
Atualmente, algumas aplicações iniciais surgiram no ecossistema Data DeFi. Por exemplo, exchanges descentralizadas como @VanaDataDexe@flur_protocolpermitir aos usuários negociar tokens de dados e acompanhar a dinâmica do mercado para tokens de dados específicos. O surgimento dessas plataformas facilitou o livre fluxo de ativos de dados e revigorou o mercado de dados.
Vale ressaltar que a maioria dos mecanismos de recompensa do DLP deposita principalmente as recompensas no tesouro do DLP, em vez de queimar diretamente tokens de dados ou afetar sua oferta e demanda. No entanto, com a introdução da atualização VRC-13, esse mecanismo evoluiu. O novo modelo introduz uma abordagem mais orientada pelo mercado: incentivando as recompensas VANA para promover a tokenização de dados, que são então injetadas nas pools DEX para aprimorar a negociação de tokens de dados e ativar ainda mais o ecossistema DeFi.
Olhando para o futuro, funcionalidades atualmente alcançáveis no espaço DeFi—como empréstimos, staking, mineração de liquidez e até mesmo seguros—podem ser introduzidas no mercado de tokens de dados, criando cenários de aplicação totalmente novos.
Sob a perspectiva das indústrias tradicionais da Web2, semelhante à forma como as empresas compram futuros de petróleo para se proteger contra flutuações de preços, o mercado de dados pode desenvolver futuros de dados, permitindo aos usuários fixar preços futuros para conjuntos de dados com antecedência e reduzir a incerteza nos custos de aquisição.
Algumas empresas de negociação já começaram a tratar os dados como uma nova classe de ativos, pesquisando métodos de valoração, como avaliar o valor de tokens de dados específicos, a probabilidade de uso em vendas e análise do ciclo de vida. Esses fatores influenciam diretamente o preço dos tokens de dados e a liquidez do mercado, deixando amplo espaço para inovação.
Atualmente, acessar conjuntos de dados na mainnet ainda é relativamente complicado. Os usuários devem enviar solicitações detalhadas especificando suas necessidades, valores de pagamento e código do projeto, e depois aguardar a aprovação antes de obter acesso. Embora isso garanta transparência e padronização, cria atrito operacional.
Para melhorar a eficiência, a Vana está desenvolvendo métodos de acesso a dados mais eficientes que permitem acesso automatizado à API e recuperação direta de dados em vários DataDAOs. Por exemplo, no futuro, os usuários poderiam combinar dados de sono com dados de negociação da Coinbase ou Binance para analisar os padrões de sono de detentores de tokens específicos e descobrir novas percepções de mercado.
Além disso, Vana está avançando com uma nova proposta que implementa uma proporção padrão de 80-20 para a queima de tokens de dados e VANA em troca de direitos de acesso a dados.
Vana também desenvolveu uma nova interface de consulta de dados que simplifica significativamente o processo de acesso aos dados. Os usuários podem autenticar-se via login na carteira e gerar assinaturas digitais para verificar suas permissões de acesso. Como os Pools de Liquidez de Dados (DLPs) registram formatos de dados, os usuários podem entender claramente as estruturas de dados e recuperar as informações necessárias usando consultas SQL. Durante este processo, os usuários podem primeiro receber amostras de dados sintéticos para testar e verificar a precisão da consulta. Ao trabalhar com dados reais, todos os cálculos são realizados dentro de Ambientes de Execução Confiáveis (TEEs) para garantir a segurança dos dados. Esse mecanismo impede efetivamente o “problema de uso duplo de dados” (onde os usuários podem revender dados comprados), protegendo assim o valor econômico dos dados e garantindo o desenvolvimento sustentável do mercado de dados.
Os dados estão rapidamente se tornando o ativo principal da era digital. Embora as tecnologias de coleta e armazenamento de dados tenham atingido considerável maturidade, o verdadeiro desafio está em avaliar efetivamente a qualidade dos dados, maximizar seu valor e garantir a proteção da privacidade. Vana aborda elegantemente esse desafio por meio de seu inovador mecanismo de incentivo: os usuários podem apostar tokens VANA para apoiar DataDAOs de alto valor, enquanto ganham recompensas correspondentes, criando um ciclo virtuoso de criação de valor.
O desenvolvimento da IA atingiu a “parede de dados” - os recursos públicos de dados de alta qualidade estão se esgotando. As futuras descobertas em IA inevitavelmente dependerão do acesso e utilização eficazes de dados privados de alto valor, como registros de saúde pessoal, dados de uso de dispositivos inteligentes e vídeos de direção da Tesla como recursos de treinamento potenciais.
Existe uma paradoxo no valor dos dados: os dados mantêm seu valor por meio da exclusividade, mas se tornam mercantilizados e desvalorizam uma vez que estão amplamente disponíveis. À medida que os modelos de IA passam por mercantilização, a vantagem competitiva de longo prazo virá do controle de conjuntos de dados únicos que possibilitam um desempenho superior em domínios especializados. Uma vez que os dados se tornam públicos, a competição de preços surge quase imediatamente, causando uma rápida erosão de valor.
O DataDAO da Vana aproveita Ambientes de Execução Confiável (TEEs) para permitir a transferência de dados privados de alto valor, preservando a privacidade. Essa inovação expande o escopo de ativos de dados valiosos de conjuntos de dados públicos limitados para o vasto universo de dados privados, abrindo novas possibilidades para o avanço da IA.
Os dados exibem uma curva de valor distinta: pontos de dados individuais têm pouco valor, mas quando agregados em massa crítica, seu valor cresce exponencialmente. Essa característica apresenta desafios significativos para a monetização de dados - retornos substanciais só se materializam após a formação de conjuntos de dados coletivos.
O mecanismo DataDAO da Vana fornece uma solução inovadora para esse dilema. Ao agrupar dados semelhantes, os DataDAOs criam poder de barganha coletiva para os contribuintes. Considere os proprietários de Tesla: se todos os proprietários compartilharem coletivamente os dados de direção por meio de um DataDAO, eles ganham uma forte alavancagem de preços com qualquer comprador em potencial. Em contraste, se os proprietários tentarem individualmente monetizar seus dados, isso inevitavelmente leva a uma competição de preços onde os compradores podem simplesmente adquirir amostras suficientes dos licitantes mais baixos.
Conjuntos de dados estruturados e verificados de alta qualidade (como os dados de direção autenticados da Tesla) comandam um valor de mercado premium, e o framework da Vana permite a realização plena desse valor.
O aspecto mais poderoso dos DataDAOs é sua capacidade de realizar a agregação de dados entre plataformas - algo quase impossível nos ecossistemas de jardins murados de hoje. Imagine pesquisadores precisando acessar as mensagens combinadas do Facebook de um usuário, o histórico do iMessage e o conteúdo do Google Docs. A abordagem tradicional exigiria a cooperação entre Facebook, Apple e Google - plataformas que não têm incentivo para integrar dados de usuários (o que enfraqueceria suas trincheiras de dados) nem a autorização regulatória para fazê-lo.
DataDAOs contornam elegantemente esse obstáculo por meio da integração de dados liderada pelo usuário, desbloqueando o valor de dados entre plataformas e criando oportunidades sem precedentes para treinamento e pesquisa em IA.
A visão da Vana vai muito além da mera inovação tecnológica - ela está pioneira em um paradigma de participação econômica inteiramente novo. Sob este modelo, os usuários podem se envolver na economia digital sem os requisitos de capital tradicionais, pois já possuem o recurso mais valioso: seus dados pessoais. Os usuários não precisam trazer capital financeiro; compartilhar seus dados se torna seu capital. Os DataDAOs fornecem aos usuários da Web3 fluxos de renda passiva derivados de seus dados pessoais exclusivos, diminuindo significativamente a barreira de entrada para participar da economia digital.
Este modelo poderia reestruturar fundamentalmente como o valor dos avanços da IA é distribuído. Em vez dos lucros fluírem principalmente para as grandes corporações de tecnologia, os mecanismos de propriedade de dados e governança da Vana permitem uma ampla participação na economia de IA. Indicadores iniciais mostram forte ressonância com essa abordagem - mais de 300 DataDAOs já estão em desenvolvimento em testnets.
Olhando para os próximos 3-5 anos, podemos testemunhar o surgimento de modelos de IA totalmente governados pelos usuários construídos por 100 milhões de contribuintes de dados - modelos que poderiam superar os principais sistemas de IA centralizados de hoje. Esses modelos de propriedade da comunidade criam um engajamento e conexões de usuários mais fortes. A soberania dos dados capacita os usuários a apoiar seletivamente o desenvolvimento ético da IA, ao mesmo tempo que nega acesso a empresas antiéticas.
IA descentralizada fornece um quadro mais democrático em que a sociedade determina coletivamente o que a IA deve aprender e acreditar, em vez de deixar essas decisões para um punhado de corporações. A propriedade dos dados do usuário se traduz não apenas em benefícios econômicos, mas também em controle substancial sobre o comportamento do modelo de IA - incluindo a abordagem de questões críticas como políticas de moderação de conteúdo.
No nível comercial, a Vana está comprometida em construir uma cadeia de valor de dados abrangente que abrange todo o processo, desde a agregação de dados e treinamento de modelos de IA até a venda de dados. Atualmente, o mercado de dados é monopolizado por um punhado de plataformas e corretores de dados. A Vana tem como objetivo abordar essa ineficiência criando um ecossistema de negociação de dados mais justo.
Vana é mais do que apenas uma nova plataforma - representa uma mudança fundamental na propriedade de dados e no desenvolvimento de IA. Ao permitir que os usuários participem da criação de valor coletivo mantendo a soberania sobre seus dados, a Vana está lançando as bases para um futuro de IA mais equitativo e inovador.
No mercado de IA de hoje, repleto de hype conceitual, Vana se destaca com seus mecanismos inovadores que enfrentam diretamente os desafios centrais da indústria. Tem o potencial de se tornar uma força crucial na formação da trajetória futura da IA.
Este artigo é reproduzido a partir de [GateBiteye], the copyright belongs to the original author [Biteye], se tiver alguma objeção à reprodução, entre em contato com o Gate Learnequipe e a equipe lidará com isso o mais rápido possível de acordo com os procedimentos relevantes.
Aviso Legal: As visões e opiniões expressas neste artigo representam apenas as visões pessoais do autor e não constituem qualquer conselho de investimento.
Outras versões do artigo em outros idiomas são traduzidas pela equipe da Gate Learn. O artigo traduzido não pode ser copiado, distribuído ou plagiado sem mencionar Gate.io.