Há um mês, a YZi Labs anunciou seu investimento na Vana, com o fundador da Binance CZ juntando-se como consultor, solidificando a posição de liderança da Vana no setor de dados de IA. Quatro dias depois, durante uma AMA com a Vana, CZ afirmou que os dados são o combustível central para a IA, os dados públicos foram esgotados e os dados privados permanecem inexplorados. Ele expressou otimismo sobre a adequação do produto ao mercado (PMF) da Vana e o crescimento do usuário.
Porque é que a YZi Labs, a Coinbase Ventures e a Paradigm investiram na Vana? Porque é que o CZ está otimista em relação ao desenvolvimento da Vana?
Este relatório analisa sistematicamente os desafios dos dados de IA, a proposta de valor central da Vana, aplicações práticas e trajetória de crescimento futuro, revelando como a Vana está se tornando uma infraestrutura crítica para o ecossistema de IA.
De acordo com dados da PitchBook, a indústria de IA dos EUA atraiu quase 20 mil milhões em investimentos no 1º trimestre de 2025. Até 2024, as startups de IA representaram um terço do capital de risco global, totalizando 131,5 mil milhões, com quase um quarto dos novos empreendimentos focados em IA. Os dados da Statista confirmam ainda mais este crescimento explosivo—o financiamento de capital de risco para IA e aprendizagem automática aumentou de 670 milhões em 2011 para 36 mil milhões em 2020, um aumento de 50 vezes. Esta tendência indica claramente que a IA se tornou a escolha partilhada de capital inteligente e principais empreendedores.
No entanto, a arquitetura fundamental da IA—“dados + modelos + computação”—enfrenta gargalos estruturais. O principal impulsionador do desempenho do modelo de IA não é a potência computacional ou avanços algorítmicos, mas a qualidade e escala dos conjuntos de dados de treino. Os atuais modelos de linguagem grandes estão a atingir um ponto crítico de exaustão de dados. O Llama 3 da Meta foi treinado com aproximadamente 15 biliões de tokens, quase esgotando todos os dados públicos de alta qualidade da internet. Apesar do vasto volume de dados públicos da internet, representa apenas a ponta do icebergue. Um facto amplamente ignorado é que os dados de alto valor estão maioritariamente bloqueados atrás de sistemas proprietários que requerem acesso autorizado. Os dados públicos da internet representam menos de 0.1% de todos os dados. Este problema transcende a capacidade da indústria de IA para resolver sozinha e requer a tecnologia blockchain para redefinir as relações de produção de dados, estabelecer novos mecanismos de incentivo e catalisar o surgimento de dados de alta qualidade em escala.
Por outro lado, hoje em dia, a maioria dos dados é controlada por empresas de tecnologia Web2 dentro de ecossistemas fechados. O desenvolvimento de IA enfrenta o desafio das barreiras de dados, uma barreira que existe porque essas empresas reconhecem o imenso valor dos dados. Modelos de IA de alta qualidade geram retornos econômicos significativos, por exemplo, a receita anual da OpenAI atingiu aproximadamente $3.4 bilhões. A construção de modelos de IA superiores requer vastas quantidades de dados, muitas vezes a custos elevados de aquisição.
Por exemplo, o Reddit ganha cerca de $200 milhões anualmente vendendo dados, cobra US$1–US$2 por imagem, e as transações de dados de notícias da Apple chegam a US$50 milhões. A propriedade de dados evoluiu de uma simples preferência de privacidade para uma questão econômica importante. Num mundo onde os modelos de IA impulsionam grande parte da economia, a propriedade de dados equivale a deter ações em futuros modelos de IA.
À medida que a comercialização de dados se torna mais prevalente, o acesso a dados torna-se cada vez mais difícil. Muitas plataformas estão a ajustar os seus termos de serviço e políticas de API para restringir o acesso de desenvolvedores externos. Por exemplo, o Reddit e o Stack Overflow modificaram as regras da API, tornando a aquisição de dados mais desafiadora. Esta tendência está a expandir-se, com plataformas ricas em dados a moverem-se para uma maior exclusividade.
No entanto, um grupo mantém acesso livre a estes dados: os próprios utilizadores. Muitas pessoas não têm consciência de que, legalmente, mantêm a propriedade total dos seus dados. Tal como estacionar um carro num parque de estacionamento não concede ao parque direitos sobre o veículo, os dados dos utilizadores armazenados em plataformas sociais permanecem sua propriedade.
Ao se registrar, os usuários normalmente marcam caixas que permitem que as plataformas 'usem seus dados', o que concede autorização às plataformas para operar serviços, mas não renuncia à propriedade. Os usuários podem solicitar seus dados a qualquer momento. Mesmo que as plataformas restrinjam o acesso à API para os desenvolvedores, os usuários individuais ainda podem legalmente recuperar seus dados. Por exemplo, o Instagram permite que os usuários exportem dados da conta, incluindo fotos, comentários e até tags de marketing geradas por IA. No 23 and Me, os usuários podem solicitar seus dados genéticos, embora o processo possa não ser intuitivo.
Globalmente, as regulamentações estão a melhorar para garantir que os utilizadores possam recuperar os seus dados. À medida que o valor dos dados aumenta, os utilizadores devem reconhecer e exercer os seus direitos de propriedade.
As empresas de tecnologia estão a construir sistemas fechados para proteger os seus valiosos ativos de dados. A missão da VANA é desbloquear estes dados e devolver o controlo aos utilizadores, permitindo a soberania dos dados.
Em outras palavras, os utilizadores podem extrair os seus dados de várias plataformas e criar conjuntos de dados superiores às ofertas de qualquer plataforma existente.
A estrutura da VANA é construída em dois conceitos fundamentais:
Quando os desenvolvedores pagam para aceder a dados, os contribuidores recebem tokens de governação proporcionais à sua contribuição. Isto permite aos contribuidores ganhar recompensas contínuas e participar na tomada de decisões, reformulando o preço e eficiência do mercado de dados.
DataDAO é um mercado de dados descentralizado dentro do ecossistema VANA, permitindo aos utilizadores contribuir, tokenizar e utilizar dados. Os utilizadores podem selecionar pools de mineração de dados adequados (por exemplo, dados de fitness, dados de pesquisa) para contribuir com seus dados. Os dados contribuídos passam por validação pelo mecanismo de Prova de Contribuição da Vana, que avalia sua qualidade e valor para garantir uma compensação justa para os contribuintes.
Uma vez verificado, os dados são tokenizados em ativos digitais que podem ser negociados ou usados para treino de IA, enquanto os contribuidores mantêm o controle sobre a sua utilização. Cada vez que os dados são utilizados, os contribuidores recebem recompensas em tokens e direitos de governança, permitindo-lhes beneficiar economicamente e influenciar a direção do pool de dados. Ao agregar conjuntos de dados diversos, o DataDAO cria um mercado de dados líquido, facilitando a circulação segura e eficiente de dados dentro do ecossistema VANA.
No cerne da DataDAO está o Data Liquidity Pool (DLP) - uma coleção de conjuntos de dados validados ligados a tokens. Os DLPs são geridos pelos membros da DataDAO, que detêm direitos de governação. Cada DLP define claramente a sua estrutura de dados e padrões de contribuição. Por exemplo, o Sleep.com, um DataDAO focado no sono, estabeleceu um esquema de dados bem definido para garantir que todos os dados on-chain sejam estruturados e utilizáveis. O valor dos dados reside não apenas no seu volume, mas também na sua estrutura e acessibilidade.
DataDAO coloca uma forte ênfase na autenticidade e validade dos dados. Atualmente, a maioria dos DataDAOs utiliza Ambientes de Execução Confiável (TEEs) para executar scripts Python para validação de dados, garantindo qualidade enquanto preserva a privacidade. Por exemplo, a DataDAO da Amazon emprega extensões do navegador para gerar provas de qualidade de dados. Todos os DataDAOs divulgam publicamente seus mecanismos de Prova de Contribuição, permitindo que os usuários entendam como a qualidade dos dados é assegurada.
Os 16 melhores DLPs no ecossistema VANA recebem incentivos adicionais, permitindo aos utilizadores ganhar recompensas ao contribuir com dados de alta qualidade. As recompensas são distribuídas com base em métricas como frequência de acesso aos dados, qualidade e eficiência de custos. Atualmente, o Reddit DataDAO é o maior, atraindo cerca de 140.000 utilizadores e treinando com sucesso um modelo de IA de propriedade da comunidade. O DataDAO da DLP Labs permite aos condutores conectar suas contas da DIMO_Network, compartilhando dados de veículos para ganhar recompensas e avançar a inovação em IA no setor automotivo. Enquanto isso, a 23andWE visa adquirir a 23andMe para evitar a exploração de dados genéticos.
DataDAO representa uma abordagem inovadora para a gestão de dados, capacitando os indivíduos a controlar os seus dados e monetizá-los através da tokenização. Este ecossistema em rápida evolução introduz mais possibilidades abertas e democráticas para a governança de dados e treino de IA.
Baseando-se na fundação de pools de liquidez de dados, o DeFi está gradualmente a ser aplicado ao reino dos tokens de dados. As pools de liquidez de dados servem como a camada fundamental de todo o ecossistema, sobre a qual várias aplicações DeFi podem ser construídas usando tokens de dados.
Atualmente, algumas aplicações iniciais surgiram no ecossistema Data DeFi. Por exemplo, as bolsas descentralizadas como @VanaDataDexe@flur_protocolpermitir aos utilizadores negociar tokens de dados e acompanhar a dinâmica do mercado para tokens de dados específicos. A emergência destas plataformas facilitou o livre fluxo de ativos de dados e revitalizou o mercado de dados.
Vale ressaltar que a maioria dos mecanismos de recompensa DLP deposita principalmente as recompensas no tesouro DLP em vez de queimar diretamente tokens de dados ou afetar sua oferta e demanda. No entanto, com a introdução da atualização VRC-13, esse mecanismo evoluiu. O novo modelo introduz uma abordagem mais orientada para o mercado: incentivando as recompensas VANA para promover a tokenização de dados, que são então injetadas nas pools DEX para aprimorar a negociação de tokens de dados e ativar ainda mais o ecossistema DeFi.
Olhando para o futuro, funcionalidades atualmente alcançáveis no espaço DeFi—como empréstimos, staking, mineração de liquidez e até seguros—podem ser introduzidas no mercado de tokens de dados, criando cenários de aplicação inteiramente novos.
Do ponto de vista das indústrias tradicionais da Web2, semelhante à forma como as empresas compram futuros de petróleo para se protegerem contra flutuações de preços, o mercado de dados pode desenvolver futuros de dados, permitindo aos utilizadores fixar preços futuros para conjuntos de dados antecipadamente e reduzir a incerteza nos custos de aquisição.
Algumas empresas de negociação já começaram a considerar os dados como uma nova classe de ativos, pesquisando métodos de valoração, como a avaliação do valor de tokens de dados específicos, a probabilidade de utilização em vendas e a análise do ciclo de vida. Esses fatores influenciam diretamente o preço dos tokens de dados e a liquidez do mercado, deixando amplo espaço para inovação.
Atualmente, o acesso a conjuntos de dados na rede principal permanece relativamente complicado. Os utilizadores devem enviar pedidos detalhados especificando as suas necessidades, montantes de pagamento e código do projeto, e depois aguardar a aprovação antes de obterem acesso. Embora isso garanta transparência e padronização, cria atrito operacional.
Para melhorar a eficiência, a Vana está a desenvolver métodos de acesso a dados mais eficientes que permitem o acesso automatizado à API e a recuperação direta de dados em vários DataDAOs. Por exemplo, no futuro, os utilizadores poderiam combinar dados de sono com dados de negociação da Coinbase ou Binance para analisar os padrões de sono de detentores de tokens específicos e descobrir novas perspetivas de mercado.
Além disso, a Vana está a avançar com uma nova proposta que implementa uma taxa padrão de 80-20 para queimar tokens de dados e VANA em troca de direitos de acesso a dados.
Vana também desenvolveu uma nova interface de consulta de dados que simplifica significativamente o processo de acesso aos dados. Os usuários podem autenticar-se através do login na carteira e gerar assinaturas digitais para verificar suas permissões de acesso. Uma vez que os Pools de Liquidez de Dados (DLPs) registam formatos de dados, os usuários podem compreender claramente as estruturas de dados e recuperar as informações necessárias usando consultas SQL. Durante este processo, os usuários podem primeiro receber amostras de dados sintéticos para testar e verificar a precisão da consulta. Ao trabalhar com dados reais, todos os cálculos são realizados dentro de Ambientes de Execução Confiáveis (TEEs) para garantir a segurança dos dados. Este mecanismo previne eficazmente o “problema de dados de uso duplo” (onde os usuários podem revender dados comprados), protegendo assim o valor econômico dos dados e garantindo o desenvolvimento sustentável do mercado de dados.
Os dados estão rapidamente a emergir como o ativo central da era digital. Embora as tecnologias de recolha e armazenamento de dados tenham atingido uma maturidade considerável, o verdadeiro desafio reside em avaliar eficazmente a qualidade dos dados, maximizar o seu valor e garantir a proteção da privacidade. Vana aborda elegantemente este desafio através do seu inovador mecanismo de incentivo: os utilizadores podem apostar tokens VANA para apoiar DataDAOs de elevado valor, enquanto ganham recompensas correspondentes, criando um ciclo virtuoso de criação de valor.
O desenvolvimento de IA atingiu o “muro de dados” - os recursos públicos de dados de alta qualidade estão a esgotar-se. As futuras descobertas em IA dependerão inevitavelmente do acesso e utilização eficazes de dados privados de alto valor, como registos de saúde pessoal, dados de utilização de dispositivos inteligentes e vídeos de condução da Tesla como recursos potenciais de treino.
Existe um paradoxo no valor dos dados: os dados mantêm o seu valor através da exclusividade, mas tornam-se mercadorias e desvalorizam-se uma vez amplamente disponíveis. À medida que os modelos de IA se tornam mercadorias, a vantagem competitiva de longo prazo virá do controlo de conjuntos de dados exclusivos que permitem um desempenho superior em domínios especializados. Uma vez que os dados se tornam públicos, a competição de preços surge quase imediatamente, causando uma rápida desvalorização do valor.
O DataDAO da Vana aproveita Ambientes de Execução Confiável (TEEs) para permitir a transferência de dados privados de alto valor, preservando a privacidade. Esta inovação expande o âmbito dos ativos de dados valiosos dos conjuntos de dados públicos limitados para o vasto mundo dos dados privados, abrindo novas possibilidades para o avanço da IA.
Os dados exibem uma curva de valor distinta: os pontos de dados individuais têm um valor negligenciável, mas quando agregados a uma massa crítica, seu valor cresce exponencialmente. Essa característica apresenta desafios significativos para a monetização de dados - retornos substanciais só se materializam após a formação de conjuntos de dados coletivos.
O mecanismo DataDAO da Vana fornece uma solução inovadora para este dilema. Ao agrupar dados similares, os DataDAOs criam poder de negociação coletiva para os contribuintes. Considere os proprietários de Tesla: se todos os proprietários partilharem coletivamente dados de condução através de um DataDAO, ganham uma forte alavancagem de preços com qualquer potencial comprador. Em contraste, se os proprietários tentarem individualmente monetizar os seus dados, isso leva inevitavelmente a uma competição de preços onde os compradores podem simplesmente adquirir amostras suficientes dos licitantes mais baixos.
Conjuntos de dados estruturados e verificados de alta qualidade (como dados de condução autenticados da Tesla) comandam um valor de mercado premium, e a estrutura da Vana permite a realização plena deste valor.
O aspecto mais poderoso dos DataDAOs é a sua capacidade de alcançar a agregação de dados entre plataformas - algo quase impossível nos ecossistemas de jardins murados de hoje. Imagine os investigadores a precisar de aceder às mensagens combinadas do Facebook de um utilizador, ao histórico do iMessage e ao conteúdo do Google Docs. A abordagem tradicional exigiria a cooperação entre o Facebook, a Apple e o Google - plataformas que não têm incentivo para integrar os dados do utilizador (o que enfraqueceria as suas barreiras de dados) nem a autorização regulamentar para o fazer.
DataDAOs contornam elegantemente este obstáculo através da integração de dados liderada pelo utilizador, desbloqueando o valor de dados entre plataformas e criando oportunidades sem precedentes para o treino e pesquisa de IA.
A visão da Vana vai muito além da simples inovação tecnológica - está a pioneirar um paradigma de participação económica totalmente novo. Sob este modelo, os utilizadores podem envolver-se na economia digital sem os requisitos de capital tradicionais, pois já possuem o recurso mais valioso: os seus dados pessoais. Os utilizadores não precisam de trazer capital financeiro; partilhar os seus dados torna-se o seu capital. As DataDAOs fornecem aos utilizadores da Web3 fluxos de rendimento passivo derivados dos seus dados pessoais únicos, diminuindo significativamente a barreira à entrada para participar na economia digital.
Este modelo poderia reestruturar fundamentalmente como o valor dos avanços em IA é distribuído. Em vez de os lucros fluírem principalmente para grandes corporações de tecnologia, a propriedade de dados e os mecanismos de governança da Vana permitem uma participação ampla na economia da IA. Indicadores iniciais mostram uma forte ressonância com esta abordagem - mais de 300 DataDAOs já estão em desenvolvimento em testnets.
Olhando para os próximos 3-5 anos, poderemos testemunhar o surgimento de modelos de IA totalmente governados pelos utilizadores construídos por 100 milhões de contribuidores de dados - modelos que poderiam superar os principais sistemas de IA centralizados de hoje. Estes modelos de propriedade da comunidade criam um maior envolvimento e conexões dos utilizadores. A soberania dos dados capacita os utilizadores a apoiar seletivamente o desenvolvimento ético da IA, ao mesmo tempo que negam o acesso a empresas antiéticas.
A IA descentralizada fornece um quadro mais democrático onde a sociedade determina coletivamente o que a IA deve aprender e acreditar, em vez de deixar essas decisões a um punhado de corporações. A propriedade dos dados do usuário traduz-se não apenas em benefícios econômicos, mas também em controle substantivo sobre o comportamento do modelo de IA - incluindo a abordagem de questões críticas, como políticas de moderação de conteúdo.
A nível comercial, Vana está comprometida em construir uma cadeia de valor abrangente de dados que abrange todo o processo, desde a agregação de dados e treino de modelos de IA até à venda de dados. Atualmente, o mercado de dados é monopolizado por um punhado de plataformas e corretores de dados. A Vana tem como objetivo abordar esta ineficiência criando um ecossistema de negociação de dados mais justo.
Vana é mais do que apenas uma nova plataforma—representa uma mudança fundamental na propriedade de dados e no desenvolvimento de IA. Ao permitir que os utilizadores participem na criação de valor coletivo mantendo a soberania sobre os seus dados, Vana está a lançar as bases para um futuro de IA mais equitativo e inovador.
No mercado de IA de hoje, que está repleto de hype conceitual, Vana destaca-se com os seus mecanismos inovadores que lidam diretamente com os desafios centrais da indústria. Tem o potencial para se tornar uma força pivotante na formação da trajetória futura da IA.
Este artigo é reproduzido a partir de [GateBiteye], the copyright belongs to the original author [Biteye], se tiver alguma objeção à reimpressão, por favor entre em contato com o Gate Learnequipa, e a equipa irá tratar dela o mais rapidamente possível de acordo com os procedimentos relevantes.
Aviso Legal: As opiniões expressas neste artigo representam apenas as opiniões pessoais do autor e não constituem qualquer conselho de investimento.
Outras versões do artigo em outros idiomas são traduzidas pela equipe Gate Learn. O artigo traduzido não pode ser copiado, distribuído ou plagiado sem mencionar Gate.Gate.io.
Há um mês, a YZi Labs anunciou seu investimento na Vana, com o fundador da Binance CZ juntando-se como consultor, solidificando a posição de liderança da Vana no setor de dados de IA. Quatro dias depois, durante uma AMA com a Vana, CZ afirmou que os dados são o combustível central para a IA, os dados públicos foram esgotados e os dados privados permanecem inexplorados. Ele expressou otimismo sobre a adequação do produto ao mercado (PMF) da Vana e o crescimento do usuário.
Porque é que a YZi Labs, a Coinbase Ventures e a Paradigm investiram na Vana? Porque é que o CZ está otimista em relação ao desenvolvimento da Vana?
Este relatório analisa sistematicamente os desafios dos dados de IA, a proposta de valor central da Vana, aplicações práticas e trajetória de crescimento futuro, revelando como a Vana está se tornando uma infraestrutura crítica para o ecossistema de IA.
De acordo com dados da PitchBook, a indústria de IA dos EUA atraiu quase 20 mil milhões em investimentos no 1º trimestre de 2025. Até 2024, as startups de IA representaram um terço do capital de risco global, totalizando 131,5 mil milhões, com quase um quarto dos novos empreendimentos focados em IA. Os dados da Statista confirmam ainda mais este crescimento explosivo—o financiamento de capital de risco para IA e aprendizagem automática aumentou de 670 milhões em 2011 para 36 mil milhões em 2020, um aumento de 50 vezes. Esta tendência indica claramente que a IA se tornou a escolha partilhada de capital inteligente e principais empreendedores.
No entanto, a arquitetura fundamental da IA—“dados + modelos + computação”—enfrenta gargalos estruturais. O principal impulsionador do desempenho do modelo de IA não é a potência computacional ou avanços algorítmicos, mas a qualidade e escala dos conjuntos de dados de treino. Os atuais modelos de linguagem grandes estão a atingir um ponto crítico de exaustão de dados. O Llama 3 da Meta foi treinado com aproximadamente 15 biliões de tokens, quase esgotando todos os dados públicos de alta qualidade da internet. Apesar do vasto volume de dados públicos da internet, representa apenas a ponta do icebergue. Um facto amplamente ignorado é que os dados de alto valor estão maioritariamente bloqueados atrás de sistemas proprietários que requerem acesso autorizado. Os dados públicos da internet representam menos de 0.1% de todos os dados. Este problema transcende a capacidade da indústria de IA para resolver sozinha e requer a tecnologia blockchain para redefinir as relações de produção de dados, estabelecer novos mecanismos de incentivo e catalisar o surgimento de dados de alta qualidade em escala.
Por outro lado, hoje em dia, a maioria dos dados é controlada por empresas de tecnologia Web2 dentro de ecossistemas fechados. O desenvolvimento de IA enfrenta o desafio das barreiras de dados, uma barreira que existe porque essas empresas reconhecem o imenso valor dos dados. Modelos de IA de alta qualidade geram retornos econômicos significativos, por exemplo, a receita anual da OpenAI atingiu aproximadamente $3.4 bilhões. A construção de modelos de IA superiores requer vastas quantidades de dados, muitas vezes a custos elevados de aquisição.
Por exemplo, o Reddit ganha cerca de $200 milhões anualmente vendendo dados, cobra US$1–US$2 por imagem, e as transações de dados de notícias da Apple chegam a US$50 milhões. A propriedade de dados evoluiu de uma simples preferência de privacidade para uma questão econômica importante. Num mundo onde os modelos de IA impulsionam grande parte da economia, a propriedade de dados equivale a deter ações em futuros modelos de IA.
À medida que a comercialização de dados se torna mais prevalente, o acesso a dados torna-se cada vez mais difícil. Muitas plataformas estão a ajustar os seus termos de serviço e políticas de API para restringir o acesso de desenvolvedores externos. Por exemplo, o Reddit e o Stack Overflow modificaram as regras da API, tornando a aquisição de dados mais desafiadora. Esta tendência está a expandir-se, com plataformas ricas em dados a moverem-se para uma maior exclusividade.
No entanto, um grupo mantém acesso livre a estes dados: os próprios utilizadores. Muitas pessoas não têm consciência de que, legalmente, mantêm a propriedade total dos seus dados. Tal como estacionar um carro num parque de estacionamento não concede ao parque direitos sobre o veículo, os dados dos utilizadores armazenados em plataformas sociais permanecem sua propriedade.
Ao se registrar, os usuários normalmente marcam caixas que permitem que as plataformas 'usem seus dados', o que concede autorização às plataformas para operar serviços, mas não renuncia à propriedade. Os usuários podem solicitar seus dados a qualquer momento. Mesmo que as plataformas restrinjam o acesso à API para os desenvolvedores, os usuários individuais ainda podem legalmente recuperar seus dados. Por exemplo, o Instagram permite que os usuários exportem dados da conta, incluindo fotos, comentários e até tags de marketing geradas por IA. No 23 and Me, os usuários podem solicitar seus dados genéticos, embora o processo possa não ser intuitivo.
Globalmente, as regulamentações estão a melhorar para garantir que os utilizadores possam recuperar os seus dados. À medida que o valor dos dados aumenta, os utilizadores devem reconhecer e exercer os seus direitos de propriedade.
As empresas de tecnologia estão a construir sistemas fechados para proteger os seus valiosos ativos de dados. A missão da VANA é desbloquear estes dados e devolver o controlo aos utilizadores, permitindo a soberania dos dados.
Em outras palavras, os utilizadores podem extrair os seus dados de várias plataformas e criar conjuntos de dados superiores às ofertas de qualquer plataforma existente.
A estrutura da VANA é construída em dois conceitos fundamentais:
Quando os desenvolvedores pagam para aceder a dados, os contribuidores recebem tokens de governação proporcionais à sua contribuição. Isto permite aos contribuidores ganhar recompensas contínuas e participar na tomada de decisões, reformulando o preço e eficiência do mercado de dados.
DataDAO é um mercado de dados descentralizado dentro do ecossistema VANA, permitindo aos utilizadores contribuir, tokenizar e utilizar dados. Os utilizadores podem selecionar pools de mineração de dados adequados (por exemplo, dados de fitness, dados de pesquisa) para contribuir com seus dados. Os dados contribuídos passam por validação pelo mecanismo de Prova de Contribuição da Vana, que avalia sua qualidade e valor para garantir uma compensação justa para os contribuintes.
Uma vez verificado, os dados são tokenizados em ativos digitais que podem ser negociados ou usados para treino de IA, enquanto os contribuidores mantêm o controle sobre a sua utilização. Cada vez que os dados são utilizados, os contribuidores recebem recompensas em tokens e direitos de governança, permitindo-lhes beneficiar economicamente e influenciar a direção do pool de dados. Ao agregar conjuntos de dados diversos, o DataDAO cria um mercado de dados líquido, facilitando a circulação segura e eficiente de dados dentro do ecossistema VANA.
No cerne da DataDAO está o Data Liquidity Pool (DLP) - uma coleção de conjuntos de dados validados ligados a tokens. Os DLPs são geridos pelos membros da DataDAO, que detêm direitos de governação. Cada DLP define claramente a sua estrutura de dados e padrões de contribuição. Por exemplo, o Sleep.com, um DataDAO focado no sono, estabeleceu um esquema de dados bem definido para garantir que todos os dados on-chain sejam estruturados e utilizáveis. O valor dos dados reside não apenas no seu volume, mas também na sua estrutura e acessibilidade.
DataDAO coloca uma forte ênfase na autenticidade e validade dos dados. Atualmente, a maioria dos DataDAOs utiliza Ambientes de Execução Confiável (TEEs) para executar scripts Python para validação de dados, garantindo qualidade enquanto preserva a privacidade. Por exemplo, a DataDAO da Amazon emprega extensões do navegador para gerar provas de qualidade de dados. Todos os DataDAOs divulgam publicamente seus mecanismos de Prova de Contribuição, permitindo que os usuários entendam como a qualidade dos dados é assegurada.
Os 16 melhores DLPs no ecossistema VANA recebem incentivos adicionais, permitindo aos utilizadores ganhar recompensas ao contribuir com dados de alta qualidade. As recompensas são distribuídas com base em métricas como frequência de acesso aos dados, qualidade e eficiência de custos. Atualmente, o Reddit DataDAO é o maior, atraindo cerca de 140.000 utilizadores e treinando com sucesso um modelo de IA de propriedade da comunidade. O DataDAO da DLP Labs permite aos condutores conectar suas contas da DIMO_Network, compartilhando dados de veículos para ganhar recompensas e avançar a inovação em IA no setor automotivo. Enquanto isso, a 23andWE visa adquirir a 23andMe para evitar a exploração de dados genéticos.
DataDAO representa uma abordagem inovadora para a gestão de dados, capacitando os indivíduos a controlar os seus dados e monetizá-los através da tokenização. Este ecossistema em rápida evolução introduz mais possibilidades abertas e democráticas para a governança de dados e treino de IA.
Baseando-se na fundação de pools de liquidez de dados, o DeFi está gradualmente a ser aplicado ao reino dos tokens de dados. As pools de liquidez de dados servem como a camada fundamental de todo o ecossistema, sobre a qual várias aplicações DeFi podem ser construídas usando tokens de dados.
Atualmente, algumas aplicações iniciais surgiram no ecossistema Data DeFi. Por exemplo, as bolsas descentralizadas como @VanaDataDexe@flur_protocolpermitir aos utilizadores negociar tokens de dados e acompanhar a dinâmica do mercado para tokens de dados específicos. A emergência destas plataformas facilitou o livre fluxo de ativos de dados e revitalizou o mercado de dados.
Vale ressaltar que a maioria dos mecanismos de recompensa DLP deposita principalmente as recompensas no tesouro DLP em vez de queimar diretamente tokens de dados ou afetar sua oferta e demanda. No entanto, com a introdução da atualização VRC-13, esse mecanismo evoluiu. O novo modelo introduz uma abordagem mais orientada para o mercado: incentivando as recompensas VANA para promover a tokenização de dados, que são então injetadas nas pools DEX para aprimorar a negociação de tokens de dados e ativar ainda mais o ecossistema DeFi.
Olhando para o futuro, funcionalidades atualmente alcançáveis no espaço DeFi—como empréstimos, staking, mineração de liquidez e até seguros—podem ser introduzidas no mercado de tokens de dados, criando cenários de aplicação inteiramente novos.
Do ponto de vista das indústrias tradicionais da Web2, semelhante à forma como as empresas compram futuros de petróleo para se protegerem contra flutuações de preços, o mercado de dados pode desenvolver futuros de dados, permitindo aos utilizadores fixar preços futuros para conjuntos de dados antecipadamente e reduzir a incerteza nos custos de aquisição.
Algumas empresas de negociação já começaram a considerar os dados como uma nova classe de ativos, pesquisando métodos de valoração, como a avaliação do valor de tokens de dados específicos, a probabilidade de utilização em vendas e a análise do ciclo de vida. Esses fatores influenciam diretamente o preço dos tokens de dados e a liquidez do mercado, deixando amplo espaço para inovação.
Atualmente, o acesso a conjuntos de dados na rede principal permanece relativamente complicado. Os utilizadores devem enviar pedidos detalhados especificando as suas necessidades, montantes de pagamento e código do projeto, e depois aguardar a aprovação antes de obterem acesso. Embora isso garanta transparência e padronização, cria atrito operacional.
Para melhorar a eficiência, a Vana está a desenvolver métodos de acesso a dados mais eficientes que permitem o acesso automatizado à API e a recuperação direta de dados em vários DataDAOs. Por exemplo, no futuro, os utilizadores poderiam combinar dados de sono com dados de negociação da Coinbase ou Binance para analisar os padrões de sono de detentores de tokens específicos e descobrir novas perspetivas de mercado.
Além disso, a Vana está a avançar com uma nova proposta que implementa uma taxa padrão de 80-20 para queimar tokens de dados e VANA em troca de direitos de acesso a dados.
Vana também desenvolveu uma nova interface de consulta de dados que simplifica significativamente o processo de acesso aos dados. Os usuários podem autenticar-se através do login na carteira e gerar assinaturas digitais para verificar suas permissões de acesso. Uma vez que os Pools de Liquidez de Dados (DLPs) registam formatos de dados, os usuários podem compreender claramente as estruturas de dados e recuperar as informações necessárias usando consultas SQL. Durante este processo, os usuários podem primeiro receber amostras de dados sintéticos para testar e verificar a precisão da consulta. Ao trabalhar com dados reais, todos os cálculos são realizados dentro de Ambientes de Execução Confiáveis (TEEs) para garantir a segurança dos dados. Este mecanismo previne eficazmente o “problema de dados de uso duplo” (onde os usuários podem revender dados comprados), protegendo assim o valor econômico dos dados e garantindo o desenvolvimento sustentável do mercado de dados.
Os dados estão rapidamente a emergir como o ativo central da era digital. Embora as tecnologias de recolha e armazenamento de dados tenham atingido uma maturidade considerável, o verdadeiro desafio reside em avaliar eficazmente a qualidade dos dados, maximizar o seu valor e garantir a proteção da privacidade. Vana aborda elegantemente este desafio através do seu inovador mecanismo de incentivo: os utilizadores podem apostar tokens VANA para apoiar DataDAOs de elevado valor, enquanto ganham recompensas correspondentes, criando um ciclo virtuoso de criação de valor.
O desenvolvimento de IA atingiu o “muro de dados” - os recursos públicos de dados de alta qualidade estão a esgotar-se. As futuras descobertas em IA dependerão inevitavelmente do acesso e utilização eficazes de dados privados de alto valor, como registos de saúde pessoal, dados de utilização de dispositivos inteligentes e vídeos de condução da Tesla como recursos potenciais de treino.
Existe um paradoxo no valor dos dados: os dados mantêm o seu valor através da exclusividade, mas tornam-se mercadorias e desvalorizam-se uma vez amplamente disponíveis. À medida que os modelos de IA se tornam mercadorias, a vantagem competitiva de longo prazo virá do controlo de conjuntos de dados exclusivos que permitem um desempenho superior em domínios especializados. Uma vez que os dados se tornam públicos, a competição de preços surge quase imediatamente, causando uma rápida desvalorização do valor.
O DataDAO da Vana aproveita Ambientes de Execução Confiável (TEEs) para permitir a transferência de dados privados de alto valor, preservando a privacidade. Esta inovação expande o âmbito dos ativos de dados valiosos dos conjuntos de dados públicos limitados para o vasto mundo dos dados privados, abrindo novas possibilidades para o avanço da IA.
Os dados exibem uma curva de valor distinta: os pontos de dados individuais têm um valor negligenciável, mas quando agregados a uma massa crítica, seu valor cresce exponencialmente. Essa característica apresenta desafios significativos para a monetização de dados - retornos substanciais só se materializam após a formação de conjuntos de dados coletivos.
O mecanismo DataDAO da Vana fornece uma solução inovadora para este dilema. Ao agrupar dados similares, os DataDAOs criam poder de negociação coletiva para os contribuintes. Considere os proprietários de Tesla: se todos os proprietários partilharem coletivamente dados de condução através de um DataDAO, ganham uma forte alavancagem de preços com qualquer potencial comprador. Em contraste, se os proprietários tentarem individualmente monetizar os seus dados, isso leva inevitavelmente a uma competição de preços onde os compradores podem simplesmente adquirir amostras suficientes dos licitantes mais baixos.
Conjuntos de dados estruturados e verificados de alta qualidade (como dados de condução autenticados da Tesla) comandam um valor de mercado premium, e a estrutura da Vana permite a realização plena deste valor.
O aspecto mais poderoso dos DataDAOs é a sua capacidade de alcançar a agregação de dados entre plataformas - algo quase impossível nos ecossistemas de jardins murados de hoje. Imagine os investigadores a precisar de aceder às mensagens combinadas do Facebook de um utilizador, ao histórico do iMessage e ao conteúdo do Google Docs. A abordagem tradicional exigiria a cooperação entre o Facebook, a Apple e o Google - plataformas que não têm incentivo para integrar os dados do utilizador (o que enfraqueceria as suas barreiras de dados) nem a autorização regulamentar para o fazer.
DataDAOs contornam elegantemente este obstáculo através da integração de dados liderada pelo utilizador, desbloqueando o valor de dados entre plataformas e criando oportunidades sem precedentes para o treino e pesquisa de IA.
A visão da Vana vai muito além da simples inovação tecnológica - está a pioneirar um paradigma de participação económica totalmente novo. Sob este modelo, os utilizadores podem envolver-se na economia digital sem os requisitos de capital tradicionais, pois já possuem o recurso mais valioso: os seus dados pessoais. Os utilizadores não precisam de trazer capital financeiro; partilhar os seus dados torna-se o seu capital. As DataDAOs fornecem aos utilizadores da Web3 fluxos de rendimento passivo derivados dos seus dados pessoais únicos, diminuindo significativamente a barreira à entrada para participar na economia digital.
Este modelo poderia reestruturar fundamentalmente como o valor dos avanços em IA é distribuído. Em vez de os lucros fluírem principalmente para grandes corporações de tecnologia, a propriedade de dados e os mecanismos de governança da Vana permitem uma participação ampla na economia da IA. Indicadores iniciais mostram uma forte ressonância com esta abordagem - mais de 300 DataDAOs já estão em desenvolvimento em testnets.
Olhando para os próximos 3-5 anos, poderemos testemunhar o surgimento de modelos de IA totalmente governados pelos utilizadores construídos por 100 milhões de contribuidores de dados - modelos que poderiam superar os principais sistemas de IA centralizados de hoje. Estes modelos de propriedade da comunidade criam um maior envolvimento e conexões dos utilizadores. A soberania dos dados capacita os utilizadores a apoiar seletivamente o desenvolvimento ético da IA, ao mesmo tempo que negam o acesso a empresas antiéticas.
A IA descentralizada fornece um quadro mais democrático onde a sociedade determina coletivamente o que a IA deve aprender e acreditar, em vez de deixar essas decisões a um punhado de corporações. A propriedade dos dados do usuário traduz-se não apenas em benefícios econômicos, mas também em controle substantivo sobre o comportamento do modelo de IA - incluindo a abordagem de questões críticas, como políticas de moderação de conteúdo.
A nível comercial, Vana está comprometida em construir uma cadeia de valor abrangente de dados que abrange todo o processo, desde a agregação de dados e treino de modelos de IA até à venda de dados. Atualmente, o mercado de dados é monopolizado por um punhado de plataformas e corretores de dados. A Vana tem como objetivo abordar esta ineficiência criando um ecossistema de negociação de dados mais justo.
Vana é mais do que apenas uma nova plataforma—representa uma mudança fundamental na propriedade de dados e no desenvolvimento de IA. Ao permitir que os utilizadores participem na criação de valor coletivo mantendo a soberania sobre os seus dados, Vana está a lançar as bases para um futuro de IA mais equitativo e inovador.
No mercado de IA de hoje, que está repleto de hype conceitual, Vana destaca-se com os seus mecanismos inovadores que lidam diretamente com os desafios centrais da indústria. Tem o potencial para se tornar uma força pivotante na formação da trajetória futura da IA.
Este artigo é reproduzido a partir de [GateBiteye], the copyright belongs to the original author [Biteye], se tiver alguma objeção à reimpressão, por favor entre em contato com o Gate Learnequipa, e a equipa irá tratar dela o mais rapidamente possível de acordo com os procedimentos relevantes.
Aviso Legal: As opiniões expressas neste artigo representam apenas as opiniões pessoais do autor e não constituem qualquer conselho de investimento.
Outras versões do artigo em outros idiomas são traduzidas pela equipe Gate Learn. O artigo traduzido não pode ser copiado, distribuído ou plagiado sem mencionar Gate.Gate.io.