O maior obstáculo da IA não é o design do modelo ou as GPUs - é os dados. E agora mesmo, esses dados estão a ser bloqueados e adulterados. As grandes plataformas da Web2 (Reddit, X, Google, etc.) estão a guardar as suas informações atrás de paywalls ou TOS apertados. Os monopólios de dados chegaram e estão a sufocar os mais pequenos. Ao mesmo tempo, a qualidade da web aberta está a cair a pique - as informações são deliberadamente envenenadas, e o lixo gerado por IA está a poluir o corpus. É uma tempestade perfeita: a IA precisa de dados, mas o poço está guardado e contaminado.
*Veja a versão completa de “AI’s Biggest Grassroots Moment” emPortal de Pesquisa das Quatro Pilastras
Introduzir@getgrass_io, um protocolo de raspagem da web descentralizado que inverte este script. Pense em milhões de dispositivos do dia a dia (PCs agora, em breve telefones) atuando como mini web crawlers, raspando a internet 24/7 em busca de dados públicos. O Grass transforma conteúdo web bruto em conjuntos de dados estruturados prontos para IA, e faz isso através da cripto economia: os usuários ganham recompensas por contribuir com largura de banda e computação. É como mineração de web de crowdsourcing, mas para informações em vez de Bitcoin.
A Grass já está em funcionamento em grande escala. Mais de 3 milhões de nós em todo o mundo estão ligados à rede e, em conjunto, estão a recolher incríveis 1.500 TB de dados diariamente. Ao utilizar inúmeras IPs residenciais, a Grass pode recolher dados de sites sem acionar os habituais alarmes anti-escravatura (não mais ser banido por IP por rastrear demais). Basicamente, substitui as gigantescas fazendas de dados centralizadas por um enxame de “abelhas de dados” individuais - mais difíceis de abater, fáceis de escalar.
Porque é que isto é importante? Porque quebra os monopólios de dados. Em vez de alguns grandes players a monopolizar dados ou a cobrar taxas absurdas, qualquer startup de IA ou investigador pode aceder ao fluxo de dados da Grass. Imagine extrair conteúdo do Reddit ou Twitter para o seu modelo de IA sem ter de mendigar acesso à API ou desembolsar milhões - a Grass torna isso plausível. É a alternativa sem permissão para a era da IA: se os dados são o novo petróleo, a Grass está a construir uma rede de plataformas petrolíferas descentralizadas onde qualquer um pode perfurar.
O controlo de qualidade é a outra metade da equação, e a Grass tem uma resposta inteligente: provas de conhecimento zero e verificação on-chain. Cada pedaço de dados recolhido pode ser carimbado com uma prova criptográfica (um ZK-SNARK) atestando a sua origem e integridade, registado na própria blockchain da Grass (um rollup soberano que estão a construir para este efeito). Em termos simples: recebe um recibo para cada excerto da web que diz “isto veio da Fonte X na hora Y e não foi adulterado.” Isto é enorme para combater a poluição e lixo de dados. Quando o pipeline é verificável, pode filtrar dados suspeitos ou corrompidos - ou pelo menos rastrear problemas após o facto. Num mundo onde a IA pode treinar acidentalmente com lixo gerado por IA, ter um carimbo de autenticidade para os dados é um jogo de mudança.
Vamos falar sobre a pilha tecnológica: O Grass começou na Solana (para velocidade), mas mesmo a Solana não consegue lidar com o volume aqui. Assim, a equipe está a pensar em implementar um rollup soberano (pense nele como o seu próprio blockchain L2) para lidar com o elevado débito de uma cadeia principal, enquanto ainda ancora a confiança numa camada base.
Eles chamam a atual atualização principal de Sion, e já está atingindo como um trem de carga. A Grass agora lida com mais de 1.500 TB de dados por dia - não como um objetivo, mas como uma métrica em tempo real. Sion (Fases 1 & 2) potencializou a rede, desbloqueando um throughput em escala de petabytes e permitindo raspagem multimodal em tempo real: não apenas texto, mas também imagens e vídeos, transmitindo em escala. Basicamente, a Grass evoluiu de uma dieta apenas de texto para um buffet de dados da web à vontade. Para os profissionais de IA que pensam além do texto (olá modelos de visão, GPT-4, etc.), isso é muito importante.
Agora, como é que a Grass incentiva esta rede expansiva? Introduzir a economia de tokens. Neste momento, os utilizadores ganham pontos da Grass por executar nós - basicamente um marcador de posição para a coisa real. Um$GRASStoken está no horizonte, e é aqui que a cripto encontra a economia da IA. A utilidade do token irá unir todo o sistema: empresas de IA ou investigadores irão gastar$GRASSpara solicitar dados (como pagar por chamada de API, mas descentralizado), e os operadores de nó irão ganhar$GRASSpara cumprir esses pedidos (raspagem e entrega de dados). Os validadores na rede provavelmente apostarão tokens para garantir comportamento honesto e entrega de dados de alta qualidade (os maus atores podem ser cortados, os bons atores recompensados). Em resumo,$GRASSvai lubrificar as engrenagens, alinhando incentivos entre consumidores de dados e fornecedores.
Crucialmente, a abordagem de Grass mitiga algumas questões existenciais na IA:
Para ser claro, a Grass ainda está nos primeiros dias. Está em beta, algumas partes ainda estão centralizadas (agora há um coordenador central, para ser descentralizado mais tarde), e o armazenamento/limpeza de dados é do lado do cliente por enquanto. Mas a trajetória está definida. A rede está a explodir em tamanho (atingindo máximos históricos em nós e volume de dados este ano), e cada atualização (como Sion) aproxima-a de um protocolo totalmente desenvolvido e auto-sustentável.
A visão é ousada: a Grass quer ser a camada de dados para a IA descentralizada. Imagine um mercado aberto onde qualquer pessoa pode obter dados de treino de alta qualidade sob demanda, com confiança criptográfica incorporada. Sem porteiros, sem aluguéis gigantes pagos ao Reddit ou Google, e menos preocupações com modelos colapsando por se alimentarem do próprio rabo. É uma torrente de dados de IA de propriedade da comunidade e segura por criptografia.
Num mundo cripto ávido por utilidade real, Grass destaca-se como um projeto que combina duas mega-tendências (IA & DePIN) com um produto real em ambiente selvagem. O seu nome é astuto em termos de memes, mas é sério na execução. Se tiver sucesso, o Grass poderá transformar a paisagem da IA – tornando a própria web numa fonte de dados viva e respirante, aberta a todos. Para VCs, construtores e espreitadores do Crypto Twitter, estejam atentos a este projeto. Não é comum ver uma nova camada de infraestrutura da internet a ser construída em tempo real, alimentada por um token e um sonho de informação livre a fluir.
分享
目录
O maior obstáculo da IA não é o design do modelo ou as GPUs - é os dados. E agora mesmo, esses dados estão a ser bloqueados e adulterados. As grandes plataformas da Web2 (Reddit, X, Google, etc.) estão a guardar as suas informações atrás de paywalls ou TOS apertados. Os monopólios de dados chegaram e estão a sufocar os mais pequenos. Ao mesmo tempo, a qualidade da web aberta está a cair a pique - as informações são deliberadamente envenenadas, e o lixo gerado por IA está a poluir o corpus. É uma tempestade perfeita: a IA precisa de dados, mas o poço está guardado e contaminado.
*Veja a versão completa de “AI’s Biggest Grassroots Moment” emPortal de Pesquisa das Quatro Pilastras
Introduzir@getgrass_io, um protocolo de raspagem da web descentralizado que inverte este script. Pense em milhões de dispositivos do dia a dia (PCs agora, em breve telefones) atuando como mini web crawlers, raspando a internet 24/7 em busca de dados públicos. O Grass transforma conteúdo web bruto em conjuntos de dados estruturados prontos para IA, e faz isso através da cripto economia: os usuários ganham recompensas por contribuir com largura de banda e computação. É como mineração de web de crowdsourcing, mas para informações em vez de Bitcoin.
A Grass já está em funcionamento em grande escala. Mais de 3 milhões de nós em todo o mundo estão ligados à rede e, em conjunto, estão a recolher incríveis 1.500 TB de dados diariamente. Ao utilizar inúmeras IPs residenciais, a Grass pode recolher dados de sites sem acionar os habituais alarmes anti-escravatura (não mais ser banido por IP por rastrear demais). Basicamente, substitui as gigantescas fazendas de dados centralizadas por um enxame de “abelhas de dados” individuais - mais difíceis de abater, fáceis de escalar.
Porque é que isto é importante? Porque quebra os monopólios de dados. Em vez de alguns grandes players a monopolizar dados ou a cobrar taxas absurdas, qualquer startup de IA ou investigador pode aceder ao fluxo de dados da Grass. Imagine extrair conteúdo do Reddit ou Twitter para o seu modelo de IA sem ter de mendigar acesso à API ou desembolsar milhões - a Grass torna isso plausível. É a alternativa sem permissão para a era da IA: se os dados são o novo petróleo, a Grass está a construir uma rede de plataformas petrolíferas descentralizadas onde qualquer um pode perfurar.
O controlo de qualidade é a outra metade da equação, e a Grass tem uma resposta inteligente: provas de conhecimento zero e verificação on-chain. Cada pedaço de dados recolhido pode ser carimbado com uma prova criptográfica (um ZK-SNARK) atestando a sua origem e integridade, registado na própria blockchain da Grass (um rollup soberano que estão a construir para este efeito). Em termos simples: recebe um recibo para cada excerto da web que diz “isto veio da Fonte X na hora Y e não foi adulterado.” Isto é enorme para combater a poluição e lixo de dados. Quando o pipeline é verificável, pode filtrar dados suspeitos ou corrompidos - ou pelo menos rastrear problemas após o facto. Num mundo onde a IA pode treinar acidentalmente com lixo gerado por IA, ter um carimbo de autenticidade para os dados é um jogo de mudança.
Vamos falar sobre a pilha tecnológica: O Grass começou na Solana (para velocidade), mas mesmo a Solana não consegue lidar com o volume aqui. Assim, a equipe está a pensar em implementar um rollup soberano (pense nele como o seu próprio blockchain L2) para lidar com o elevado débito de uma cadeia principal, enquanto ainda ancora a confiança numa camada base.
Eles chamam a atual atualização principal de Sion, e já está atingindo como um trem de carga. A Grass agora lida com mais de 1.500 TB de dados por dia - não como um objetivo, mas como uma métrica em tempo real. Sion (Fases 1 & 2) potencializou a rede, desbloqueando um throughput em escala de petabytes e permitindo raspagem multimodal em tempo real: não apenas texto, mas também imagens e vídeos, transmitindo em escala. Basicamente, a Grass evoluiu de uma dieta apenas de texto para um buffet de dados da web à vontade. Para os profissionais de IA que pensam além do texto (olá modelos de visão, GPT-4, etc.), isso é muito importante.
Agora, como é que a Grass incentiva esta rede expansiva? Introduzir a economia de tokens. Neste momento, os utilizadores ganham pontos da Grass por executar nós - basicamente um marcador de posição para a coisa real. Um$GRASStoken está no horizonte, e é aqui que a cripto encontra a economia da IA. A utilidade do token irá unir todo o sistema: empresas de IA ou investigadores irão gastar$GRASSpara solicitar dados (como pagar por chamada de API, mas descentralizado), e os operadores de nó irão ganhar$GRASSpara cumprir esses pedidos (raspagem e entrega de dados). Os validadores na rede provavelmente apostarão tokens para garantir comportamento honesto e entrega de dados de alta qualidade (os maus atores podem ser cortados, os bons atores recompensados). Em resumo,$GRASSvai lubrificar as engrenagens, alinhando incentivos entre consumidores de dados e fornecedores.
Crucialmente, a abordagem de Grass mitiga algumas questões existenciais na IA:
Para ser claro, a Grass ainda está nos primeiros dias. Está em beta, algumas partes ainda estão centralizadas (agora há um coordenador central, para ser descentralizado mais tarde), e o armazenamento/limpeza de dados é do lado do cliente por enquanto. Mas a trajetória está definida. A rede está a explodir em tamanho (atingindo máximos históricos em nós e volume de dados este ano), e cada atualização (como Sion) aproxima-a de um protocolo totalmente desenvolvido e auto-sustentável.
A visão é ousada: a Grass quer ser a camada de dados para a IA descentralizada. Imagine um mercado aberto onde qualquer pessoa pode obter dados de treino de alta qualidade sob demanda, com confiança criptográfica incorporada. Sem porteiros, sem aluguéis gigantes pagos ao Reddit ou Google, e menos preocupações com modelos colapsando por se alimentarem do próprio rabo. É uma torrente de dados de IA de propriedade da comunidade e segura por criptografia.
Num mundo cripto ávido por utilidade real, Grass destaca-se como um projeto que combina duas mega-tendências (IA & DePIN) com um produto real em ambiente selvagem. O seu nome é astuto em termos de memes, mas é sério na execução. Se tiver sucesso, o Grass poderá transformar a paisagem da IA – tornando a própria web numa fonte de dados viva e respirante, aberta a todos. Para VCs, construtores e espreitadores do Crypto Twitter, estejam atentos a este projeto. Não é comum ver uma nova camada de infraestrutura da internet a ser construída em tempo real, alimentada por um token e um sonho de informação livre a fluir.