Gate Ventures Research Insights: A Terceira Guerra dos Navegadores: A Batalha de Entrada na Era dos Agentes de IA

Mercado de criptomoedas Investigação aprofundada

9/4/2025, 8:24:44 PM

Tenha acesso a análises proprietárias, teses de investimento e mergulhos profundos nos projetos que moldam o futuro dos ativos digitais, apresentando a mais recente análise de tecnologia de ponta e desenvolvimentos do ecossistema.

TL;DR

A terceira guerra dos navegadores está se desenrolando silenciosamente. Olhando para a história, desde o Netscape e o Internet Explorer da Microsoft nos anos 1990 até o Firefox de código aberto e o Chrome do Google, a guerra dos navegadores sempre foi uma manifestação concentrada do controle da plataforma e das mudanças de paradigma tecnológico. O Chrome garantiu sua posição dominante graças à sua velocidade de atualização rápida e ecossistema integrado, enquanto o Google, através de seu duopólio de busca e navegador, formou um ciclo fechado de acesso à informação.

Mas hoje, esta paisagem está a abalar. A ascensão de grandes modelos de linguagem (LLMs) está a permitir que cada vez mais utilizadores completem tarefas sem clicar na página de resultados de pesquisa, enquanto os cliques em páginas web tradicionais estão a diminuir. Entretanto, rumores de que a Apple pretende substituir o motor de busca por defeito no Safari ameaçam ainda mais a base de lucro da Alphabet (a empresa-mãe do Google), e o mercado começa a expressar inquietação sobre a "ortodoxia da pesquisa."

O próprio navegador também está a enfrentar uma reformulação do seu papel. Não é apenas uma ferramenta para exibir páginas web, mas também um recipiente para múltiplas capacidades, incluindo entrada de dados, comportamento do utilizador e identidade privada. Embora os agentes de IA sejam poderosos, ainda dependem do limite de confiança e da sandbox funcional do navegador para completar interações complexas nas páginas, aceder a dados de identidade locais e controlar elementos da página web. Os navegadores estão a evoluir de interfaces humanas para plataformas de chamadas de sistema para agentes.

Neste artigo, exploramos se os navegadores ainda são necessários. Acreditamos que o que pode realmente perturbar o atual panorama do mercado de navegadores não é outro "Chrome melhor", mas uma nova estrutura de interação: não apenas exibição de informações, mas invocação de tarefas. Os navegadores do futuro devem ser projetados para agentes de IA—capazes não apenas de ler, mas também de escrever e executar. Projetos como Browser Use estão a tentar semantizar a estrutura das páginas, transformando interfaces visuais em texto estruturado chamável por LLM, mapeando páginas para comandos e reduzindo significativamente os custos de interação.

Grandes projetos já estão testando as águas: Perplexity está construindo um navegador nativo, Comet, que substitui os resultados de busca tradicionais por IA; Brave está combinando proteção de privacidade com raciocínio local, usando LLM para melhorar a busca e as capacidades de bloqueio; e projetos nativos de cripto como Donut estão visando novos pontos de entrada para IA interagir com ativos on-chain. Uma característica comum entre esses projetos é a tentativa de reformular a camada de entrada do navegador, em vez de embelezar sua camada de saída.

Para os empreendedores, as oportunidades residem dentro do triângulo de input, estrutura e acesso ao agente. Como a interface para o futuro mundo baseado em agentes, o navegador significa que quem puder fornecer "capacidades" estruturadas, chamáveis e confiáveis se tornará um componente da plataforma de próxima geração. Desde SEO até AEO (Otimização do Motor de Agentes), desde o tráfego de página até a invocação de cadeias de tarefas, a forma do produto e o pensamento de design estão sendo remodelados. A terceira guerra dos navegadores está ocorrendo sobre "input" em vez de "display". A vitória não é mais determinada por quem captura a atenção do usuário, mas por quem ganha a confiança do agente e obtém acesso.

Uma Breve História do Desenvolvimento de Browsers

No início da década de 1990, antes de a internet se tornar parte da vida cotidiana, o Netscape Navigator surgiu, como um veleiro que abriu a porta para o mundo digital para milhões de utilizadores. Embora não fosse o primeiro navegador, foi o primeiro a realmente alcançar as massas e moldar a experiência na internet. Pela primeira vez, as pessoas podiam navegar na web com tal facilidade através de uma interface gráfica, como se o mundo inteiro tivesse de repente se tornado acessível.

No entanto, a glória é muitas vezes efémera. A Microsoft rapidamente reconheceu a importância dos navegadores e decidiu forçar a inclusão do Internet Explorer no sistema operativo Windows, tornando-o o navegador padrão. Esta estratégia, um verdadeiro "assassino de plataformas", minou diretamente o domínio de mercado da Netscape. Muitos utilizadores não escolheram ativamente o IE; em vez disso, simplesmente o aceitaram como o padrão. Aproveitando as capacidades de distribuição do Windows, o IE rapidamente se tornou o líder da indústria, enquanto a Netscape entrou em declínio.

No meio da adversidade, os engenheiros da Netscape escolheram um caminho radical e idealista — abriram o código-fonte do navegador e convocaram a comunidade de código aberto. Esta decisão foi como uma "abdicação macedônica" no mundo da tecnologia, sinalizando o fim de uma velha era e a ascensão de novas forças. Esse código mais tarde se tornou a base do projeto do navegador Mozilla, inicialmente chamado de Phoenix (simbolizando renascimento), mas após várias disputas de marcas, foi finalmente renomeado para Firefox.

O Firefox não era uma mera cópia do Netscape. Fez avanços na experiência do usuário, ecossistemas de plugins e segurança. Seu nascimento marcou a vitória do espírito de código aberto e injetou nova vitalidade em toda a indústria. Alguns descreveram o Firefox como o "sucessor espiritual" do Netscape, semelhante a como o Império Otomano herdou a glória em declínio de Bizâncio. Embora exagerada, a comparação é significativa.

No entanto, antes de o Firefox ser oficialmente lançado, a Microsoft já havia lançado seis versões do Internet Explorer. Ao aproveitar o seu tempo de lançamento antecipado e a estratégia de empacotamento do sistema, o Firefox ficou em uma posição de recuperação desde o início, garantindo que esta corrida nunca fosse uma competição igual começando a partir da mesma linha.

Ao mesmo tempo, outro jogador inicial entrou silenciosamente em cena. Em 1994, o navegador Opera nasceu na Noruega, inicialmente apenas um projeto experimental. Mas a partir da versão 7.0 em 2003, introduziu seu motor Presto desenvolvido internamente, pioneiro no suporte a CSS, layouts adaptativos, controle por voz e codificação Unicode. Embora sua base de usuários fosse limitada, liderou consistentemente a indústria tecnologicamente, tornando-se o "favorito dos geeks."

Nesse mesmo ano, a Apple lançou o navegador Safari — um ponto de viragem significativo. Na época, a Microsoft tinha investido 150 milhões de dólares numa Apple em dificuldades para manter uma aparência de concorrência e evitar o escrutínio antitruste. Embora o motor de busca padrão do Safari fosse o Google desde o início, esse entrelaçamento com a Microsoft simbolizava as complexas e subtis relações entre os gigantes da internet: cooperação e concorrência, sempre entrelaçadas.

Em 2007, o IE7 foi lançado juntamente com o Windows Vista, mas a resposta do mercado foi morna. O Firefox, por outro lado, aumentou constantemente sua quota de mercado para cerca de 20%, graças a ciclos de atualização mais rápidos, um mecanismo de extensão mais amigável ao usuário e um apelo natural para os desenvolvedores. A dominância do IE começou a afrouxar, e os ventos estavam mudando.

O Google, no entanto, adotou uma abordagem diferente. Embora estivesse a planear o seu próprio navegador desde 2001, levou seis anos a convencer o CEO Eric Schmidt a aprovar o projeto. O Chrome estreou-se em 2008, construído sobre o projeto de código aberto Chromium e o motor WebKit utilizado pelo Safari. Foi zombado como um navegador "inchado", mas com a profunda experiência do Google em publicidade e construção de marcas, subiu rapidamente.

A principal arma do Chrome não eram suas funcionalidades, mas sim seu ciclo de atualizações frequentes (a cada seis semanas) e a experiência unificada entre plataformas. Em novembro de 2011, o Chrome superou o Firefox pela primeira vez, alcançando uma quota de mercado de 27%; seis meses depois, ultrapassou o IE, completando sua transformação de desafiante para líder dominante.

Entretanto, a internet móvel da China estava a formar o seu próprio ecossistema. O UC Browser da Alibaba ganhou popularidade no início da década de 2010, especialmente em mercados emergentes como a Índia, a Indonésia e a China. Com o seu design leve e funcionalidades de compressão de dados que economizavam largura de banda, conquistou utilizadores em dispositivos de gama baixa. Em 2015, a sua quota de mercado global de navegadores móveis excedeu 17%, e na Índia chegou a atingir até 46%. Mas esta vitória não foi duradoura. À medida que o governo indiano apertou as análises de segurança das aplicações chinesas, o UC Browser foi forçado a sair de mercados-chave, perdendo gradualmente a sua antiga glória.

Na década de 2020, a dominância do Chrome estava firmemente estabelecida, com a sua quota de mercado global estabilizada em cerca de 65%. Notavelmente, embora o motor de busca do Google e o navegador Chrome pertençam ambos à Alphabet, do ponto de vista do mercado, eles representam duas hegemonias independentes — o primeiro controlando cerca de 90% do tráfego global de busca, e o último servindo como a "primeira janela" através da qual a maioria dos utilizadores acede à internet.

Para manter esta estrutura de dupla monopólio, o Google não poupou despesas. Em 2022, a Alphabet pagou à Apple aproximadamente 20 mil milhões de dólares apenas para manter o Google como o motor de busca predefinido no Safari. Os analistas apontaram que esta despesa representou cerca de 36% da receita de publicidade de pesquisa que o Google ganhou com o tráfego do Safari. Em outras palavras, o Google estava efetivamente pagando uma "taxa de proteção" para defender o seu fosso.

Mas a maré mudou mais uma vez. Com o surgimento de grandes modelos de linguagem (LLMs), a busca tradicional começou a sentir o impacto. Em 2024, a quota de mercado de busca do Google caiu de 93% para 89%. Embora ainda dominasse, as fissuras começaram a aparecer. Ainda mais disruptivas foram os rumores de que a Apple poderia lançar seu próprio motor de busca alimentado por IA. Se a busca padrão do Safari mudasse para o próprio ecossistema da Apple, isso não só remodelaria o panorama competitivo como também poderia abalar a própria fundação dos lucros da Alphabet. O mercado reagiu rapidamente: o preço das ações da Alphabet caiu de $170 para $140, refletindo não apenas o pânico dos investidores, mas também uma profunda inquietação sobre a direção futura da era de busca.

Da Navigator ao Chrome, dos ideais de código aberto à comercialização impulsionada pela publicidade, dos navegadores leves aos assistentes de busca com IA, a batalha dos navegadores tem sido sempre uma guerra sobre tecnologia, plataformas, conteúdo e controle. O campo de batalha continua a mudar, mas a essência nunca mudou: quem controla o Gate define o futuro.

Aos olhos dos capitalistas de risco, uma terceira guerra dos navegadores está gradualmente a desenrolar-se, impulsionada pelas novas exigências que as pessoas colocam nos motores de busca na era dos LLMs e da IA. Abaixo estão os detalhes de financiamento de alguns projetos bem conhecidos na pista de navegadores de IA.

A Arquitetura Desatualizada dos Navegadores Modernos

Quando se trata da arquitetura do navegador, a estrutura clássica tradicional é mostrada no diagrama abaixo:

1. Cliente — Entrada Front-End

A consulta é enviada via HTTPS para o Google Front End mais próximo, onde são realizadas a decriptação TLS, amostragem de QoS e roteamento geográfico. Se tráfego anormal for detetado (como ataques DDoS ou scraping automatizado), a limitação de taxa ou desafios podem ser aplicados neste nível.

2. Compreensão da Consulta

A interface precisa entender o significado das palavras digitadas pelo usuário. Isso envolve três etapas:

Correção ortográfica neural, como transformar “recpie” em “recipe”.
Expansão de sinônimos, por exemplo, expandindo "como consertar bicicleta" para incluir "reparar bicicleta".
A análise de intenção, que determina se a consulta é informativa, de navegação ou transacional, e em seguida atribui o pedido vertical apropriado.

3. Recuperação de Candidatos

A tecnologia de consulta do Google é conhecida como índice invertido. Em um índice direto, você recupera um arquivo dado o seu ID. Mas como os usuários não podem possivelmente saber os identificadores do conteúdo desejado entre centenas de bilhões de arquivos, o Google utiliza o índice invertido tradicional, que consulta por conteúdo para identificar quais arquivos contêm as palavras-chave correspondentes.

Em seguida, o Google aplica indexação vetorial para lidar com a pesquisa semântica—ou seja, encontrar conteúdo semelhante em significado à consulta. Ele converte texto, imagens e outros conteúdos em vetores de alta dimensão (embeddings), e depois pesquisa com base na similaridade entre esses vetores. Por exemplo, se um usuário pesquisa “como fazer massa de pizza”, o motor de busca pode retornar resultados relacionados a “guia de preparação de massa de pizza”, porque os dois são semanticamente semelhantes.

Através da indexação invertida e da indexação vetorial, aproximadamente na ordem de centenas de milhares de páginas da web são filtradas na fase de triagem inicial.

4. Classificação em Múltiplas Etapas

O sistema normalmente utiliza milhares de recursos leves, como BM25, TF-IDF e pontuações de qualidade de página, para filtrar as centenas de milhares de páginas candidatas até cerca de 1.000, formando um conjunto inicial de candidatos. Esses sistemas são coletivamente chamados de motores de recomendação. Eles baseiam-se em recursos massivos gerados a partir de várias entidades, incluindo comportamento do usuário, atributos da página, intenção da consulta e sinais contextuais. Por exemplo, o Google combina o histórico do usuário, feedback de outros usuários, semântica da página e significado da consulta, enquanto também considera elementos contextuais, como tempo (hora do dia, dia da semana) e eventos externos, como notícias de última hora.

5. Aprendizagem Profunda para Classificação Primária

Na fase inicial de recuperação, o Google utiliza tecnologias como o RankBrain e o Neural Matching para entender a semântica das consultas e filtrar os resultados mais relevantes de grandes coleções de documentos.

O RankBrain, introduzido pelo Google em 2015, é um sistema de aprendizado de máquina projetado para entender melhor o significado das consultas dos usuários, especialmente consultas nunca antes vistas. Ele transforma consultas e documentos em representações vetoriais e calcula sua similaridade para encontrar os resultados mais relevantes. Por exemplo, para a consulta "como fazer massa de pizza", mesmo que nenhum documento contenha uma correspondência exata de palavras-chave, o RankBrain pode identificar conteúdo relacionado a "noções básicas de pizza" ou "preparação da massa."

A Correspondência Neural, lançada em 2018, foi projetada para capturar ainda mais a relação semântica entre consultas e documentos. Usando modelos de redes neurais, identifica relações vagas entre palavras para melhor corresponder consultas com conteúdo da web. Por exemplo, para a consulta "por que o ventilador do meu laptop está tão barulhento", a Correspondência Neural pode entender que o usuário pode estar buscando informações de solução de problemas sobre superaquecimento, acúmulo de poeira ou alta utilização da CPU—mesmo que esses termos não apareçam explicitamente na consulta.

6. Deep Re-Ranking: A Aplicação do BERT

Após a filtragem inicial de documentos relevantes, o Google aplica o BERT (Representações de Codificadores Bidirecionais a partir de Transformadores) para refinar a classificação e garantir que os resultados mais relevantes apareçam no topo. O BERT é um modelo de linguagem pré-treinado baseado em Transformadores que pode entender as relações contextuais das palavras dentro das frases.

Na pesquisa, o BERT é utilizado para reclassificar os documentos recuperados nas fases anteriores. Ele codifica conjuntamente consultas e documentos, calcula suas pontuações de relevância e, em seguida, reorganiza os documentos. Por exemplo, para a consulta "estacionamento em uma colina sem meio-fio", o BERT pode interpretar corretamente o significado de "sem meio-fio" e retornar resultados aconselhando os motoristas a virarem suas rodas em direção à beira da estrada, em vez de interpretar erroneamente como uma situação com meio-fio.

Para os engenheiros de SEO, isso significa que eles devem estudar cuidadosamente os algoritmos de classificação e de recomendação de aprendizado de máquina do Google para otimizar o conteúdo da web de forma direcionada, ganhando assim maior visibilidade nas classificações de pesquisa.

Por que a IA vai remodelar os navegadores

Primeiro, precisamos esclarecer: por que o navegador como uma forma ainda precisa existir? Existe um terceiro paradigma além dos agentes de IA e dos navegadores?

Acreditamos que a existência implica em irreplaceabilidade. Por que a inteligência artificial pode usar navegadores, mas não pode substituí-los completamente? Porque o navegador é uma plataforma universal. Não é apenas um ponto de entrada para ler dados, mas também um ponto de entrada geral para inserir dados. O mundo não pode apenas consumir informações—também deve produzir dados e interagir com websites. Portanto, os navegadores que integram informações personalizadas dos usuários continuarão a existir amplamente.

Aqui está o ponto chave: como um Gateway universal, o navegador não serve apenas para ler dados; os usuários muitas vezes precisam interagir com os dados. O próprio navegador é um excelente repositório para armazenar impressões digitais dos usuários. Comportamentos de usuários mais complexos e ações automatizadas devem ser realizados através do navegador. O navegador pode armazenar todas as impressões digitais comportamentais dos usuários, credenciais e outras informações privadas, permitindo a invocação sem confiança durante a automação. A interação com os dados pode evoluir para este padrão:

Utilizador → chama Agente AI → Navegador.

Em outras palavras, a única parte que pode ser substituída reside na tendência natural do mundo—em direção a uma maior inteligência, personalização e automação. Com certeza, essa parte pode ser gerida por agentes de IA. Mas os próprios agentes de IA não são bem adequados para carregar conteúdo personalizado do usuário, porque enfrentam múltiplos desafios em relação à segurança dos dados e à usabilidade. Especificamente:

O navegador é o repositório de conteúdo personalizado:

A maioria dos grandes modelos está hospedada na nuvem, com contextos de sessão dependentes do armazenamento do servidor, tornando difícil o acesso direto a senhas locais, carteiras, cookies e outros dados sensíveis.
O envio de todos os dados de navegação e pagamento para modelos de terceiros requer uma autorização renovada do usuário; o DMA da UE e as leis de privacidade a nível estadual dos EUA exigem a minimização de dados em várias fronteiras.
O preenchimento automático de códigos de autenticação de dois fatores, a invocação de câmaras ou o uso de GPUs para inferência WebGPU deve ser feito dentro do sandbox do navegador.
O contexto de dados é altamente dependente do navegador. As abas, cookies, IndexedDB, cache do Service Worker, credenciais de passkey e dados de extensões são todos armazenados dentro do navegador.

Mudanças Profundas nas Formas de Interação

Voltando ao tópico do início, nosso comportamento ao usar navegadores pode ser geralmente dividido em três categorias: leitura de dados, entrada de dados e interação com dados. Os grandes modelos de linguagem (LLMs) já mudaram profundamente a eficiência e os métodos pelos quais lemos dados. A antiga prática de os usuários pesquisarem páginas da web através de palavras-chave agora parece ultrapassada e ineficiente.

Quando se trata da evolução do comportamento de pesquisa dos utilizadores—seja o objetivo obter respostas resumidas ou clicar em páginas da web—muitos estudos já analisaram essa mudança.

Em termos de padrões de comportamento dos utilizadores, um estudo de 2024 mostrou que nos EUA, de cada 1.000 buscas no Google, apenas 374 resultaram em um clique em uma página da web. Em outras palavras, quase 63% foram comportamentos de "zero cliques". Os utilizadores acostumaram-se a obter informações como clima, taxas de câmbio e cartões de conhecimento diretamente da página de resultados de busca.

O que poderia realmente desencadear uma transformação massiva dos navegadores, no entanto, é a camada de interação de dados. No passado, as pessoas interagiam com os navegadores principalmente inserindo palavras-chave—o nível máximo de compreensão que o próprio navegador poderia lidar. Agora, os usuários preferem cada vez mais usar linguagem natural completa para descrever tarefas complexas, como:

“Encontre-me voos diretos de Nova Iorque para Los Angeles durante um determinado período.”
“Encontre-me um voo de Nova Iorque para Xangai e depois para Los Angeles.”

Mesmo para os humanos, essas tarefas exigem muito tempo para visitar vários sites, reunir informações e comparar resultados. Mas essas Tarefas Agenticas estão gradualmente sendo assumidas por agentes de IA.

Isto também está alinhado com a trajetória da história: automação e inteligência. As pessoas desejam libertar as suas mãos, e os agentes de IA estarão inevitavelmente profundamente integrados nos navegadores. Os navegadores do futuro devem ser concebidos tendo em mente a automação total, especialmente considerando:

Como equilibrar a experiência de leitura para humanos com a interpretabilidade de máquina para agentes de IA.
Como garantir que uma única página da web atenda tanto o usuário final quanto o modelo de agente.

Só ao cumprir ambos os requisitos de design é que os navegadores podem realmente tornar-se portadores estáveis para os agentes de IA executarem tarefas.

A seguir, vamos nos concentrar em cinco projetos proeminentes—Browser Use, Arc (The Browser Company), Perplexity, Brave e Donut. Esses projetos representam direções futuras para a evolução dos navegadores de IA, bem como seu potencial para integração nativa dentro de contextos Web3 e cripto.

Do ponto de vista da psicologia do usuário, uma pesquisa de 2023 mostrou que 44% dos entrevistados consideravam os resultados orgânicos regulares mais confiáveis do que os trechos em destaque. Pesquisas acadêmicas também descobriram que, em casos de controvérsia ou falta de uma única verdade autoritativa, os usuários preferem páginas de resultados que contêm links de várias fontes.

Em outras palavras, enquanto uma parte dos usuários não confia totalmente em resumos gerados por IA, uma porcentagem significativa do comportamento já mudou para "zero-clique". Portanto, os navegadores de IA ainda precisam explorar o paradigma de interação certo—especialmente na área de leitura de dados. Como o problema da alucinação em grandes modelos ainda não foi totalmente resolvido, muitos usuários ainda lutam para confiar completamente em resumos de conteúdo gerados automaticamente. Nesse sentido, incorporar grandes modelos nos navegadores não requer necessariamente uma transformação disruptiva. Em vez disso, requer simplesmente melhorias incrementais em precisão e controlabilidade—um processo que já está em andamento.

Uso do Navegador

Esta é precisamente a lógica central por trás do enorme financiamento recebido pela Perplexity e pelo Browser Use. Em particular, o Browser Use emergiu como a segunda oportunidade de inovação mais promissora para o início de 2025, com tanto certeza quanto um forte potencial de crescimento.

O uso do navegador construiu uma verdadeira camada semântica, com seu foco central na criação de uma arquitetura de reconhecimento semântico para a próxima geração de navegadores.

O Browser Use reinterpretou o tradicional “DOM = uma árvore de nós para humanos verem” em um “DOM Semântico = uma árvore de instruções para LLMs lerem.” Isso permite que os agentes cliquem, preencham e façam uploads com precisão, sem depender de “coordenadas de pixel.” Em vez de usar OCR visual ou Selenium baseado em coordenadas, esta abordagem segue a rota de “texto estruturado → chamadas de função,” tornando a execução mais rápida, economizando tokens e reduzindo erros. O TechCrunch descreveu como “a camada de cola que permite que a IA realmente compreenda páginas da web.” Em março, o Browser Use fechou uma rodada de investimento semente de 17 milhões de dólares, apostando nessa inovação fundamental.

Aqui está como funciona:

Após o HTML ser renderizado, forma uma árvore DOM padrão. O navegador então deriva uma árvore de acessibilidade, que fornece rótulos de "papéis" e "estados" mais ricos para leitores de tela.

Cada elemento interativo (botão, entrada, etc.) é abstraído em um trecho JSON com metadados, como função, visibilidade, coordenadas e ações executáveis.
A página inteira é traduzida em uma lista achatada de nós semânticos, que o LLM pode ler em um único prompt do sistema.
A LLM produz instruções de alto nível (por exemplo, clique(node_id="btn-Checkout")), que são então reproduzidas no navegador real.

O blog oficial descreve este processo como "transformar interfaces de websites em texto estruturado que os LLMs podem analisar."

Além disso, se este padrão for adotado pelo W3C, poderá resolver significativamente o problema de entrada nos navegadores. Em seguida, analisaremos a carta aberta e os estudos de caso da The Browser Company para explicar melhor por que a sua abordagem é falha.

Arco

A empresa Browser Company (a empresa mãe do Arc) declarou em sua carta aberta que o navegador Arc entrará em modo de manutenção regular, enquanto a equipe mudará seu foco para o desenvolvimento do DIA, um navegador totalmente orientado para a IA. Na carta, eles também admitiram que o caminho específico de implementação para o DIA ainda não foi determinado. Ao mesmo tempo, a equipe delineou várias previsões sobre o futuro do mercado de navegadores.

Com base nessas previsões, acreditamos ainda que, se o atual panorama dos navegadores for realmente perturbado, a chave está em mudar o lado de saída da interação.

Abaixo estão três das previsões sobre o futuro do mercado de navegadores compartilhadas pela equipe da Arc.

https://browsercompany.substack.com/p/letter-to-arc-members-2025

Em primeiro lugar, a equipe da Arc acredita que as páginas da web já não serão a principal interface para interação. Admitidamente, esta é uma afirmação ousada e desafiadora, e é também a principal razão pela qual permanecemos céticos em relação às reflexões do seu fundador. Na nossa opinião, esta perspetiva subestima significativamente o papel do navegador, e destaca a questão chave que a equipe negligenciou ao explorar o caminho do navegador de IA.

Modelos grandes realizam excelentemente a captura de intenção—por exemplo, entender instruções como “ajuda-me a reservar um voo.” No entanto, permanecem insuficientes quando se trata de transportar densidade de informação. Quando um utilizador precisa de algo como um painel, um caderno ao estilo Bloomberg Terminal, ou uma tela visual como o Figma, nada pode superar uma página da web finamente ajustada com precisão a nível de pixel. A ergonomia de cada produto—gráficos, funcionalidade de arrastar e soltar, teclas de atalho—não é uma decoração superficial, mas concessões essenciais que comprimem a cognição. Estas capacidades não podem ser replicadas por simples interações conversacionais. Tomando o Gate.com como exemplo: se um utilizador quiser executar uma ação de investimento, contar apenas com a conversa de IA está longe de ser suficiente, uma vez que os utilizadores dependem fortemente de entrada estruturada, precisão e apresentação clara da informação.

O roteiro da equipe Arc contém uma falha fundamental: não consegue distinguir claramente que "interação" é composta por duas dimensões - entrada e saída. No lado da entrada, a sua visão possui alguma validade em certos cenários, uma vez que a IA pode realmente melhorar a eficiência das interações do tipo comando. Mas, no lado da saída, a sua suposição é claramente desequilibrada, ignorando o papel central do navegador na apresentação de informações e experiências personalizadas. Por exemplo, o Reddit tem seu próprio layout e arquitetura de informações únicos, enquanto o AAVE possui uma interface e estrutura completamente diferentes. Como uma plataforma que simultaneamente armazena dados altamente privados e apresenta interfaces de produtos diversas, o navegador tem uma substitutibilidade limitada no lado da entrada, enquanto sua complexidade e natureza não padronizada no lado da saída tornam ainda mais difícil a disrupção.

Por outro lado, os navegadores de IA atuais concentram-se principalmente na camada de "resumo de saída": resumindo páginas, extraindo informações, gerando conclusões. Isso não é suficiente para representar um desafio fundamental aos navegadores ou sistemas de busca convencionais, como o Google — apenas reduz a quota de mercado para resumos de busca.

Portanto, a única tecnologia que poderia realmente abalar a participação de mercado de 66% do Chrome está destinada a não ser "o próximo Chrome." Para alcançar uma verdadeira disrupção, o modelo de renderização dos navegadores deve ser fundamentalmente reestruturado para se adaptar às necessidades de interação da era do Agente de IA, especialmente em termos de design da arquitetura do lado de entrada. É por isso que achamos o caminho técnico tomado pelo Browser Use muito mais convincente - ele foca em mudanças estruturais no mecanismo subjacente dos navegadores. Uma vez que qualquer sistema atinge um design "atômico" ou "modular", a programabilidade e a composibilidade derivadas disso desbloqueiam um potencial disruptivo. Esta é exatamente a direção que o Browser Use está perseguindo hoje.

Em resumo, a operação dos agentes de IA ainda depende fortemente da existência de browsers. Os browsers não são apenas os principais repositórios para dados personalizados complexos, mas também as interfaces de renderização universais para diversas aplicações, e assim continuarão a servir como o núcleo do Gateway para interação no futuro. À medida que os agentes de IA se tornam profundamente integrados nos browsers para completar tarefas fixas, eles interagirão com os dados dos usuários e aplicações específicas principalmente através do lado de entrada. Por esta razão, o modelo de renderização atual dos browsers deve ser inovado para alcançar a máxima compatibilidade e adaptabilidade com os agentes de IA—permitindo, em última análise, que eles capturem aplicações de forma mais eficaz.

Perplexidade

A Perplexity é um motor de busca de IA renomado pelo seu sistema de recomendações. A sua última avaliação disparou para 14 mil milhões de dólares, quase um aumento de cinco vezes em relação aos 3 mil milhões de dólares em junho de 2024. Atualmente, processa mais de 400 milhões de consultas de busca por mês. Apenas em setembro de 2024, processou cerca de 250 milhões de consultas, marcando um aumento de oito vezes ano após ano no volume de buscas dos utilizadores, com mais de 30 milhões de utilizadores ativos mensais.

A sua principal característica é a capacidade de resumir páginas em tempo real, conferindo-lhe uma forte vantagem no acesso a informações atualizadas. No início deste ano, a Perplexity começou a construir o seu próprio navegador nativo, Comet. A empresa descreve o Comet como um navegador que não apenas "exibe" páginas da web, mas também "pensa" sobre elas. Oficialmente, afirmam que ele integrará o motor de respostas da Perplexity profundamente dentro do próprio navegador, seguindo uma abordagem de "máquina inteira" que lembra a filosofia de Steve Jobs: integrar profundamente tarefas de IA ao nível fundamental do navegador, em vez de apenas construir plugins na barra lateral.

Com respostas concisas apoiadas por citações, o Comet visa substituir os tradicionais "dez links azuis" e competir diretamente com o Chrome.

Mas a Perplexity ainda precisa resolver dois problemas centrais: altos custos de busca e baixas margens de lucro dos usuários marginais. Embora a Perplexity atualmente lidere no campo da busca por IA, o Google anunciou na sua conferência I/O de 2025 uma reforma inteligente em grande escala dos seus produtos principais. Para navegadores, o Google lançou uma nova experiência de aba do navegador chamada AI Model, que integra Visão Geral, Pesquisa Profunda e futuras capacidades Agentic. Toda a iniciativa é referida como "Project Mariner."

O Google está a avançar ativamente na sua transformação em IA, o que significa que a imitação superficial de funcionalidades—como Visão Geral, Pesquisa Profunda ou Agentes—dificilmente representará uma verdadeira ameaça. O que poderia realmente estabelecer uma nova ordem em meio ao caos é a reconstrução da arquitetura do navegador desde a base, incorporando profundamente modelos de linguagem de grande dimensão (LLMs) no núcleo do navegador e transformando fundamentalmente os métodos de interação.

Brave

Brave é um dos navegadores mais antigos e bem-sucedidos dentro da indústria cripto. Construído na arquitetura Chromium, é compatível com extensões da Google Store. Brave atrai usuários com um modelo baseado na privacidade e na obtenção de tokens através da navegação. Seu caminho de desenvolvimento demonstra um certo potencial de crescimento. No entanto, do ponto de vista do produto, embora a privacidade seja realmente importante, a demanda continua concentrada em grupos de usuários específicos. Para o público mais amplo, a conscientização sobre privacidade ainda não se tornou um fator de decisão mainstream. Portanto, tentar depender apenas desta característica para desestabilizar gigantes existentes provavelmente não terá sucesso.

Atualmente, o Brave alcançou 82,7 milhões de utilizadores ativos mensais (MAU) e 35,6 milhões de utilizadores ativos diários (DAU), detendo uma quota de mercado de cerca de 1%–1,5%. A sua base de utilizadores tem mostrado um crescimento constante: de 6 milhões em julho de 2019, para 25 milhões em janeiro de 2021, para 57 milhões em janeiro de 2023, e em fevereiro de 2025, superou os 82 milhões. A sua taxa de crescimento anual composta continua na casa dos dígitos duplos.

O Brave processa aproximadamente 1,34 mil milhões de pesquisas por mês, o que representa cerca de 0,3% do volume do Google.

A Brave está a planear fazer um upgrade para um navegador de IA focado na privacidade. No entanto, o seu acesso limitado a dados de utilizadores reduz o nível de personalização possível para grandes modelos, o que por sua vez dificulta uma iteração rápida e precisa do produto. Na próxima era do Navegador Agentic, a Brave pode manter uma quota estável entre grupos específicos de utilizadores focados na privacidade, mas será difícil tornar-se um jogador dominante. O seu assistente de IA, Leo, funciona mais como uma melhoria de plugin—oferecendo algumas capacidades de resumo de conteúdo, mas sem uma estratégia clara para uma mudança total em direção a agentes de IA. A inovação na interação continua a ser insuficiente.

Donut

Recentemente, a indústria cripto também fez progressos no campo dos Navegadores Agentes. O projeto em estágio inicial Donut arrecadou $7 milhões em uma rodada pré-seed, liderada pela Hongshan (Sequoia China), HackVC e Bitkraft Ventures. O projeto ainda está em sua fase conceitual inicial, com a visão de alcançar “Descoberta – Tomada de Decisão – e Execução Nativa de Cripto” como uma capacidade integrada.

A direção principal é combinar caminhos de execução automatizada nativos de cripto. Como a a16z previu, os agentes podem substituir os motores de busca como o principal Gateway de tráfego no futuro. Os empreendedores não competirão mais em torno dos algoritmos de classificação do Google, mas sim lutarão pelo tráfego e conversões que vêm da execução de agentes. A indústria já nomeou essa tendência de “AEO” (Otimização de Respostas / Motores de Agentes), ou ainda mais, “ATF” (Cumprimento de Tarefas Agenciais)—onde o objetivo já não é otimizar as classificações de busca, mas servir diretamente modelos inteligentes que podem completar tarefas para os usuários, como fazer pedidos, reservar bilhetes ou escrever cartas.

Para Empreendedores

Primeiro, deve-se reconhecer: o navegador em si continua a ser o maior "Gateway" não reconstruído no mundo da internet. Com cerca de 2,1 bilhões de usuários de desktop e mais de 4,3 bilhões de usuários móveis em todo o mundo, ele serve como o transportador comum para a entrada de dados, comportamento interativo e armazenamento de impressões digitais personalizadas. A razão para sua persistência não é inércia, mas a natureza dual inerente ao navegador: é tanto o ponto de entrada para a leitura de dados quanto o ponto de saída para ações de escrita.

Portanto, para os empreendedores, o verdadeiro potencial disruptivo não reside na otimização da camada de "saída da página". Mesmo que se pudesse replicar funções de visão geral de IA semelhantes às do Google em uma nova aba, isso ainda seria apenas uma iteração na camada de plugin, não uma mudança de paradigma fundamental. A verdadeira inovação reside no "lado de entrada" — como fazer com que agentes de IA chamem ativamente o seu produto para completar tarefas específicas. Isso determinará se um produto pode se integrar ao ecossistema de agentes, capturar tráfego e compartilhar na distribuição de valor.

Na era da busca, a competição era sobre cliques; na era do agente, é sobre chamadas.

Se você é um empreendedor, deve reimaginar seu produto como um componente de API—algo que um agente inteligente não apenas possa entender, mas também invocar. Isso exige que você considere três dimensões desde o início do design do produto:

1. Normalização da Estrutura da Interface: O seu produto é chamável?

A capacidade de um agente invocar um produto depende de saber se a sua estrutura de informação pode ser padronizada e abstraída em um esquema claro. Por exemplo, ações-chave como registro de usuário, colocação de pedidos ou envio de comentários podem ser descritas através de uma estrutura DOM semântica ou mapeamento JSON? O sistema fornece uma máquina de estados para que o agente possa replicar de forma confiável os fluxos de trabalho do usuário? As interações do usuário na página podem ser scriptadas? O produto oferece webhooks ou endpoints de API estáveis?

É precisamente por isso que o Browser Use conseguiu angariar fundos—ele transformou o navegador de um renderizador HTML plano em uma árvore semântica chamável por LLMs. Para os empreendedores, adotar uma filosofia de design semelhante em produtos web significa preparar-se para uma adaptação estruturada na era dos agentes de IA.

2. Identidade e Acesso: Pode ajudar os agentes a "ultrapassar a barreira de confiança"?

Para que os agentes completem transações ou chamem funções de pagamento e ativos, eles necessitam de um intermediário de confiança—poderia você se tornar esse intermediário? Os navegadores têm naturalmente a capacidade de ler o armazenamento local, acessar carteiras, lidar com CAPTCHAs e integrar a autenticação de dois fatores. Isso os torna mais adequados do que modelos hospedados na nuvem para executar tarefas. Isso é especialmente verdadeiro no Web3, onde as interfaces de interação com ativos não são padronizadas. Sem “identidade” ou “capacidade de assinatura”, um agente não pode avançar.

Para os empreendedores de criptomoedas, isso abre um espaço altamente imaginativo: o “MCP (Plataforma de Múltiplas Capacidades) do mundo blockchain.” Isso pode assumir a forma de uma camada de comando universal (permitindo que agentes chamem Dapps), um conjunto de interface de contrato padronizado, ou até mesmo uma carteira local leve + hub de identidade.

3. Repensando os Mecanismos de Tráfego: O futuro não é SEO, mas AEO / ATF.

No passado, era necessário vencer o algoritmo do Google; agora precisa estar integrado nas cadeias de tarefas dos agentes de IA. Isso significa que o seu produto deve ter uma granularidade de tarefas clara: não uma "página", mas uma série de unidades de capacidade chamáveis. Também significa começar a otimizar para a Otimização do Motor de Agentes (AEO) ou adaptar-se ao Cumprimento de Tarefas Agênticas (ATF). Por exemplo, o processo de registro pode ser simplificado em passos estruturados? O preço pode ser obtido através de uma API? O inventário está acessível em tempo real?

Você pode até precisar se adaptar a diferentes sintaxes de chamada entre as estruturas de LLM—já que OpenAI e Claude, por exemplo, têm preferências diferentes para chamadas de função e uso de ferramentas. O Chrome é o terminal do velho mundo, não o Gate para o novo. Os projetos do futuro não irão reconstruir navegadores, mas sim fazer com que os navegadores sirvam agentes—construindo pontes para a nova geração de “fluxos de instrução.”

O que você precisa construir é a "linguagem de interface" através da qual os agentes chamam o seu mundo.
O que você precisa ganhar é um lugar na cadeia de confiança dos sistemas inteligentes.
O que você precisa construir é um "castelo API" no próximo paradigma de busca.

Se o Web2 capturou a atenção do utilizador através da interface do utilizador, então a era do Web3 + Agente de IA capturará a intenção de execução do agente através de cadeias de chamadas.

Aviso Legal

Este conteúdo não constitui uma oferta, solicitação ou recomendação. Você deve sempre buscar aconselhamento profissional independente antes de tomar qualquer decisão de investimento. Observe que o Gate e/ou Gate Ventures podem restringir ou proibir alguns ou todos os serviços em regiões restritas. Por favor, leia o contrato de usuário aplicável para mais detalhes.

Sobre Gate Ventures

Gate Ventures é o braço de capital de risco da Gate, focando em investimentos em infraestrutura descentralizada, ecossistemas e aplicações—tecnologias que irão remodelar o mundo na era Web 3.0. A Gate Ventures trabalha com líderes da indústria global para capacitar equipas e startups com pensamento inovador e capacidades para redefinir a forma como a sociedade e as finanças interagem.

Website: https://www.gate.com/ventures

* As informações não se destinam a ser e não constituem aconselhamento financeiro ou qualquer outra recomendação de qualquer tipo oferecido ou endossado pela Gate.

Partilhar

Conteúdos

Gate Ventures Research Insights: A Terceira Guerra dos Navegadores: A Batalha de Entrada na Era dos Agentes de IA

TL;DR

Uma Breve História do Desenvolvimento de Browsers

A Arquitetura Desatualizada dos Navegadores Modernos

1. Cliente — Entrada Front-End

2. Compreensão da Consulta

3. Recuperação de Candidatos

4. Classificação em Múltiplas Etapas

5. Aprendizagem Profunda para Classificação Primária

6. Deep Re-Ranking: A Aplicação do BERT

Por que a IA vai remodelar os navegadores

Mudanças Profundas nas Formas de Interação

Uso do Navegador

Arco

Perplexidade

Brave

Donut

Para Empreendedores

1. Normalização da Estrutura da Interface: O seu produto é chamável?

2. Identidade e Acesso: Pode ajudar os agentes a "ultrapassar a barreira de confiança"?

3. Repensando os Mecanismos de Tráfego: O futuro não é SEO, mas AEO / ATF.

Aviso Legal

Sobre Gate Ventures

TL;DR

Uma Breve História do Desenvolvimento de Navegadores

A Arquitetura Desatualizada dos Navegadores Modernos

Por que a IA irá remodelar os navegadores

Mudanças Profundas nas Formas de Interação

Uso do Navegador

Arco

Perplexidade

Brave

Donut

Para Empreendedores

Isenção de responsabilidade

Sobre a Gate Ventures