Percebi algo interessante na estratégia da NVIDIA neste momento. Na semana passada, Jensen Huang explicou em detalhes por que a NVIDIA investiu 20 bilhões de dólares para adquirir a Groq, e honestamente, é uma decisão estratégica brilhante que mostra como o mercado de inferência está se transformando.



Então, aqui está o contexto: por muito tempo, todo mundo se concentrou em uma única métrica - a taxa de transferência. Mas a Groq entendeu algo que os outros perderam. Os engenheiros de software agora estão dispostos a pagar mais por respostas mais rápidas. É uma segmentação de mercado completamente nova. Como Huang disse, se pudermos oferecer tokens com uma latência ultra-baixa, tornando os desenvolvedores mais produtivos, eles vão pagar por isso. É um mercado que acaba de surgir.

E é aí que a Groq entra em cena. Essa aquisição preenche uma lacuna importante no arsenal de inferência da NVIDIA. Enquanto a NVIDIA domina o segmento de alta taxa de transferência com suas soluções tradicionais, a Groq traz algo completamente diferente: uma arquitetura LPU conhecida por sua latência determinística excepcionalmente baixa. Em março, na GTC, a NVIDIA apresentou o Groq 3 LPU, fabricado em 4 nm pela Samsung. Os números são impressionantes - 35 vezes mais inferência por megawatt em modelos de 1 trilhão de parâmetros em comparação ao Blackwell NVL72.

É basicamente uma extensão da curva de Pareto do mercado. Em vez de escolher entre alta taxa de transferência ou baixa latência, a NVIDIA agora cria dois segmentos distintos. A Groq continua operando como uma entidade independente, Jonathan Ross e sua equipe se juntaram à NVIDIA. O próprio modelo pode ser tarifado de forma diferente dependendo do tempo de resposta - menos taxa, mas o preço unitário compensa amplamente. É puro gênio comercial, e isso mostra como o mercado de IA está se tornando mais sofisticado. As duas abordagens coexistirão, e os clientes escolherão com base em suas necessidades reais.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar