Aparentemente, a Nvidia visitou discretamente empresas de equipamentos elétricos coreanas, pedindo-lhes que redesenhassem a infraestrutura de centros de dados em torno de uma arquitetura de 800V DC.
Isso é uma admissão de que o modelo de IA centralizado atingiu uma parede física, e que cada nova geração de chips agora exige uma retrofit de subestação em algum lugar na cadeia.
Os centros de dados globais já operam com uma utilização de 12 a 18 por cento.
Fazendas de mineração de criptomoedas têm GPUs poderosas paradas, desde a fusão do Ethereum.
Sistemas de jogos para consumidores com 4

ETH-2,74%

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

torygreen

04-21 22:17

muitas pessoas ainda estão arquitetando em torno de uma dependência de computação que saiu de cena
qwen3 32b, por exemplo, está ao vivo em GPUs comunitárias distribuídas neste momento, paralelismo de pipeline rodando entre nós sem que um único operador controle, inferência sem permissão pela internet aberta
três camadas, todas abertas: pesos abertos (Alibaba os lançou), computação sem permissão (hardware comunitário, sem custódia), transporte aberto (sem cluster privado, sem porta de API). propriedade não se aplica a nenhuma delas
o modelo mental de que inferência compatível com frontier

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

torygreen

04-20 22:36

a próxima semana começa o google cloud next e cada touro de hyperscaler está prestes a comemorar o movimento exato que historicamente mata a margem que eles estão longos
antes: o google pagou à nvidia uma margem sobre cada h100. margem fluindo para santa clara.
agora: o google está em negociações com a marvell sobre silício personalizado mais uma nova variante de TPU específica para inferência. o capex está se movendo internamente.
a amazon fez isso com graviton em 2018. a microsoft anunciou a maia em 2023. cada vez que o hyperscaler deixou de pagar a margem ao seu fornecedor porque a margem s

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

torygreen

04-19 23:12

ainda estamos discutindo quantos data centers construir, enquanto a oferta já está estacionada em cada entrada de garagem
a resposta ao desenvolvimento é planejar campus de 50 acres em ciclos de construção de vários anos
trilhões de agentes transacionam continuamente, 24/7, contra sensores físicos, máquinas e uns aos outros
penso no PC de jogos 4090 parado às 2 da manhã, no chip Apple M fechado numa secretária, no Tesla estacionado desde quinta-feira, e as contas começam a parecer diferentes
isso é computação obscura, oferta não explorada que o usuário já pagou, estacionada na borda,

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

torygreen

04-18 18:08

A avaliação do Figma sofreu um impacto porque a Anthropic tweetou uma página de destino.
> O que mudou: o nome da marca e as vibrações.
> O que não mudou: o modelo subjacente, o preço da API, a qualidade da saída ou como a sua equipe de design realmente trabalha amanhã.
O mercado acabou de passar o fim de semana tendo um ataque de pânico completo sobre marketing, não tecnologia.

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

torygreen

04-17 22:23

Aqui está algo interessante que encontrei: 33% dos centros de dados planejados nos EUA estão realmente a ser enviados neste momento.
> Os outros 67%: atrasados ou cancelados de imediato
> Meta a construir 10 usinas de gás só para alimentar uma instalação
> A China duplicou a sua capacidade de computação de IA em 2 meses sem um único chip dos EUA
> +220% de procura de energia projetada para 2030, com uma fila de licenças que se move em anos
O obstáculo é físico. licenças, filas de interligação de energia, prazos de construção.
Os costuradores que agregam computação distribuída atrav

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

torygreen

04-14 19:49

Dario precisa que o mythos seja uma fosso
Os laboratórios fecham lacunas de capacidade com mais computação, melhor pós-treinamento e ciclos de avaliação mais rápidos
Modelos de peso aberto como llama, qwen e deepseek ENTREGAM capacidades comparáveis às de modelos fechados alguns meses depois, como downloads gratuitos
Para si, isso significa um modelo melhor a cada trimestre e nenhum laboratório tentando persuadi-lo a aderir aos seus planos máximos
O fosso é o cálculo descentralizado onde milhares de GPUs funcionam como um supercomputador na Singapura, nos EUA, na Noruega, etc
O argumento do Da

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

torygreen

04-12 19:57

Estás a pagar à OpenAI $20 por uma passagem rápida e a @Meta acabou de lançar 1 modelo que fez os últimos 12 modelos da OpenAI parecerem correções de bugs
A OpenAI lançou mensalmente, anunciando cada atualização e publicando cada benchmark
O Muse Spark da Meta foi lançado ao vivo e atingiu pontuações de avaliação que a maioria das pessoas não achava que a Meta pudesse alcançar
Pior na estreia, silencioso durante meses, depois uma única versão parou todos em seu caminho... confundiste silêncio com fracasso e lançamentos mensais com progresso
Os doze registos de alterações do Sam tornaram-se do

Ver original

2 gostos

Recompensa
2
Comentar
Republicar
Partilhar

torygreen

04-11 22:54

o laboratório individual mais forte já não consegue mais segurar a fronteira sozinho.
a lacuna de valor é o mercado a admiti-lo, e os fundadores que ainda leem benchmarks de modelos estão lendo a página errada.
o prémio privado de valor da Anthropic é o mercado a precificar a margem de manobra.
o delta mede qual laboratório está menos preso à estrutura de custos subjacente a ambos.
a infraestrutura de computação é a camada de sistemas: a diferença entre o que os laboratórios de fronteira pagam pelo tempo H100 e o que o mercado agregado de centros de dados mantém ocioso é o piso que nen

Ver original

2 gostos

Recompensa
2
Comentar
Republicar
Partilhar

torygreen

04-10 21:24

As pessoas ainda pensam que programar é o trabalho.
Não é.
Código era apenas a interface que usávamos para expressar soluções. Era o gargalo, não o valor.
A IA remove esse gargalo.
Agora a restrição muda:
- Consegue definir o problema claramente?
- Consegue decompor em partes solucionáveis?
- Consegue verificar se a saída está realmente correta?
Percebi que os engenheiros que têm dificuldades com IA são aqueles que vinculavam sua identidade à velocidade de digitação ou à memória de sintaxe.
Isso nunca foi o recurso escasso.
Definição do problema é.
Verificação é.
Gosto

Ver original

1 gostos

Recompensa
1
Comentar
Republicar
Partilhar

torygreen

04-07 21:36

claude mythos revelou milhares de zero-days porque tem uma coisa que a sua equipa de segurança não tem:
nenhuma participação na precisão do código
ele lê bases de código inteiras de forma fria. não entende a política da sua organização, a pressão de prazos ou os egos envolvidos na implementação
o modelo não tem motivo para ignorar as partes difíceis "humanas"... por isso, é pior ao fazer briefings a um CISO, mas imbatível naquilo que realmente encontra bugs
a Anthropic bloqueou-o porque um modelo acabou de dar a cada base de código a sua primeira auditoria honesta
a sua equipa de resposta rápi

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

torygreen

04-06 20:06

Sam Altman é a última pessoa que deveria estar a escrever a regulamentação de IA e sabe disso.
Sam pediu um "novo contrato social" entre as empresas de IA e a sociedade, enquanto a sua empresa lança o gpt-5.4, o3, e agentes de classe operador a um ritmo que nenhuma legislação na Terra consegue acompanhar.
a aws não pode descentralizar sem canibalizar as suas próprias margens, e toda a "estrutura de autorregulação" na história da tecnologia terminou com as mesmas poucas entidades a escrever as regras que concordaram em seguir.
se estás a executar o teu modelo na aws ou azure, estás a uma

Ver original

1 gostos

Recompensa
1
Comentar
Republicar
Partilhar

torygreen

04-05 20:30

a proposta de "iterações infinitas" assume computação infinita.
cada chamada custa dinheiro, passa pela infraestrutura de alguém, e consome tokens, quer o resultado seja brilhante ou lixo.
a iteração só é barata se já souberes exatamente o que procuras.
> alguém com 10 anos de bom gosto acumulado faz 3 iterações e lança a versão final.
> alguém sem esse conhecimento faz 300 e ainda assim não consegue distinguir qual é boa.
e ninguém considerou isto ainda:
quanto mais saídas de IA, mais verificação humana precisas, então 10x os rascunhos significam 10x as pessoas a verificá-los.
... exceto pela

Ver original

2 gostos

Recompensa
2
Comentar
Republicar
Partilhar

torygreen

04-04 20:33

chamar o encerramento do openclaw da anthropic de um rugo é a coisa mais honesta que a comunidade de construtores de IA disse sobre si mesma em meses
o arnês do openclaw permitia que utilizadores intensivos executassem de $1k a $5k por dia de computação num plano de $200/mês
uma decisão de produto, e quem construiu a sua estrutura de custos em torno dessa diferença foi reprecificado da noite para o dia
o fornecedor controla o medidor... anthropic, openai, quem quer que seja
não tens lugar à mesa quando o modelo de preços muda
não és enganado pelo teu martelo, és enganado por um senho

Ver original

1 gostos

Recompensa
1
Comentar
Republicar
Partilhar

torygreen

04-03 19:32

sam construiu a openai com UMA suposição
executar o seu próprio modelo seria sempre demasiado caro
llama e mistral estão arruinando a sua tese e ameaçando o seu modelo de negócio
sam consegue ver isso, lê os mesmos tópicos de leaks que tu estás a ler... e ainda assim não consegue reestruturar
no momento em que a openai abre os pesos, eles matam a barreira que justifica a avaliação e qualquer um pode fazer inferência localmente sem chamada à API, sem assinatura, sem evento de receita para a openai
cada fork e ajuste fino é um cliente a menos a pagar as margens do sam

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

torygreen

04-02 21:22

Sam Altman levantou $122b e ninguém quer comprar $600m dele
$600m em ações da OpenAI sentadas no mercado secundário sem ofertas
> bancos isentando taxas apenas para mover a oferta
> vendedores competindo pelo preço para sair
Os mercados primários são controlados por alocação: os investidores de risco são chamados às rodadas quando a tabela de capital está limpa
mas os mercados secundários funcionam com demanda voluntária: ninguém é obrigado a manter ou a fazer ofertas
Anthropic superou a sua última avaliação de rodada, enquanto a OpenAI não consegue ultrapassar um teto de $600m

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

torygreen

04-02 15:05

a sua conta de cloud está prestes a disparar e você não mudou uma única linha de código
claude escreve código, abre aplicações, encontra bugs, corrige-os, lança. sem intervenção humana
cada agente autónomo é uma sessão GPU permanente
> desenvolvedores humanos trabalham 8h/dia. agentes trabalham 24h
> 10M de desenvolvedores x 24/7 = 240M de horas de GPU por dia que ninguém planejou
sam está a levantar trilhões para data centers que levam 3 anos a construir. eles estarão cheios antes de terminarem

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

torygreen

04-01 19:55

O $1T IPO do Sam é o caso mais forte para computação descentralizada, mas ele ainda não percebeu
Wall Street está a precificar a inteligência como campos de petróleo. custos fixos massivos, aluguer a longo prazo para cada chamada de API
esse modelo só funciona enquanto o controlo permanecer centralizado para computação, pesos do modelo, acesso e preços
mas a inteligência está a começar a comportar-se como uma utilidade, e as utilidades historicamente não permanecem fechadas:
> a procura por computação a crescer mais rápido que a oferta
> GPUs ociosas a ficar sem uso globalmente
> latência a ap

Ver original

2 gostos

Recompensa
2
Comentar
Republicar
Partilhar

torygreen

03-26 17:25

@WatcherGuru a parte que gostarias de ignorar é quem a controla
se 4 empresas geram 99% desse conteúdo, tens um monopólio da realidade
a inteligência em escala torna-se ou sem permissões… ou é “curada” para ti
e a maioria das pessoas não perceberá a diferença até ser tarde demais

Ver original

1 gostos

Recompensa
1
Comentar
Republicar
Partilhar

Tópicos em destaque
Ver mais
#
Gate13thAnniversaryLive
1.21M Popularidade
#
WCTCTradingChallengeShare8MUSDT
796.51K Popularidade
#
BitcoinBouncesBack
212.51K Popularidade
#
IsraelStrikesIranBTCPlunges
30.66K Popularidade
#
EthereumMemeSeasonReturns
2M Popularidade

Fixar

Torygreen

Tópicos em destaque

Gate13thAnniversaryLive

WCTCTradingChallengeShare8MUSDT

BitcoinBouncesBack

IsraelStrikesIranBTCPlunges

EthereumMemeSeasonReturns

Fixar