torygreen

vip
Idade 2.8 Ano
Nível máximo 0
Ainda não há conteúdo
Em teoria, os custos de IA já deveriam ter despencado.
A mesma tarefa de nível avançado que custava US$ 30 por milhão de tokens no lançamento do GPT-4 em 2023 custa US$ 1,25 hoje com o GPT-5. Uma queda de 96× em três anos, entre modelos nomeados com preços publicados.
Por qualquer regra normal, as contas de IA empresariais deveriam estar despencando. Em vez disso, os orçamentos médios de IA das empresas Fortune-500 passaram de $7M em 2024 para $19M em 2026. Quase 3× em dois ciclos orçamentários.
O motivo: tokens baratos não são economizados, eles são transformados em armas. Um chatbot dispara
Ver original
post-image
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Algo se inverteu silenciosamente na computação de IA neste ano, e isso muda para que serve realmente a construção.
Em 2023, 2/3 da computação de IA foi para treinamento, o trabalho real de construir um modelo. A outra fatia, menor, foi para inferência, o trabalho de realmente executá-lo depois de construído. Mas essa proporção começou a virar silenciosamente.
A inferência agora é 2/3 e continua subindo, segundo a Deloitte, e os chips construídos para executá-la ultrapassaram $50B este ano.
O principal motivo pelo qual essa inversão importa (e não é percentualmente): treinamento e inferência sã
Ver original
post-image
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Dois anos atrás, um modelo aberto neste gráfico estaria perto do fundo. Os laboratórios fechados estavam gerações à frente, e essa diferença era a razão pela qual as pessoas alugavam modelos em vez de possuí-los.
Agora, o GLM-5.2 está na posição 51 no índice @ArtificialAnlys.
Pesos abertos, laboratório chinês, quinto no geral. E tire o Fable da lista, já que não está disponível, e o modelo de pesos abertos está muito mais perto do topo do que seu ranking sugere.
A proposta para os modelos fechados sempre foi a liderança. Pague pela API, aceite os termos, construa sobre algo que você não contro
GLM-3,73%
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Aqui está a divisão na computação de IA que poucos estão interpretando corretamente.
O treinamento de fronteira está se concentrando cada vez mais a cada trimestre, milhares de GPUs que precisam ficar em um único lugar interligadas. Mas o treinamento é apenas 30% da demanda em 2026. Os outros 70% são inferência, e executá-la em um hyperscaler significa pagar por uma infraestrutura construída para a carga de trabalho mais difícil para fazer a mais fácil.
Em redes distribuídas, essa mesma inferência poderia ser executada de 45 a 75% mais barata, e para qualquer pessoa que esteja dimensionando um
Ver original
post-image
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Estive pensando sobre a recente notícia do GLM 5.2 e o ângulo dos pesos abertos que todo mundo está adotando, mas estão perdendo uma perspectiva completamente diferente aqui.
Todo mundo está focado no fato de que um laboratório chinês atingiu desempenho de fronteira e o disponibilizou como código aberto, mas a parte que vale a pena ponderar é o como. A ZAI e o restante dos laboratórios chineses foram cortados do acesso à Nvidia no início de 2025, então, presumivelmente, não receberam H100s ou H200s diretamente desde então.
Eles cruzaram $128B em um modelo treinado provavelmente em silício chi
GLM-3,73%
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
95% da capacidade de GPU empresarial está parada neste momento.
Esse número vem da Cast AI medindo 23.000 clusters de produção reais, não uma pesquisa genérica.
A utilização média era de 5% e isso está acontecendo exatamente no momento em que a Nvidia aumentou os preços do H200 em 15%, o primeiro aumento em 20 anos. O hardware que todos dizem ser escasso está na maior parte sem fazer nada.
Se você está tentando entender por que o cálculo parece impossível de obter, é por isso. Ninguém devolve uma alocação pela qual esperou meses. Então a frota fica em 5%, cobrada por hora, e a escassez se alim
Ver original
post-image
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Algumas grandes movimentações na política de IA da UE estão supostamente chegando, mas aqui está a realidade da infraestrutura com a qual eles estão trabalhando.
> Investimento em infraestrutura de IA soberana da UE em 2026: 12,6 bilhões de dólares.
> Capex de hyperscalers dos EUA no mesmo ano: 725 bilhões de dólares.
A Europa passou seis anos construindo 19 Fábricas de IA e 14 supercomputadores e apenas a Amazon sozinha gastará mais que todo esse esforço em duas semanas neste ano.
A maioria das equipes de IA europeias não usam infraestrutura europeia. Elas alugam de Virgínia e Iowa e pagam um
Ver original
post-image
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Eu não esperava que esse número aparecesse este ano.
O GitHub está no ritmo de 14 bilhões de commits em 2026 até agora.
Isso aumentou de 1 bilhão em 2025.
Um aumento de 14 vezes em um único ano e a maior parte disso não é feita por humanos escrevendo código.
A carga ficou tão severa que a Microsoft, que possui e opera a segunda maior nuvem do mundo, teve que direcionar o tráfego através da AWS para manter a plataforma online.
Nove incidentes de serviço apenas em maio.
A disponibilidade caiu para 88,4%.
Para cada equipe de engenharia, fornecedor de infraestrutura e provedor de nuv
Ver original
post-image
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
A receita da Nvidia é a prova de que “cálculo agentico” não é uma teoria. Já está na demonstração de resultados.
$26B há quatro anos. $215,9 bilhões no ano passado. Esse crescimento de 8x aconteceu enquanto a maior parte da IA ainda estava em uma caixa de chat esperando você fazer uma pergunta.
A parte importante não é apenas o crescimento. É que a Nvidia transformou sua arquitetura na entrada não negociável para o roteiro de quase todos os outros. Laboratórios, nuvens, empresas. Logos diferentes na API, o mesmo silício por baixo. Quase cada dólar gasto em infraestrutura de IA neste ciclo
Ver original
post-image
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Não esperava que o número de cinco anos da Goldman fosse tão grande.
Cinco hyperscalers devem gastar US$ 5,3 trilhões em infraestrutura de IA entre 2025 e 2030.
Em 2022, eles gastaram $162B combinados.
Este ano, estão no caminho para US$ 725 bilhões.
Até 2027, os analistas projetam US$ 1 trilhão em um único ano.
Para quem está construindo produtos ou infraestrutura de IA fora dessas cinco balanças, essa trajetória é o número mais importante em suas suposições de planejamento.
A lacuna entre o que eles podem implantar e o que todos os outros podem acessar se acumula a cada ano que
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Todos previam que a IA assumiria primeiro o trabalho administrativo repetitivo. Os dados dizem algo diferente.
A tomada de decisão agora representa 28% da atividade de IA no local de trabalho. O caso de uso número um não é automação. É julgamento.
As pessoas estão usando IA para analisar opções, pesar trade-offs e apoiar conclusões pelas quais são responsáveis, e essa mudança importa além da questão do mercado de trabalho.
Cargas de trabalho baseadas em julgamento funcionam continuamente, exigem mais contexto por sessão e não agrupam de forma eficiente.
Os requisitos de infraestrutura
Ver original
post-image
  • Recompensa
  • 1
  • Repostar
  • Compartilhar
Millionairetasks:
Ótima oportunidade para todos estarem
Infraestrutura global de nuvem no primeiro trimestre de 2026. 129 bilhões de dólares em um único trimestre. Crescendo 35% ao ano.
O mercado está se expandindo rapidamente, mas a concentração não está mudando. AWS, Azure e Google Cloud mantiveram aproximadamente a mesma participação há dois anos que possuem hoje, mas a diferença absoluta entre eles e todos os outros é maior em termos de dólares do que nunca foi.
Essa é a parte que o gráfico de porcentagem não mostra. A fatia Outros não está crescendo para se tornar uma alternativa real. Está permanecendo proporcionalmente igual enquanto os três
Ver original
post-image
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
PJM opera a rede elétrica em 13 estados dos EUA e 65 milhões de pessoas. É o maior mercado de eletricidade atacadista competitivo do mundo.
Seu preço de liquidação do mercado de capacidade, a taxa que sinaliza se o fornecimento futuro de energia pode atender à demanda, passou de $28,92 por MW em 2024 para $329,17 em 2026. Dois ciclos de leilão.
A demanda de centros de dados foi identificada como o principal impulsionador. O leilão de 2027/2028 foi encerrado em $333,44, com a PJM atribuindo diretamente 5.100 MW do aumento de carga aos centros de dados.
Isso não é um choque de oferta ou um
Ver original
post-image
  • Recompensa
  • 2
  • Repostar
  • Compartilhar
DiveNate:
2026 GOGOGO 👊
Ver projetos
Dois números deste gráfico.
Preço da API de IA: caiu 96% desde 2022.
Capex de hyperscaler: aumentou 12x no mesmo período.
A maioria das pessoas vê o primeiro número e chama de democratização, mas ninguém está construindo uma estratégia em torno do segundo.
Isso não é uma coincidência. É uma jogada de captura estrutural.
Cada startup de IA que celebra modelos baratos está rodando em computação que não possui, em infraestrutura que não consegue replicar, controlada por três empresas.
IA soberana começa com infraestrutura soberana. Todo o resto é apenas uma dependência com preço melho
Ver original
post-image
  • Recompensa
  • 1
  • Repostar
  • Compartilhar
Yuhuan:
gsgsgshsokzkzkzkxhxj
O que a sexta-feira revelou não é que os governos podem desligar modelos de IA.
É que toda a base global de usuários dos modelos mais capazes do mundo está por trás de uma única decisão operacional de uma única empresa respondendo a uma única diretriz. Sem redundância ou aviso prévio.
Três das maiores empresas de IA atualmente controlam 88% do acesso à IA de fronteira e uma superfície de conformidade para tudo isso.
O que a sexta-feira tornou visível é que quando o acesso a computação e modelos fica dentro de um punhado de empresas, toda a pilha herda seu único ponto de falha. Isso não é
Ver original
post-image
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Em 2024, o mapa de computação de IA tinha duas superpotências. EUA com 53,7 GW, China com 31,9 GW.
Em 2026, a China está com 2,5 GW.
Isso é uma demolição controlada da capacidade de infraestrutura de IA de uma nação através de política de exportação. Sem bombas, sem sanções, apenas regras de chips.
O que isso prova é que a computação agora é uma arma geopolítica. Qualquer país que não possui sua infraestrutura não quer descobrir como é estar na linha de recebimento dessa arma.
A questão não é se a computação descentralizada vence. É se ela chega antes da próxima decisão de política que
Ver original
post-image
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
A maior oferta pública inicial de tecnologia dos anos 2000 foi a Visa com US$ 28 bilhões. A maior dos anos 2010 foi a Alibaba com US$ 168 bilhões. Aproximadamente 6x por década.
Agora estenda a linha. OpenAI e Anthropic estão cada um em $1T antes mesmo de listar.
Se você somar os maiores estreantes de tecnologia dos últimos 25 anos. Alibaba, Facebook, Uber, Rivian, Snowflake, Palantir, Cerebras, CoreWeave, todos eles. Você chega a aproximadamente US$ 800 bilhões.
OpenAI + Anthropic sozinhos valem quase US$ 2 trilhões. Ainda privados. 2,5x maior do que um quarto de século de maiores lista
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Durante a maior parte da história, o capital crescia por meio de máquinas.
Agora, ele cresce por meio da cognição.
Uma startup pode despertar com o equivalente a um milhão de analistas, pesquisadores, programadores e estrategistas operando em paralelo a um custo marginal quase zero.
A revolução da IA é diferente de qualquer revolução técnica anterior.
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
você não pode fazer uma abertura de estatuto e tratar a parte aberta como opcional uma vez que o dinheiro aparece
o julgamento começou com uma pergunta: você pode criar uma organização sem fins lucrativos, chamar a OpenAI de sua missão, atrair 10 anos de engenheiros movidos por missão e capital de doação com essa promessa, então converter para uma estrutura com limite de lucro e chamá-la de uma evolução?
elon deixou a openai em 2018. os $130b em danos que ele está pedindo vão para a organização sem fins lucrativos. seja qual for sua opinião sobre ele como litigante, a questão que o caso fo
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
a nvidia agora é maior do que toda a economia do Japão e sua conta de IA é a razão
cada dólar que você gasta em IA agora passa pelos chips de uma empresa, em três nuvens que os revendem com uma margem
> startups de IA queimam ~80% do capital levantado apenas para alugar computação
> vi equipes em estágio inicial pagando $700 mil/mês por um único fornecedor de chips
> centros de dados operam com 12-18% de capacidade enquanto sua conta aumenta a cada trimestre
toda a indústria acabou de concordar em ficar em uma fila e entregar dinheiro ao mesmo pedágio
há computação ociosa em rigs de jogos, har
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
  • Fixado