Ouvindo muitas pessoas dizerem que estamos "limitados por computação" porque é isso que sentimos ultimamente ao usar os modelos


Mas o problema é realmente o trabalho físico que acontece entre solicitar a GPU e produzir os tokens
Atrasos e cancelamentos em data centers:
- Lembra do Stargate? 10GW anunciado em janeiro de 2025 e cerca de 200 MW ativos 14 meses depois e expansão de 600MW em Abilene supostamente cancelada
- De aproximadamente 16GW de capacidade de IA de data center nos EUA anunciada para 2026, apenas cerca de 5 GW estão em construção
- Metade das construções de data centers nos EUA para 2026 previstas para serem atrasadas ou canceladas, principalmente devido à falta de energia
Escassez de componentes:
- Os prazos de entrega de transformadores agora são superiores a 5 anos, contra 24-30 meses antes de 2020
- Siemens, GE, Vertiv, Eaton todos relatando recordes de atrasos
Escassez de mão de obra:
- A Microsoft relata que eletricistas são seu maior obstáculo para expansão de data centers
- Eletricistas na Virgínia do Norte dobraram desde 2018, chegando a 14.700 eletricistas, e ainda assim não é suficiente
- Os aprendizados levam de 4 a 5 anos.
Você tem que se perguntar como $700B em apenas 2026 o capex será implantado, os hyperscalers e laboratórios literalmente não conseguem gastar sua maneira para sair desse problema
Pensando nas implicações disso, uma delas é muito óbvia - a IA local continuará a crescer e será algo importante
STG-1,4%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar