O gargalo de capacidade de processamento do cluster de 100 mil cartões AI está a mudar: como a interconexão óptica pode tornar-se no núcleo da nova infraestrutura?

Nos últimos dois anos, as discussões sobre poder de computação de IA quase que exclusivamente giraram em torno de GPUs: a escassez de fornecimento do H100, os parâmetros de desempenho do B200, o roteiro arquitetônico da próxima geração de GPUs, formando a narrativa principal do setor. No entanto, quando os clusters de IA passaram de milhares para dezenas de milhares e até centenas de milhares de GPUs, uma restrição estrutural mais profunda começou a emergir — a eficiência do fluxo de dados entre GPUs, que está se tornando o limite final para o desempenho geral do cluster.

O arquiteto de rede óptica da Tencent, Fu Sidong, apontou no início de 2026 que, desde a arquitetura Pascal em 2016 até a arquitetura Blackwell em 2024, o poder de computação de IA cresceu aproximadamente 1000 vezes em oito anos; a capacidade de inferência aumentou 32 vezes nos últimos quatro anos, enquanto o treinamento cresceu 16 vezes. Ao mesmo tempo, a largura de banda da rede aumentou de 200G para 800G, apenas 4 vezes. Essa disparidade — “poder de computação como foguete, rede como caminhada” — faz da velocidade de transmissão de dados entre os nós um gargalo crítico em clusters de dezenas de milhares ou centenas de milhares de GPUs, afetando severamente a eficiência geral do cluster e a utilização de recursos.

Essa realidade está reformulando a lógica de investimento em infraestrutura de IA e as escolhas de rotas tecnológicas. Quando a tecnologia de interconexão óptica evolui de uma solução de compensação de desempenho local para uma capacidade fundamental que sustenta a operação em larga escala de clusters de IA, compreender sua lógica técnica, o panorama de mercado e o valor industrial torna-se uma questão fundamental na avaliação do setor de poder de computação de IA. Paralelamente, o lado do investimento também passa por uma transformação estrutural semelhante — de uma alocação de ativos única para uma coordenação multissetorial, formando uma cadeia de valor que conecta infraestrutura de poder de computação e infraestrutura financeira.

O dilema de comunicação de clusters de cem mil GPUs: a disparidade entre poder de computação e rede

A eficiência de um cluster de GPUs não é determinada apenas pelo pico de desempenho de uma GPU individual, mas pelo tempo necessário para que todas as GPUs realizem cálculos colaborativos. Em treinamentos distribuídos de grandes modelos, a sincronização frequente de parâmetros e a troca de gradientes fazem com que a capacidade de comunicação entre os nós determine diretamente a eficiência total do treinamento. No white paper da tecnologia CPO da H3C, é destacado que, nos últimos anos, a velocidade de aumento do poder de computação por GPU superou em muito a evolução da largura de banda de interconexão de rede; a maioria dos clusters aumenta o número de GPUs na capacidade de computação, mas a expansão da largura de banda de comunicação fica relativamente atrasada, resultando em tempos de comunicação cada vez mais altos na duração total do treinamento, com GPUs aguardando longos períodos por dados, dificultando a ampliação proporcional do desempenho efetivo.

Esse fenômeno possui uma base de quantificação clara. Dados de uma apresentação da Tencent mostram que, nos últimos quatro anos, o poder de treinamento cresceu 16 vezes, a inferência 32 vezes, enquanto a largura de banda de rede aumentou de 200G para 800G, apenas 4 vezes. Quando o cluster ultrapassa dezenas de milhares de GPUs e evolui para centenas de milhares, o padrão de comunicação entre GPUs deixa de ser uma simples transmissão ponto a ponto, passando a envolver milhares ou dezenas de milhares de links operando simultaneamente. Qualquer congestionamento ou atraso em um link pode atrasar todo o ciclo de iteração do treinamento.

Um artigo publicado em fevereiro de 2026 pela IEEE reforça essa avaliação: à medida que o tamanho dos modelos de IA cresce, a interconexão torna-se um gargalo crítico em grandes clusters de GPUs, e as redes tradicionais de comutação por pacotes enfrentam desafios crescentes em termos de consumo de energia, custo e escalabilidade. Pesquisas indicam que arquiteturas baseadas em comutação óptico-elétrica podem reduzir o consumo de energia da camada backbone em quase 99%, e diminuir o custo de ciclo de vida em 76% ao longo de oito anos.

Dados do setor indicam que essa contradição estrutural está impulsionando uma expansão acelerada da infraestrutura de comunicação óptica. Segundo a UBS, a demanda global por fibra óptica cresceu cerca de 2% ao ano nos últimos cinco anos, mas, com a construção acelerada de data centers de IA, a previsão é que essa taxa de crescimento ultrapasse 30% nos próximos anos, com a demanda relacionada a data centers podendo atingir uma taxa de crescimento composta superior a 75%. Antes, entre 70% e 80% da demanda por fibra vinha de operadoras de telecomunicações; a UBS projeta que, até 2030, a participação de empresas e data centers na demanda total ultrapassará 80%. A indústria de fibra está passando de uma infraestrutura de comunicação tradicional para um componente central na infraestrutura de IA.

Interconexão óptica: uma rota tecnológica determinística para resolver o gargalo de poder de computação

Diante da disparidade entre poder de computação e rede, a tecnologia de interconexão óptica está ascendendo de uma solução complementar para uma escolha arquitetônica fundamental. A expansão de clusters de IA geralmente ocorre em três dimensões: Scale-up (expansão vertical, interconexão de alta velocidade entre GPUs dentro de um rack), Scale-out (expansão horizontal, interconexão entre racks ou nós), e Scale-across (interconexão entre centros de dados geograficamente dispersos). Cada dimensão possui requisitos distintos de largura de banda, latência, consumo de energia e alcance de transmissão, mas todas apontam para a indispensabilidade da interconexão óptica.

No cenário Scale-up, a interconexão óptica substitui principalmente cabos de cobre ou switches elétricos, proporcionando maior largura de banda e menor latência na comunicação intra-nó. Por exemplo, o NVIDIA NVLink 576, baseado em Spectrum-X Ethernet switch com tecnologia CPO, oferece uma capacidade de troca de 512×200Gbps, incluindo 32 motores de fibra óptica de 1,6T, utilizados em cenários de Scale-out e Scale-across. O Huawei CloudMatrix 384, com uma arquitetura de interconexão totalmente igualitária, conecta 384 NPUs, 192 CPUs e recursos de armazenamento e memória através de 3.168 fibras ópticas e 6.912 módulos LPO de 400G, formando uma rede de alta velocidade.

No nível de rota, famílias de tecnologias “x”PO, como LPO, LRO e CPO, estão em rápida evolução. Dados da LightCounting indicam que o mercado global de módulos de fibra óptica Ethernet deve crescer 35% em 2026, atingindo US$ 18,9 bilhões, e deve ultrapassar US$ 35 bilhões até 2030, com a demanda por módulos de alta velocidade como 800G e 1,6T dominando o mercado. A TrendForce estima que, em 2026, a participação de módulos de transmissão óptica de 800G ou mais deve subir de 19,5% em 2024 para mais de 60%, e, com base na previsão de quase 4 milhões de unidades de TPU do Google, a demanda por módulos acima de 800G pode ultrapassar 6 milhões de unidades.

A questão do consumo de energia é um dos principais desafios dos módulos ópticos removíveis. A tecnologia Apollo OCS do Google usa espelhos de reflexão micro para conectar diretamente fibras ópticas de dados, evitando as perdas de energia e atrasos causados pelas conversões entre luz e eletricidade. Um switch OCS consome cerca de 95% menos energia do que switches tradicionais. Em termos de latência, o conjunto de chips sem DSP óptico da THine, compatível com LPO ou CPO, pode reduzir o atraso em até 90% e economizar 73% de energia em cenários de interconexão de curto alcance.

O vice-diretor do Instituto de Pesquisa de Telecomunicações da China, Li Junjie, afirmou no início de 2026 que a tecnologia de interconexão óptica está evoluindo de uma compensação de desempenho local para uma capacidade fundamental que sustenta operações de hiper-nós de IA de forma escalável, flexível e altamente confiável. Seja para resolver gargalos de taxa, restrições de consumo ou limitações de capacidade, a interconexão óptica tornou-se uma condição prévia para a evolução de infraestruturas de IA de milhares para dezenas de milhares de GPUs.

A mudança estratégica da Ciena: de banda larga de telecomunicações para rede óptica de IA

Quando a interconexão óptica se torna o núcleo da infraestrutura de IA, a estratégia dos principais fornecedores de equipamentos nesse setor torna-se uma janela importante para entender a evolução do mercado. A Ciena, líder global em sistemas de rede de alta velocidade, está passando por uma transformação estratégica profunda.

No terceiro trimestre fiscal de 2025, a Ciena reportou receita de US$ 1,22 bilhão, impulsionada principalmente por plataformas ópticas e de roteamento. Ao mesmo tempo, anunciou a interrupção do desenvolvimento de sua linha de produtos PON de banda larga, redirecionando investimentos de P&D para soluções centrais de óptica e data centers, incluindo tecnologias de gerenciamento fora de banda, e cortando de 4% a 5% de sua força de trabalho, provisionando cerca de US$ 90 milhões em despesas de P&D não monetárias para amortização. A Ciena espera que o crescimento futuro seja liderado principalmente por mercados de IA e grandes provedores de nuvem.

O CEO Gary Smith afirmou na teleconferência de resultados que os clientes provedores de serviços estão concentrando seus investimentos em áreas capazes de gerar efeitos de escala para suportar o crescimento do tráfego de IA, criando novas demandas de sistemas e oportunidades de interconexão, que eventualmente se estendem ao interior dos data centers. A Ciena estima que cerca de 50% de seus negócios vêm de grandes provedores de nuvem, e que a composição de clientes em 2026 será semelhante.

A Ciena já apresenta resultados concretos na implementação de infraestrutura de IA. A empresa aponta um projeto de interconexão de clusters regionais de GPU na América do Norte, envolvendo sua plataforma RLS e o placa WaveLogic 6 Nano 800-gig ZR. Além disso, sua solução de gerenciamento fora de banda DCOM, voltada para operações internas de data centers, ajuda grandes operadoras a simplificar a instalação e gestão de operações em larga escala, aumentando a escalabilidade e reduzindo consumo de energia e espaço.

Em uma perspectiva mais macro, a mudança estratégica da Ciena reflete uma transição do setor de IA de uma demanda de quantidade para uma demanda de qualidade na rede óptica. Jürgen Hatheier, CTO da Ciena, destacou que o mercado está claramente se movendo em direção a conexões ópticas de maior capacidade, com forte demanda por comprimentos de onda de 1,6T, que deve se manter forte até 2026. Rob Shore, responsável por marketing de produtos de rede óptica da Nokia, prevê que, em 2026, os módulos de transceptores coerentes de 800G se tornarão a solução padrão de conexão óptica para redes de IA.

O mercado de redes de data centers de IA está crescendo exponencialmente. Segundo dados do setor, esse mercado deve passar de US$ 10,31 bilhões em 2025 para US$ 12,8 bilhões em 2026, com uma taxa de crescimento anual composta de 24,2%, atingindo US$ 30,17 bilhões até 2030. A demanda por cabos ópticos para IA deve crescer 77% em 2025, e a taxa de crescimento anual composta de 26% até 2029, muito acima de aplicações não relacionadas à IA. A Ciena está posicionada no centro dessa curva de crescimento estrutural.

De infraestrutura de poder de computação a infraestrutura financeira: o mapa de ações da Gate

A evolução da infraestrutura não ocorre apenas no nível de poder de computação, mas também na alocação de ativos. Quando a interconexão óptica de data centers de IA se torna uma infraestrutura decisiva para a eficiência de clusters de GPU, a capacidade de alocação multissetorial dos investidores também precisa de uma infraestrutura eficiente correspondente.

A Gate, que atua no setor financeiro tradicional, avança de forma constante. Em janeiro de 2026, a plataforma lançou pela primeira vez contratos por diferença (CFDs) de TradFi, cobrindo ouro, câmbio, índices de ações, commodities e ações populares. Em março, expandiu para tokens de ações e ETFs alavancados. Em junho, por meio de parceria estratégica com a Alpaca, lançou oficialmente serviços de negociação de ações reais.

Atualmente, a Gate suporta mais de 10.000 ações e ETFs dos EUA, incluindo empresas listadas na NYSE, NASDAQ e outros principais mercados, abrangendo uma gama muito maior do que plataformas de tokenização de ações que geralmente suportam apenas algumas centenas de ativos. Os usuários podem investir diretamente no mercado de ações dos EUA usando USDT, com frações de ações a partir de 0,01, permitindo que participem de investimentos em ações de primeira linha com valores a partir de US$ 1.

No aspecto técnico e de parcerias, a Gate conecta-se a corretoras regulamentadas com licença de Broker-Dealer nos EUA, com capacidade de liquidação, acessando as principais bolsas como NYSE e NASDAQ. Cada ação é suportada por ativos reais depositados de forma independente no sistema DTC, não por derivativos na blockchain ou produtos de RWA. Os detentores de posições podem automaticamente usufruir de dividendos, direitos de subscrição, desdobramentos, entre outros direitos de acionista.

Do ponto de vista de tendências do setor, a consolidação de plataformas de criptomoedas que oferecem negociação de ações é uma direção clara. Dados indicam que 73% dos traders de criptomoedas também possuem ativos tradicionais. A abordagem da Gate, por meio de infraestrutura regulamentada, garante negociação de ações reais, não apenas representações sintéticas ou tokenizadas, assegurando descoberta de preços e liquidação reais. Com seus produtos de CFDs, a Gate está evoluindo de uma bolsa de ativos criptográficos para um centro multissetorial que combina cripto e finanças tradicionais, além de derivativos.

Essa evolução está alinhada à tendência macro de tokenização de ativos RWA. Em setembro de 2025, a Gate lançou oficialmente a seção Ondo, com os primeiros tokens de ações e ETFs de empresas como Apple, Tesla e Microsoft. O volume total de ativos tokenizados RWA ultrapassou US$ 15,7 bilhões, com a Ondo Finance ocupando a terceira posição global, com cerca de US$ 1,66 bilhão em ativos sob custódia. De ações reais a ações tokenizadas e CFDs de ações, a Gate está construindo uma via de alocação multiestrutural que cobre diversas formas de ativos.

Conclusão

A trajetória de evolução da tecnologia de interconexão óptica aponta para um fato fundamental: a competitividade de data centers de IA está migrando de um foco exclusivo em desempenho de GPU para indicadores de eficiência sistêmica. A rede deixou de ser apenas um suporte ao cluster de poder de computação, tornando-se uma condição prévia para que clusters de dezenas de milhares de GPUs possam realmente alcançar seu potencial teórico. Nesse contexto, o valor estratégico das empresas de infraestrutura de rede óptica está sendo reavaliado pelo mercado — a decisão da Ciena de se concentrar totalmente na rede óptica de IA é uma evidência clara dessa tendência.

Ao mesmo tempo, a evolução da infraestrutura de investimento também é crucial. Quando o poder de computação de IA se torna um elemento central na produção digital, a capacidade de conectar essa força produtiva ao capital global por meio de plataformas eficientes também está passando por uma mudança sistêmica. Da mesma forma que a tecnologia avança, a inovação financeira também se entrelaça, e o cruzamento dessas fronteiras frequentemente gera oportunidades estruturais concentradas.

RWA0,98%
ONDO-2,62%
TSLA-1,94%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado