¿Por qué los centros de datos de IA no pueden depender únicamente de las GPU? Explorando la sinergia entre memoria, redes y almacenamiento

En junio de 2026, Bitcoin se mantuvo en torno a los 60 000 dólares mientras Ethereum cotizaba en la franja de 1 600 dólares, señalando un periodo de consolidación para el mercado cripto. En contraste, otro sector—la infraestructura de centros de datos para IA—experimentaba un auge de actividad. Gartner proyecta que el gasto mundial en TI alcanzará los 6,31 billones de dólares en 2026, un incremento interanual del 13,5 %, con el gasto en sistemas de centros de datos liderando todas las categorías gracias a una tasa de crecimiento del 55,8 %. IDC prevé que el gasto global empresarial en IA llegará a 940 000 millones de dólares en 2026.

En medio de esta carrera armamentista tecnológica, se está produciendo un cambio crucial de perspectiva: la competitividad de los centros de datos de IA ya no se define únicamente por el número de GPUs o la potencia máxima de computación. Ahora, el foco se desplaza hacia la sinergia global entre computación, almacenamiento y redes dentro de los clústeres. Comprender cómo interactúan la memoria, la red y el almacenamiento se ha vuelto fundamental para evaluar el valor de inversión en infraestructura de IA.

El muro de la memoria: el primer cuello de botella en la era de los modelos grandes

El tamaño de los parámetros de los modelos grandes de IA ha crecido exponencialmente en los últimos dos años. De 2024 a 2026, los parámetros de los modelos principales han aumentado cien veces, y las ventanas de contexto han pasado de decenas de miles a millones de tokens. Sin embargo, el ancho de banda de la memoria de los servidores ha crecido menos del 15 % anual, quedando muy rezagado respecto al ritmo de demanda del negocio de IA. Esta grave descompensación entre las tasas de iteración de software y hardware ha convertido el "muro de la memoria" en el principal cuello de botella que limita la potencia de computación de la IA.

El llamado muro de la memoria se refiere a que la velocidad de procesamiento de CPU/GPU aumenta mucho más rápido que el ancho de banda y la latencia de lectura/escritura de la memoria. Mientras los chips de computación operan a velocidades vertiginosas, los datos no pueden suministrarse lo suficientemente rápido, lo que provoca que los procesadores pasen mucho tiempo esperando. Según informes de pruebas de la industria, en clústeres de GPU a gran escala, los cuellos de botella de E/S de datos pueden hacer que las GPUs estén inactivas más del 40 % del tiempo, es decir, casi la mitad de estos costosos chips se dedican a esperar transferencias de datos.

Los recursos de memoria se están volviendo alarmantemente escasos. Un solo servidor de inferencia de IA consume más de diez veces la DRAM y HBM que un servidor tradicional de centro de datos, y casi el 60 % de la capacidad mundial de obleas de DRAM se destina ahora a clústeres de IA. En particular, la HBM ha estado en escasez crónica, con la mayor parte de la capacidad de producción reservada por grandes clientes hasta 2026 e incluso 2027. Gartner señala que la demanda creciente y las restricciones de suministro han llevado los precios de la HBM a máximos históricos, convirtiendo la memoria en un segmento de alto margen para los fabricantes de semiconductores.

Para superar el muro de la memoria, la industria avanza por dos caminos: primero, la optimización y ajuste fino a nivel software, como la programación escalonada de cachés KV y la cuantización de bajo bit, para maximizar los recursos de almacenamiento existentes. Segundo, la innovación arquitectónica a nivel hardware, incluyendo mejoras en HBM y la adopción de nuevos protocolos de interconexión de memoria como CXL (Compute Express Link). La plataforma HGX Rubin de próxima generación de NVIDIA ha triplicado el ancho de banda de memoria de GPU hasta 176 TB/s. Estos dos enfoques no son excluyentes, sino estrategias complementarias que redefinen la lógica de colaboración entre almacenamiento y computación en toda la industria.

Redes: la "red neuronal" de los clústeres de IA

Mientras la memoria aborda la eficiencia de transferencia de datos dentro de un nodo, las redes resuelven el reto del movimiento de datos entre nodos. En clústeres de IA a gran escala, cientos o miles de GPUs deben trabajar juntas para entrenar o inferir un solo modelo, por lo que la eficiencia de comunicación entre GPUs es crítica para la velocidad global de entrenamiento.

Actualmente existen cuellos de botella de ancho de banda en varios niveles: entre chips, las interconexiones tradicionales de PCB ya no satisfacen las demandas de alto ancho de banda y baja latencia de los chips de IA. Dentro de los racks de servidores, el ancho de banda entre servidores limita la escalabilidad vertical. Entre centros de datos, el ancho de banda y la latencia de transmisión a larga distancia restringen la escalabilidad horizontal y la programación de cargas de trabajo entre regiones. Se estima que, en los clústeres de entrenamiento de IA actuales, la energía consumida en el movimiento de datos ya supera la de la computación misma.

NVLink e InfiniBand de NVIDIA han dominado durante mucho tiempo el mercado de interconexión interna para clústeres de IA. El último NVLink Switch ofrece ahora 28,8 TB/s de ancho de banda, el doble que la generación anterior. Sin embargo, este panorama está siendo desafiado: empresas como AMD y Broadcom desarrollan sus propias soluciones de interconexión, y estándares abiertos como UALink (Ultra Accelerator Link) están madurando rápidamente. Para 2026, el espacio de redes pasará de ser "solo NVIDIA" a una competencia multiestándar, elevando el listón de las capacidades de integración de sistemas entre los operadores de centros de datos.

Almacenamiento: de "almacén" a "canal de datos"

En los centros de datos tradicionales, el almacenamiento funcionaba como un "almacén de datos", principalmente para archivar y preservar datos fríos. Sin embargo, en los centros de datos de IA, el almacenamiento ha evolucionado hacia un "canal de datos", encargado de suministrar continuamente datos de entrenamiento a los nodos de computación a velocidades extremadamente altas y de soportar lecturas de parámetros de modelos de baja latencia durante la inferencia.

El entrenamiento de IA requiere acceso rápido a grandes volúmenes de datos brutos, mientras que la inferencia exige una recuperación veloz de pesos de modelos y cachés KV. Las cachés KV ahora se extienden desde la HBM de GPU hasta la DRAM del sistema e incluso hasta SSDs locales de alta velocidad. Esto difumina la línea entre almacenamiento y memoria, convirtiendo los dispositivos de almacenamiento no solo en puntos finales de datos, sino en nodos críticos dentro del canal de flujo de datos.

El almacenamiento all-flash está reemplazando a los discos duros tradicionales como la opción principal en los centros de datos de IA. En ISC High Performance 2026, Sugon presentó productos de almacenamiento all-flash y redes nativas de alta velocidad, destacando esta tendencia sectorial. El rendimiento del almacenamiento ahora determina directamente si los datos llegan a tiempo a las unidades de computación, afectando así las tasas de utilización de GPU.

Sinergia computación-memoria-red: de avances puntuales a optimización sistémica

Una vez que se clarifican los roles y cuellos de botella de cada componente, el significado de "sinergia" toma forma: la verdadera potencia de computación de un centro de datos de IA no es una suma simple de la capacidad de GPU, el ancho de banda de memoria, el rendimiento de red y los IOPS de almacenamiento, sino el resultado efectivo generado por el acoplamiento a nivel sistema de los cuatro elementos.

El crecimiento implacable de los parámetros de los modelos impulsa el auge de los superclústeres de IA. La usabilidad ya no depende solo del rendimiento de los chips, sino cada vez más de la sinergia y eficiencia global de computación, almacenamiento y redes dentro del clúster. Esta visión se está convirtiendo rápidamente en consenso sectorial.

En la práctica, el diseño integrado de computación-memoria-red se ha convertido en el enfoque estándar entre los principales fabricantes. El superclúster scaleX AI de Sugon sigue esta filosofía de integración estrecha, impulsando significativamente la eficiencia de entrenamiento e inferencia. El sistema operativo de inferencia Dynamo 1.0 de NVIDIA, junto con la plataforma BlueField-4 CMX, conecta de forma transparente GPU, HBM, DRAM de host, flash local y almacenamiento remoto a través de múltiples niveles, eliminando los silos de memoria de GPU mediante el enrutamiento automatizado de datos calientes y fríos.

El informe de IDC de junio de 2026 lo deja claro: la ventaja competitiva en IA ya no consiste en disponer de la computación más potente, sino en convertir la IA en una capacidad empresarial sostenible al menor coste por token. En el núcleo de ese coste están las eficiencias combinadas de computación, memoria, red y almacenamiento.

Panorama de mercado: ¿quién se beneficia?

Esta tendencia sectorial ya se refleja claramente en los mercados de capitales.

En el ámbito de la memoria, SK Hynix destaca como el gran protagonista de 2026. El 22 de junio de 2026, las acciones de SK Hynix se dispararon un 6 % hasta un máximo histórico de 2 944 000 KRW, superando a Samsung y convirtiéndose en la empresa más valiosa cotizada de Corea, con una ganancia acumulada en el año superior al 349 %. Micron también ha presentado resultados sólidos, cuadruplicando sus ingresos trimestrales en la última semana de junio y anunciando 16 nuevos acuerdos de suministro a largo plazo. El precio de la acción de Micron subió un 16 % el día de la publicación de resultados.

En redes, el proveedor de fibra óptica Corning alcanzó máximos históricos en la última semana de junio, ya que el mercado revalorizó el papel fundamental de sus productos en los centros de datos de IA. Los pedidos de infraestructura de IA de Cisco han superado los 9 000 millones de dólares.

En servidores e integración de sistemas, los ingresos de Dell por servidores optimizados para IA alcanzaron los 16 100 millones de dólares en un solo trimestre, un aumento interanual del 757 %. Supermicro ostenta cerca del 70 % de cuota de mercado en tecnología de refrigeración líquida directa.

Para operaciones de centros de datos, BOCOM International eligió a GDS (GDS-SW) y SUNeVision (SUNEVISION) como principales recomendaciones en el sector, citando el crecimiento explosivo de la demanda impulsado por la IA generativa. UBS también señaló que la industria china de centros de datos de internet acelerará significativamente a partir de la segunda mitad de 2026.

¿Cómo invertir en infraestructura de IA a través de Gate?

Gate ofrece acceso a más de 12 500 acciones y ETFs en los mercados de EE. UU., Hong Kong y Corea. Los inversores pueden utilizar una cuenta unificada para negociar valores globales directamente con USDT y otros activos digitales, permitiendo una asignación fluida entre cripto y valores tradicionales.

Dentro del sector de infraestructura de centros de datos de IA, Gate cubre toda la cadena industrial, desde chips hasta aplicaciones:

Para acciones estadounidenses, los inversores pueden negociar compañías clave como NVIDIA (NVDA), AMD, Micron (MU), Broadcom (AVGO), Dell (DELL), Supermicro (SMCI), Corning (GLW) y Cisco (CSCO). Gate admite negociación previa y posterior a mercado, ampliando el horario de trading a 16×5, lo que permite a los usuarios reaccionar rápidamente a resultados y datos macroeconómicos.

Para acciones de Hong Kong, los inversores pueden centrarse en operadores de centros de datos como GDS (09698.HK) y SUNeVision (01686.HK).

Para acciones coreanas, SK Hynix (000660.KS) es el líder indiscutible en HBM, mientras Jeju Semiconductor desempeña un papel clave en materiales de comunicaciones ópticas para centros de datos de IA.

El trading de acciones en Gate ofrece comisiones desde solo el 0,1 %, admite modos de trading apalancado y al contado, y los usuarios con posiciones superiores a 2 000 dólares disfrutan de tarifas VIP exclusivas. Para quienes buscan exposición sistemática al sector de infraestructura de centros de datos de IA, las capacidades de trading multiactivo, cross-market y todo en uno de Gate están reduciendo las barreras para la asignación global de activos tecnológicos.

Conclusión

Los centros de datos de IA están pasando de la era de "apilamiento de GPUs" a una nueva fase de optimización a nivel sistema. Memoria, redes y almacenamiento ya no son componentes aislados de la infraestructura: ahora son variables sistémicas que, bajo el marco de sinergia computación-memoria-red, determinan conjuntamente la potencia real de computación de IA.

Comprender esta lógica no solo ayuda a evaluar tendencias tecnológicas, sino que también proporciona un sólido marco analítico para decisiones de inversión. Desde chips hasta memoria, redes, almacenamiento, servidores y operaciones de centros de datos, toda la cadena industrial apenas comienza a ser revalorizada. A medida que la volatilidad a corto plazo del mercado cripto se cruza con la narrativa a largo plazo de la infraestructura de IA, se abre una nueva ventana para la asignación entre activos digitales y economía real.

Preguntas frecuentes

P1: ¿Por qué los centros de datos de IA no pueden resolver los problemas de potencia de computación solo añadiendo más GPUs?

Las GPUs son solo el punto final del output de computación. Su rendimiento depende en gran medida de si el ancho de banda de memoria puede suministrar datos a tiempo, de si la red puede coordinar eficientemente el paralelismo multi-GPU y de si el almacenamiento puede gestionar rápidamente grandes lecturas y escrituras de datos. En clústeres de GPU a gran escala, los cuellos de botella de E/S de datos pueden provocar más del 40 % de tiempo de inactividad de las GPUs: simplemente acumular GPUs sin abordar estas tres áreas genera un enorme desperdicio de potencia de computación.

P2: ¿Por qué hay tanta escasez de HBM?

HBM (High Bandwidth Memory) es la memoria estándar para chips de IA, con procesos de fabricación complejos y ciclos de expansión superiores a dos años. En 2026, la demanda de inferencia de IA superará la de entrenamiento, impulsando aún más la demanda de HBM y DRAM de alta capacidad. La mayor parte de la capacidad de producción ya está reservada por grandes clientes hasta 2026 e incluso 2027, lo que deja poca flexibilidad de suministro a corto plazo.

P3: ¿Cuál es la lógica central para invertir en infraestructura de centros de datos de IA?

La lógica central es el paso de una demanda "dominada por el entrenamiento" a una "explosión de demanda full-stack". En 2026, Microsoft, Google, Amazon y Meta gastarán colectivamente 725 000 millones de dólares en gastos de capital para infraestructura de IA. Esta escala de inversión no puede ser asumida por un solo segmento: toda la cadena de valor, desde chips y memoria hasta redes y operaciones de centros de datos, se beneficiará estructuralmente.

P4: ¿Cómo permite Gate negociar acciones relacionadas con centros de datos de IA?

Gate ofrece acceso a más de 12 500 acciones y ETFs de EE. UU., Hong Kong y Corea. Los usuarios pueden depositar con USDT y otros activos digitales, y negociar acciones clave de infraestructura de IA como NVIDIA, Micron y SK Hynix en una cuenta unificada. Gate admite negociación previa y posterior a mercado, modos apalancado y al contado, con comisiones desde solo el 0,1 %.

P5: ¿Cuáles son los principales riesgos de invertir en infraestructura de centros de datos de IA?

Los riesgos clave incluyen: (1) Desajustes entre oferta y demanda que pueden llevar a un exceso temporal de suministro—BOCOM International destaca la necesidad de vigilar los ciclos y las oscilaciones de valoración; (2) La sostenibilidad de los gastos de capital de los proveedores de nube a hiperescala—J.P. Morgan advierte que el crecimiento de capex en 2025–2026 supera ampliamente el crecimiento de ingresos, presionando los flujos de caja; (3) Las tensiones geopolíticas y los controles de exportación pueden interrumpir las cadenas de suministro de chips avanzados.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement

¿Por qué los centros de datos de IA no pueden depender únicamente de las GPU? Explorando la sinergia entre memoria, redes y almacenamiento

El muro de la memoria: el primer cuello de botella en la era de los modelos grandes

Redes: la "red neuronal" de los clústeres de IA

Almacenamiento: de "almacén" a "canal de datos"

Sinergia computación-memoria-red: de avances puntuales a optimización sistémica

Panorama de mercado: ¿quién se beneficia?

¿Cómo invertir en infraestructura de IA a través de Gate?

Conclusión

Preguntas frecuentes

Última hora

El primer ministro indio Modi habla hoy con el presidente iraní

Etched recauda $800M para clústeres de inferencia de IA, asegura más de $1B en pedidos

Solana se convierte en capa de liquidación para 1.000+ dapps, maneja 100 millones+ transacciones diarias en 2026

USDA informa que el inventario de soja de EE. UU. en el segundo trimestre es de 1,061 mil millones de bushels.

La producción de Gas Natural Licuado de EE.UU. aumenta 39.000 barriles por día en abril a 7,903 millones

Dexe se acerca a su máximo histórico: ¿por qué vuelve la gobernanza DAO a estar en el centro de atención?

Las ganancias no realizadas de las ballenas de Ethereum se vuelven negativas por primera vez desde 2019: ¿se acerca el suelo del mercado?

Historia: ¿Por qué cambiar el nombre a DATA Foundation? Los datos de entrenamiento para IA surgen como la nueva frontera