Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
TradFi
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
Pre-IPOs
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
Acuñación de GUSD
Acuña GUSD y gana rentabilidad de RWA
Promociones
Centro de actividades
Únete a actividades y gana recompensas
Referido
20 USDT
Invita amigos y gana por tus referidos
Programa de afiliados
Gana recompensas de comisión exclusivas
Gate Booster
Aumenta tu influencia y gana airdrops
Anuncio
Novedades de plataforma en tiempo real
Blog de Gate
Artículos del sector de las criptomonedas
AI
Gate AI
Tu compañero de IA conversacional para todo
Gate AI Bot
Usa Gate AI directamente en tu aplicación social
GateClaw
Gate Blue Lobster, listo para usar
Gate for AI Agent
Infraestructura de IA, Gate MCP, Skills y CLI
Gate Skills Hub
+10 000 habilidades
De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA
GateRouter
Elige inteligentemente entre más de 30 modelos de IA, con 0% de costos adicionales
Acabo de captar algo interesante que la mayoría todavía no está viendo. Todos han estado obsesionados con el suministro de GPU durante años, pero en silencio, las CPU se han convertido en la verdadera limitación en la infraestructura de IA. Y este cambio está ocurriendo más rápido de lo que la mayoría se da cuenta.
El mes pasado, Google e Intel anunciaron un acuerdo masivo de varios años específicamente para abordar este cuello de botella de las CPU. El mensaje de Intel fue claro: la IA no funciona solo con GPUs—las CPU y la orquestación del sistema ahora son el factor limitante. Mientras tanto, los precios de las CPU de servidores subieron aproximadamente un 30% en el cuarto trimestre del año pasado, lo cual es una locura para un mercado maduro. Los tiempos de entrega de AMD se extendieron de 8 semanas a más de 10 semanas, con algunas piezas enfrentando retrasos de 6 meses. Esto no es publicidad—es una presión real en el suministro.
La ironía es brutal: los laboratorios de IA tienen muchas GPUs sin usar, pero no pueden conseguir suficientes CPU de alta gama para operarlas. La capacidad de 3nm de TSMC se está viendo comprimida por pedidos de GPU, por lo que la asignación de obleas de CPU sigue siendo redistribuida. Incluso Elon Musk se metió en el juego de las CPU, encargando a Intel diseñar chips personalizados para su proyecto Terafab en Texas. Así de apretadas están las cosas.
¿Pero por qué el cambio repentino? Es porque las cargas de trabajo de los agentes son completamente diferentes de la inferencia tradicional. Los chatbots generalmente descargan el cómputo a las GPUs. Pero los agentes? Necesitan orquestar APIs, gestionar bases de datos, ejecutar código y coordinar resultados—tareas todas intensivas en CPU. Investigadores del Georgia Tech descubrieron que el trabajo en el lado de la CPU ahora representa entre el 50% y el 90% de la latencia total en los sistemas de agentes. La GPU está allí lista para usar, mientras la CPU todavía maneja las llamadas a herramientas.
Que las ventanas de contexto exploten tampoco ayuda. Los modelos ahora soportan más de 1 millón de tokens, y la caché KV por sí sola alcanza ~200GB—muy por encima de lo que puede sostener un solo H100. Las CPU tienen que descargar y gestionar esta memoria, así que ahora no solo orquestan; hacen una gestión de datos seria.
Mira cómo están respondiendo los fabricantes. La CEO de AMD, Lisa Su, ha sido bastante clara: las cargas de trabajo de los agentes están empujando tareas de vuelta a las CPU tradicionales, y eso impulsa su crecimiento. Los ingresos de AMD en centros de datos alcanzaron los 5.400 millones de dólares en el cuarto trimestre, un aumento del 39% año tras año, con las CPU EPYC haciendo el trabajo pesado. La cuota de mercado de AMD en CPU de servidores superó el 40% por primera vez. Pero AMD todavía carece de las capacidades de interconexión CPU-GPU estrechas que NVIDIA está construyendo con NVLink.
NVIDIA tomó un enfoque diferente. Su CPU Grace tiene solo 72 núcleos frente a los 128 de AMD o las configuraciones típicas de Intel. En lugar de perseguir el conteo de núcleos, NVIDIA optimizó para la colaboración—NVLink C2C lleva el ancho de banda a 1.8TB/s, permitiendo que la CPU acceda directamente a la memoria de la GPU. Han comenzado a vender Grace como un producto independiente, y Meta acaba de hacer una implementación masiva de "puro Grace" sin emparejarla con GPUs. Eso es una señal.
Intel está jugando en ambos lados—impulsando los procesadores Xeon en asociaciones con hyperscalers, mientras también colabora con SambaNova en soluciones híbridas que ejecutan inferencia de agentes sin GPUs. El proceso de 18A y la hoja de ruta de Xeon 6 Granite Rapids serán críticos para ellos.
Aquí está la visión más grande: la asociación de Amazon con $38B OpenAI menciona explícitamente desplegar "diez millones de CPUs". Eso es un cambio respecto al antiguo manual de "cientos de miles de GPUs". Bank of America proyecta que el mercado de CPU podría duplicarse desde $27B hasta $60B para 2030, impulsado casi en su totalidad por la IA.
Lo que realmente estamos viendo es una reconstrucción completa de la infraestructura. Las empresas ya no solo escalan GPUs, sino que también están construyendo toda una capa de infraestructura de orquestación de CPU diseñada específicamente para agentes de IA. Cuando el cómputo se vuelve abundante, la eficiencia a nivel de sistema se convierte en el diferenciador. Los próximos ganadores en IA no serán determinados solo por la cantidad bruta de GPUs; serán quienes resuelvan primero el cuello de botella de las CPU.