torygreen

vip
Antigüedad 2.8 años
Nivel máximo 0
Aún no hay contenido
Pasé tiempo con los números de inferencia y una estadística sigue apareciendo.
El 70% de la inferencia de IA en 2026 se ejecuta en el borde. No en un centro de datos de hiperescala. No en AWS. En sistemas industriales, equipos autónomos y dispositivos conectados donde el viaje de ida y vuelta a un servidor en la nube no es un problema de latencia, es un modo de fallo.
El mercado de inferencia de 106 mil millones de dólares no está creciendo porque la gente esté enviando más consultas de "chat" a su IA. Está creciendo porque la IA se está integrando en infraestructura física que funciona contin
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Aparentemente, estar cerca de la tecnología física tiene muy poco que ver con adoptarla realmente.
California es el hogar de todos los laboratorios de IA de frontera que importan. Nueva York tiene más Fortune 500 que cualquier otro estado. Ambos fueron superados por Colorado, que alcanzó un 23.2% de adopción empresarial de IA mientras Nueva York logró un 13.8%.
Lo que Colorado y Arizona tienen no es mejor infraestructura o talento. Es la disposición a moverse antes de que la industria indique que es seguro. Los estados más cercanos a la tecnología son a menudo los más lentos en implementarla p
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
En teoría, los costos de IA ya deberían haberse desplomado.
La misma tarea de nivel fronterizo que costaba $30 por millón de tokens en el lanzamiento de GPT-4 en 2023 cuesta hoy $1.25 con GPT-5. Una caída de 96× en tres años, entre modelos nombrados con precios publicados.
Bajo cualquier regla normal, las facturas de IA empresarial deberían estar cayendo en picada. En cambio, los presupuestos promedio de IA de Fortune-500 pasaron de $7M en 2024 a $19M en 2026. Casi 3× en dos ciclos presupuestarios.
La razón: los tokens baratos no se ahorran, se utilizan como armas. Un chatbot dispara tokens un
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Algo se invirtió silenciosamente en el cómputo de IA este año, y cambia para qué es realmente la construcción.
En 2023, 2/3 del cómputo de IA se destinó al entrenamiento, el trabajo real de construir un modelo. La otra porción, más pequeña, fue para inferencia, el trabajo de ejecutarlo una vez construido. Pero esa proporción comenzó a invertirse silenciosamente.
La inferencia ahora es 2/3 y sigue subiendo, según Deloitte, y los chips construidos para ejecutarla superaron $50B este año.
La razón principal por la que este cambio importa (y no es porcentualmente): entrenamiento e inferencia son
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Hace dos años, un modelo abierto en este gráfico habría estado cerca del fondo. Los laboratorios cerrados iban generaciones adelante, y esa brecha era la razón principal por la que la gente alquilaba modelos en lugar de poseer uno.
Ahora GLM-5.2 se sitúa en el puesto 51 del índice @ArtificialAnlys.
Pesos abiertos, laboratorio chino, quinto en general. Y elimina a Fable de la lista ya que no está disponible, y el modelo de pesos abiertos está mucho más cerca de la cima de lo que su clasificación deja ver.
El argumento para los cerrados siempre fue la ventaja. Paga la API, acepta los términos, c
GLM11,38%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Aquí está la división en computación de IA que pocos están leyendo correctamente.
El entrenamiento de frontera se concentra más cada trimestre, miles de GPU que deben estar en un mismo lugar interconectadas. Pero el entrenamiento es solo el 30% de la demanda en 2026. El otro 70% es inferencia, y ejecutarla en un hiperescalador significa pagar por una infraestructura construida para la carga de trabajo más difícil para hacer la más fácil.
En redes distribuidas, esa misma inferencia podría costar entre un 45 y un 75% menos, y para cualquiera que esté dimensionando un presupuesto de infraestructu
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
He estado pensando en las recientes noticias sobre GLM 5.2 y el enfoque de pesos abiertos que todos están adoptando, pero se están perdiendo un ángulo completamente diferente aquí.
Todos se centran en el hecho de que un laboratorio chino alcanzó un rendimiento de nivel fronterizo y lo publicó como código abierto, pero la parte que vale la pena considerar es cómo. ZAI y el resto de los laboratorios chinos fueron desconectados de Nvidia a principios de 2025, por lo que presumiblemente no han tenido H100 ni H200 directamente desde entonces.
Cruzaron $128B con un modelo entrenado probablemente co
GLM11,38%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
El 95% de la capacidad de GPU empresarial está actualmente inactiva.
Esa cifra proviene de Cast AI midiendo 23,000 clústeres de producción reales, no de una encuesta genérica.
El uso promedio fue del 5% y esto sucede en el mismo momento en que Nvidia aumentó los precios del H200 en un 15%, el primer incremento en 20 años. La hardware que todos dicen que es escaso está mayormente sin hacer nada.
Si estás tratando de entender por qué parece imposible conseguir capacidad de cómputo, esta es la razón. Nadie devuelve una asignación por la que esperaron meses. Entonces, la flota se mantiene al
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Algunos grandes movimientos en la política de IA de la UE supuestamente están por venir, pero aquí está la realidad de la infraestructura con la que trabajan.
> Gasto en infraestructura de IA soberana de la UE en 2026: 12.600 millones de dólares.
> Capex de hyperscalers en EE. UU. en el mismo año: 725 mil millones de dólares.
Europa gastó seis años construyendo 19 Fábricas de IA y 14 supercomputadoras y solo Amazon gastará más en ese esfuerzo en dos semanas este año.
La mayoría de los equipos de IA europeos no usan infraestructura europea. Alquilan de Virginia y Iowa y pagan una prima por cump
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
No esperaba que este número apareciera este año.
GitHub está en camino de alcanzar 14 mil millones de commits en 2026 hasta ahora.
Eso es un aumento de 1 mil millones en 2025.
Un incremento de 14 veces en un solo año y la mayor parte no la escriben humanos.
La carga se volvió tan severa que Microsoft, que posee y opera la segunda nube más grande del mundo, tuvo que enrutar el tráfico a través de AWS para mantener la plataforma en línea.
Nueve incidentes de servicio solo en mayo.
La disponibilidad cayó al 88.4%.
Para cada equipo de ingeniería, proveedor de infraestructura y provee
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Los ingresos de Nvidia son la prueba de que la “computación agentica” no es una teoría. Ya está en el estado de resultados.
$26B hace cuatro años. 215.900 millones de dólares el año pasado. Ese aumento de 8 veces ocurrió mientras la mayoría de la IA todavía estaba en un cuadro de chat esperando que le preguntaras algo.
La parte importante no es solo el crecimiento. Es que Nvidia convirtió su arquitectura en la entrada no negociable para la hoja de ruta de casi todos los demás. Laboratorios, nubes, empresas. Diferentes logotipos en la API, el mismo silicio debajo. Casi cada dólar gastado en
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
No esperaba que la cifra de cinco años de Goldman fuera tan grande.
Se proyecta que cinco hyperscalers gasten 5.3 billones de dólares en infraestructura de IA entre 2025 y 2030.
En 2022 gastaron $162B en total.
Este año están en camino de alcanzar los 725 mil millones de dólares.
Para 2027, los analistas proyectan 1 billón en un solo año.
Para cualquiera que esté construyendo productos o infraestructura de IA fuera de estos cinco balances, esta trayectoria es el número más importante en sus supuestos de planificación.
La brecha entre lo que pueden desplegar y lo que todos los demá
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Todos predijeron que la IA tomaría el control del trabajo administrativo repetitivo primero. Los datos dicen algo diferente.
La toma de decisiones ahora representa el 28% de la actividad de IA en el lugar de trabajo. El caso de uso número uno no es la automatización. Es el juicio.
Las personas usan IA para analizar opciones, sopesar compromisos y apoyar conclusiones de las que son responsables y ese cambio importa más allá de la cuestión del mercado laboral.
Las cargas de trabajo basadas en juicio funcionan continuamente, requieren más contexto por sesión y no se agrupan de manera eficie
Ver original
post-image
  • Recompensa
  • 1
  • Republicar
  • Compartir
Millionairetasks:
Gran oportunidad para que todos sean
Infraestructura global en la nube en el primer trimestre de 2026. 129 mil millones de dólares en un solo trimestre. Creciendo un 35% año tras año.
El mercado se está expandiendo rápidamente pero la concentración no está cambiando. AWS, Azure y Google Cloud tenían aproximadamente la misma participación hace dos años que hoy, pero la brecha absoluta entre ellos y todos los demás es más amplia en términos de dólares que nunca antes.
Esa es la parte que el gráfico de porcentajes no muestra. La porción de Otros no está creciendo hacia una verdadera alternativa. Se mantiene proporcionalmente igu
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
PJM opera la red eléctrica en 13 estados de EE. UU. y 65 millones de personas. Es el mercado mayorista de electricidad competitivo más grande del mundo.
Su precio de liquidación del mercado de capacidad, la tasa que indica si el suministro de energía futuro puede satisfacer la demanda, ha pasado de $28.92 por MW en 2024 a $329.17 en 2026. Dos ciclos de subasta.
La demanda de los centros de datos se identifica como el principal impulsor. La subasta de 2027/2028 se liquidó en $333.44, con PJM atribuyendo directamente 5,100 MW del aumento de carga a los centros de datos.
Eso no es una conmo
Ver original
post-image
  • Recompensa
  • 2
  • Republicar
  • Compartir
DiveNate:
2026 GOGOGO 👊
Ver más
Dos números de este gráfico.
Precio de la API de IA: bajó un 96% desde 2022.
Capex de hyperscaler: aumentó 12 veces en el mismo período.
La mayoría de la gente ve el primer número y lo llama democratización, pero nadie está construyendo una estrategia en torno al segundo.
Eso no es una coincidencia. Eso es una jugada de captura estructural.
Cada startup de IA que celebra modelos baratos está funcionando con computación que no poseen, en infraestructura que no pueden replicar, controlada por tres empresas.
La IA soberana comienza con infraestructura soberana. Todo lo demás es solo u
Ver original
post-image
  • Recompensa
  • 1
  • Republicar
  • Compartir
Yuhuan:
gsgsgshsokzkzkzkxhxj
Lo que el viernes reveló no es que los gobiernos puedan cerrar modelos de IA.
Es que toda la base de usuarios global de los modelos más capaces del mundo se encuentra detrás de una sola decisión operativa de una sola empresa que responde a una sola directiva. Sin redundancia ni advertencia.
Tres de las empresas de IA más grandes controlan actualmente el 88% del acceso a la IA de frontera y una superficie de cumplimiento para todo ello.
Lo que hizo visible el viernes es que cuando el acceso a la computación y a los modelos se encuentra dentro de un puñado de empresas, toda la pila hereda
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
En 2024, el mapa de computación de IA tenía dos superpotencias. EE. UU. con 53.7 GW, China con 31.9 GW.
En 2026, China está en 2.5 GW.
Eso es una demolición controlada de la capacidad de infraestructura de IA de una nación a través de políticas de exportación. Sin bombas, sin sanciones, solo reglas de chips.
Lo que esto demuestra es que la computación ahora es un arma geopolítica. Cualquier país que no posea su infraestructura no quiere descubrir cómo se siente estar en el extremo receptor de esa arma.
La pregunta no es si la computación descentralizada gana. Es si llega antes de que l
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
La mayor oferta pública inicial tecnológica de los 2000 fue Visa con 28 mil millones de dólares. La más grande de los 2010 fue Alibaba con 168 mil millones de dólares. Aproximadamente 6 veces por década.
Ahora extienda la línea. OpenAI y Anthropic cada uno ya están en $1T incluso antes de cotizar.
Si sumas los mayores debuts tecnológicos de los últimos 25 años. Alibaba, Facebook, Uber, Rivian, Snowflake, Palantir, Cerebras, CoreWeave, todos ellos. Obtienes aproximadamente 800 mil millones de dólares.
Solo OpenAI + Anthropic valen casi 2 billones de dólares. Todavía en privado. 2.5 veces más g
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Durante la mayor parte de la historia, el capital se expandía a través de máquinas.
Ahora se expande a través de la cognición.
Una startup puede despertarse con el equivalente a un millón de analistas, investigadores, programadores y estrategas trabajando en paralelo a un costo marginal cercano a cero.
La revolución de la IA es diferente a cualquier revolución técnica anterior.
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
  • Fijado