torygreen

vip
Вік 2.8 Рік
Піковий рівень 0
Контент поки що відсутній
Ось розкол в обчисленнях ШІ, який мало хто читає правильно.
Фронтальне навчання концентрується дедалі сильніше з кожним кварталом — тисячі GPU, які мають сидіти в одному місці, з'єднані докупи. Але навчання складає лише 30% попиту в 2026 році. Інші 70% — це інференс, і його запуск на гіперскейлері означає платити за інфраструктуру, створену для найважчого навантаження, щоб виконувати найлегше.
На розподілених мережах той самий інференс може бути на 45-75% дешевшим, і для будь-кого, хто складає бюджет на інфраструктуру ШІ, цей розрив і є всією історією.
Навчання централізується з необхідності.
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Помірковую над нещодавніми новинами про GLM 5.2 і підхід з відкритими вагами, який усі обговорюють, але вони пропускають зовсім інший кут зору.
Усі зосередилися на тому, що китайська лабораторія досягла продуктивності на рівні передових моделей і опублікувала її з відкритим кодом, але варто замислитися над тим, як це сталося.
ZAI та інші китайські лабораторії були відрізані від Nvidia на початку 2025 року, тож, імовірно, з того часу вони не мають прямих поставок H100 чи H200.
Вони досягли $128B на моделі, навченій, імовірно, на китайському кремнії, яка лише на кілька пунктів відстає від перед
GLM-3,53%
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
95% потужності корпоративних GPU зараз просто без діла.
Це число взято з Cast AI, який виміряв 23 000 реальних виробничих кластерів, а не з загального опитування.
Середнє використання становило 5%, і це трапляється саме в той момент, коли Nvidia підвищила ціну H200 на 15%, перше підвищення за 20 років. Апаратура, яку всі вважають дефіцитною, здебільшого нічого не робить.
Якщо ви намагаєтеся зрозуміти, чому обчислювальні ресурси здаються майже недосяжними, ось чому. Ніхто не повертає виділення, на яке чекали місяцями. Тому флот залишається на рівні 5%, оплачуючися за годину, і дефіцит сам себе
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Деякі великі кроки у політиці штучного інтелекту ЄС, ймовірно, з’являться, але ось реальність інфраструктури, з якою вони працюють.
> Витрати на суверенну інфраструктуру ШІ в ЄС у 2026 році: 12,6 мільярда доларів.
> Капітальні витрати американських гігантів у тому ж році: 725 мільярдів доларів.
Європа витратила шість років на створення 19 фабрик ШІ та 14 суперкомп’ютерів, і лише Amazon цього року витратить більше на це за весь цей час за два тижні.
Більшість європейських команд з ШІ не використовують європейську інфраструктуру. Вони орендують з Вірджинії та Айови і платять премію за відповідні
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Я не очікував, що ця цифра з’явиться цього року.
GitHub має за мету 14 мільярдів комітів у 2026 році на даний момент.
Це зросло з 1 мільярда у 2025 році.
14-кратне зростання за один рік, і більшість з цього не пишуть люди.
Навантаження стало настільки серйозним, що Microsoft, яка володіє та керує другим за величиною хмарним сервісом на Землі, змушена була маршрутизувати трафік через AWS, щоб підтримувати платформу онлайн.
Лише у травні стало дев’ять інцидентів із сервісами.
Доступність знизилася до 88,4%.
Для кожної інженерної команди, постачальника інфраструктури та хмарного про
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Дохід Nvidia — це доказ того, що «агентний обчислювальний процес» не є теорією. Він вже відображений у звіті про доходи.
$26B чотири роки тому. 215,9 мільярда доларів минулого року. Це 8-кратне зростання сталося, поки більшість ШІ все ще сиділа у чат-боті, чекаючи, коли ви запитаєте її щось.
Важливо не лише зростання. Це те, що Nvidia перетворила свою архітектуру у незмінний вхід для майже всіх інших дорожніх карт. Лабораторії, хмари, підприємства. Різні логотипи на API, під ним — одна й та сама кремнієва основа. Майже кожен долар, витрачений на інфраструктуру ШІ у цьому циклі, просочувавс
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Я не очікував, що п’ятирічне число Goldman буде таким великим.
П’ять гіперскалерів, за прогнозами, витратять 5,3 трильйона доларів на інфраструктуру штучного інтелекту з 2025 по 2030 рік.
У 2022 році вони витратили $162B разом.
Цього року вони йдуть за графіком на 725 мільярдів доларів.
До 2027 року аналітики прогнозують 1 трильйон доларів за один рік.
Для тих, хто створює продукти або інфраструктуру штучного інтелекту поза цими п’ятьма балансами, ця траєкторія є найважливішим числом у ваших планувальних припущеннях.
Розрив між тим, що вони можуть розгорнути, і тим, до чого мають
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Усі передбачали, що штучний інтелект спершу візьме на себе рутинну адміністративну роботу. Дані говорять про щось інше.
Прийняття рішень тепер становить 28% активності штучного інтелекту на робочому місці.
Найперший випадок використання — це не автоматизація. Це судження.
Люди використовують ШІ для аналізу варіантів, зважування компромісів і підтримки висновків, за які вони несуть відповідальність, і цей зсув має значення поза межами ринку праці.
Робочі навантаження, засновані на судженнях, працюють безперервно, потребують більше контексту за сесію і неефективно групуються.
Інфрастру
Переглянути оригінал
post-image
  • Нагородити
  • 1
  • Репост
  • Поділіться
Millionairetasks:
Велика можливість для кожного бути
Глобальна хмарна інфраструктура за перший квартал 2026 року. 129 мільярдів доларів за один квартал. Зростає на 35% у порівнянні з попереднім роком.
Ринок швидко розширюється, але концентрація не змінюється. AWS, Azure і Google Cloud займали приблизно ту саму частку два роки тому, що й сьогодні, але абсолютна різниця між ними та всіма іншими є ширшою у доларовому вираженні, ніж будь-коли раніше.
Саме цю частину не показує графік у відсотках. Сегмент "Інші" не зростає у справжню альтернативу. Він залишається пропорційно таким самим, тоді як три гіперскейлери додають десятки мільярдів у абсол
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
PJM керує електричною мережею у 13 штатах США та для 65 мільйонів людей. Це найбільший у світі конкурентний оптовий ринок електроенергії.
Ціна на ринку капітальних витрат, ставка, яка сигналізує, чи зможе майбутнє постачання електроенергії задовольнити попит, зросла з $28.92 за МВт у 2024 році до $329.17 у 2026 році. Два цикли аукціонів.
Попит на дата-центри визначено як основного драйвера. Аукціон 2027/2028 просто закінчився на рівні $333.44, причому PJM прямо приписує 5100 МВт збільшення навантаження дата-центрам.
Це не шок пропозиції або геополітична подія. Це розгортання ШІ, що вража
Переглянути оригінал
post-image
  • Нагородити
  • 2
  • Репост
  • Поділіться
DiveNate:
2026 ГОДИНОЮ ГОДИНОЮ 👊
Дізнатися більше
Два числа з цієї діаграми.
Ціна API штучного інтелекту: знизилася на 96% з 2022 року.
Капіталовкладення гіперскалерів: зросли у 12 разів за той самий період.
Більшість людей бачать перше число і називають це демократизацією, але ніхто не будує стратегію навколо другого.
Це не випадковість. Це структурна гра на захоплення.
Кожен стартап у сфері штучного інтелекту, який святкує дешеві моделі, працює на обчислювальних ресурсах, якими він не володіє, на інфраструктурі, яку він не може відтворити, під контролем трьох компаній.
Суверенний ШІ починається з суверенної інфраструктури. Все і
Переглянути оригінал
post-image
  • Нагородити
  • 1
  • Репост
  • Поділіться
Yuhuan:
gsgsgshsokzkzkzkxhxj
Те, що виявила п’ятниця, полягає не в тому, що уряди можуть закрити доступ до моделей ШІ.
Це в тому, що вся глобальна база користувачів найпотужніших моделей світу знаходиться за одним операційним рішенням однієї компанії, яка реагує на одну директиву. Без резерву або попередження.
Три з найбільших компаній у галузі ШІ наразі контролюють 88% доступу до передових моделей ШІ і один канал відповідності для всього цього.
Що зробила видимим п’ятниця, так це те, що коли обчислювальні ресурси та доступ до моделей зосереджені в кількох компаніях, вся структура успадковує їхню єдину точку відмови
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
У 2024 році карта обчислень штучного інтелекту мала дві супердержави. США — 53,7 ГВт, Китай — 31,9 ГВт.
У 2026 році Китай становить 2,5 ГВт.
Це контрольована демонтаж інфраструктури штучного інтелекту країни через експортну політику. Ніяких бомб, ніяких санкцій, лише правила щодо чіпів.
Що це доводить, так це те, що обчислювальна потужність тепер є геополітичною зброєю. Будь-яка країна, яка не володіє своєю інфраструктурою, не хоче дізнаватися, як це — бути на приймальній стороні цієї зброї.
Питання не в тому, чи переможе децентралізоване обчислення. Питання в тому, чи воно надійде ран
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Найбільший технологічний IPO 2000-х років був Visa на 28 мільярдів доларів. Найбільший у 2010-х — Alibaba на 168 мільярдів доларів. Приблизно у 6 разів на десятиліття.
Тепер продовжте цю лінію. OpenAI та Anthropic кожен вже на $1T навіть перед виходом на біржу.
Якщо підсумувати найбільші технологічні дебюти останніх 25 років. Alibaba, Facebook, Uber, Rivian, Snowflake, Palantir, Cerebras, CoreWeave, всі вони. Ви отримуєте приблизно 800 мільярдів доларів.
OpenAI + Anthropic самі по собі варті майже 2 трильйони доларів. Ще приватні. В 2,5 рази більше, ніж квартал століття найбільших лістингів У
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Більшу частину історії капітал розширювався за допомогою машин.
Зараз він масштабується через когнітивні здібності.
Стартап може прокинутися з еквівалентом мільйона аналітиків, дослідників, програмістів і стратегів, що працюють паралельно з майже нульовими додатковими витратами.
Революція штучного інтелекту відрізняється від будь-якої попередньої технічної революції.
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
ти не можеш піднімати питання за відкритою статутною документацією і вважати відкриту частину необов’язковою, коли гроші вже з’явилися
судовий процес почався з питання: чи можете ви створити неприбуткову організацію, назвати її місією openai, залучити 10 років інженерів, орієнтованих на місію, та капітал для пожертвувань на цій обіцянці, а потім перейти до структури з обмеженим прибутком і назвати це еволюцією?
елон залишив openai у 2018 році. збитки, які він просить від $130b , йдуть неприбутковій організації. що б ви не думали про нього як про позивача, питання, яке справа змушує внести
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
nvidia тепер більша за всю економіку Японії, і ваш рахунок за ШІ — це причина
кожен долар, який ви зараз витрачаєте на ШІ, проходить через чіпи однієї компанії, на трьох хмарах, які перепродають їх з націнкою
> стартапи з ШІ спалюють близько 80% залученого капіталу лише на оренду обчислювальних ресурсів
> я бачив команди на стадії посіву, які платять 700 тисяч доларів на місяць одному постачальнику чіпів
> дата-центри працюють на 12-18% потужності, тоді як ваш рахунок зростає кожен квартал
вся індустрія просто погодилася стояти в одній черзі і передавати гроші тому ж платному пункту пропуску
є
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
громада, яка вважає, що штучний інтелект вже переобтяжений, ніколи не намагалася купити h100 цього кварталу
протягом тижня, намагаючись купити h100 зараз, означає: 12-місячна зобов’язання в aws (24/7 використання заблоковане до того, як ви побачите навіть один gpu), очікування в списку GCP без ETA, lambda і coreweave обидва розпродані, кожен менший провайдер дає вам ту саму відповідь різними словами
будівництво гіперскалерів вимірюється роками, дефіцит процесорів затримує існуючі gpu, а попит продовжує зростати, поки гіперскалери подають дозволи
команди штучного інтелекту на початковій с
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Очевидно, Nvidia тихо відвідала корейські компанії з обладнання для енергопостачання, просячи їх перепроектувати інфраструктуру дата-центрів навколо архітектури постійного струму 800 В.
Це визнання того, що централізована модель штучного інтелекту досягла фізичної межі, кожне нове покоління чипів тепер вимагає оновлення підстанції десь у ланцюжку.
Глобальні дата-центри вже працюють із завантаженням від 12 до 18 відсотків. Майнинг-ферми криптовалют мають потужні GPU, що залишаються без діла після злиття Ethereum. Споживацькі ігрові системи з 4090 стоять незадіяними на столах цілий день.
Недоста
ETH-2,70%
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Багато людей все ще проектують архітектуру навколо обчислювальної залежності, яка з часом зникла
qwen3 32b, наприклад, зараз працює на розподілених спільних GPU, конвеєрний паралелізм виконується між вузлами, жоден оператор не контролює, без дозволу інференція через відкритий інтернет
три рівні, всі відкриті: відкриті ваги (alibaba їх випустила), обчислення без дозволу (спільне обладнання, без опіки), відкритий транспорт (відсутність приватного кластера, відсутній API-обмежувач). власність не застосовується до жодного з них
модель мислення, що інференція, здатна до фронтиру, вимагає гіперскейл
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
  • Закріплено