Согласно репортажу The Decoder, а также практическим наблюдениям платформ для отслеживания затрат на ИИ, таких как Finout и ClaudeCodeCamp, Claude Opus 4.7, который Anthropic запустила в середине этого месяца, хотя и сохраняет официальную ставку $5 долл. за ввод / $25 долл. за вывод за миллион токенов, новый токенизатор режет тот же самый текст на большее количество токенов — в испытаниях наблюдался рост на 1,47 раза для английского и кода, а средние результаты тестов сообщества также показывают рост затрат на +37,4%. Для корпоративных пользователей это спорная ситуация с ИИ-ценообразованием в 2026 году: «прайс-лист rate card не менялся, а счёт вырос».

Официальный верхний предел 1,35x сталкивается с результатом испытаний 1,47x

Официальная документация Anthropic признаёт, что новый токенизатор Opus 4.7 заставляет тот же фрагмент текста разбиваться на больше токенов; официальный диапазон ratio, который приводится, составляет 1,0–1,35 раза (то есть максимум +35%). Но несколько независимых тестов дали разные результаты: Finout при измерении на реальных корпоративных промптах получил 1,47x, ClaudeCodeCamp в сценарии технической документации также наблюдал 1,47x, а сводная оценка сообщества в среднем составила +37,4%. Разница связана с типом текста, использованного в тестах — сильнее всего затрагиваются плотные документы на английском и код.

Переводим в реальные затраты: раньше в Opus 4.6 один prompt, в котором 1,000 входных token + 500 выходных token, в 4.7 превращается примерно в 1,370–1,470 входных token + 685–735 выходных token. Даже если стоимость за токен полностью одинаковая, итоговый счёт по запросу увеличится на 37–47%.

Логика бизнес-модели использует token как скрытый рычаг цены

Это не единичный случай, а структурная проблема бизнес-модели ИИ. Единица ценообразования у LLM-поставщиков — «за токен», но то, «сколько информации соответствует одному токену», полностью контролируется поставщиком: изменение токенизатора, адаптация алгоритма кодирования, изменение словаря — всё это заставляет один и тот же контент соответствовать разному числу токенов. Иными словами, ИИ-поставщики могут реализовать реальное повышение цены без изменения rate card — за счёт обновления токенизатора.

Корпоративные закупки ИИ в последние годы использовали «стоимость за токен» как основной индикатор для сравнения, но кейс Opus 4.7 показывает, что этот показатель неполный. Реальный контроль затрат должен смотреть на «общее потребление токенов для выполнения одного бизнес-задания» — при сравнении между моделями сначала нужно делать token-calibrated benchmark (с одним и тем же входом по задаче и наблюдением фактического расхода токенов у каждой модели).

Конкретное влияние на закупочные контракты компаний

Для организаций, которые уже подписали корпоративные контракты Anthropic, требуется немедленно проверить три аспекта: во-первых, не растут ли необычно ежемесячные расходы из-за обновления модели; во-вторых, не содержатся ли в контракте условия с обязательным обновлением «версии модели»; в-третьих, есть ли у компании внутри именно per-task token tracking для мониторинга затрат на ИИ, а не только мониторинг общего числа токенов за день. На этой неделе Anthropic также официально запустила оплату по факту для корпоративной версии; эти два фактора в сумме могут привести к тому, что ИИ-бюджеты компаний столкнутся с непредвиденным перерасходом в двузначных процентах.

Прозрачность ценообразования на ИИ станет новой темой для отрасли

Спор вокруг токенизатора Opus 4.7 может породить новые стандарты отраслевого саморегулирования: требования к поставщикам публиковать изменения token ratio при обновлении модели или требования к тому, чтобы фиксированный токенизатор оставался неизменным в течение некоторого времени. Для AI-индустрии, которая уже «пожирает» 80% глобального венчурного капитала, недостаток прозрачности приблизит внимание надзорных органов — такие структуры, как американская FTC и европейский DMA, уже начали уделять внимание теме «скрытого удорожания» цифровых услуг. Для компаний по закупкам и для разработчиков среди читателей Wade это не абстрактная тема, а цифры на счетах уже в следующем месяце.

Эта статья «Claude Opus 4.7 скрытое повышение цен: новый токенизатор заставляет тот же текст потреблять на 37–47% больше token, тариф не меняется, а счёт становится дороже» впервые появилась на Цепной новостной ABMedia.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

OpenClaw, Hermes и SillyTavern подтверждены как поддерживаемые в рамках GLM Coding Plan

Новости индустрии ИИ

Менеджер по продукту Zhipu AI Ли объявляет OpenClaw, Hermes и SillyTavern поддерживаемыми проектами по плану GLM Coding Plan; другие инструменты будут оцениваться в каждом конкретном случае. Не делитесь учетными данными и не используйте подписки в качестве доступа к API; обратитесь в поддержку по вопросу с ошибкой 1313. Менеджер по продукту Zhipu AI Ли объявил, что OpenClaw, Hermes и SillyTavern официально поддерживаются в рамках GLM Coding Plan, а другие инструменты будут оцениваться в каждом конкретном случае. В заметке говорится, что не следует делиться учетными данными или использовать подписки как доступ к API, и предлагается пользователям с ошибкой 1313 обратиться в поддержку.

GateNews1ч назад

Генеральный директор Google Cloud: Gemini будет обеспечивать запуск персонализированной Siri от Apple в 2026 году

Новости индустрии ИИ

Резюме: Gemini будет поддерживать персонализированную Apple Siri в 2026 году, созданную на основе моделей Apple Foundation Models и сотрудничества с Gemini; Apple тестирует чатоподобную Siri в iOS 27/macOS 27, которая запланирована к показу на WWDC 2026. Аннотация: Google Cloud's Gemini должен обеспечивать персонализированную Apple Siri к 2026 году, сочетая Gemini с Apple's Foundation Models в рамках сотрудничества примерно на $1 миллиардов. Apple тестирует переработанную, чатоподобную Siri в iOS 27/macOS 27, с интерфейсом Dynamic Island и новыми функциями, до запланированного на WWDC 2026 анонса 8 июня.

GateNews1ч назад

Сделка SpaceX $60B Cursor подливает масла в аргументы СБФ в пользу помилования, поскольку доля $200K FTX теперь стоит $3B

Меры по обеспечению соблюдения Новости индустрии ИИ Инструменты и приложения ИИ

Сообщение Gate News, 22 апреля — сегодня SpaceX объявила о крупном партнерстве с AI-стартапом по программированию Cursor; предусмотрен вариант приобрести компанию за $60 billion. Сделка дала Сэму Бэнкмену-Фриду (SBF), который в настоящее время находится в заключении и добивается президентского помилования, новые аргументы, поскольку она демонстрирует потенциальную восстановительную стоимость, которую, как он давно утверждал, FTX могла бы получить. В апреле 2022 года Alameda Research, торговая фирма, основанная SBF, инвестировала $200,000 в материнскую компанию Cursor Anysphere, приобретя примерно 5% доли. Когда в ноябре 2022 года FTX рухнула, контроль над компанией взял на себя суд по делам о банкротстве. В апреле 2023 года имущество по банкротству FTX продало ту же самую 5%-ю долю за $200,000 — ровно ту же сумму, в которую Alameda инвестировала. Исходя из оценки в billion, объявленной сегодня SpaceX, эта 5%-я доля теперь стоила бы примерно billion, что означает доходность в 15,000x. SBF давно утверждал, что FTX на самом деле не была неплатежеспособной, и что юристы по банкротству уничтожили ценность, продав активы слишком рано. В феврале 2026 года он поделился прогнозами, согласно которым FTX могла бы достичь чистой стоимости активов billion после восстановления активов. Его родители также активно добиваются помилования: в марте они появились на CNN, чтобы утверждать, что клиенты FTX получили полное возмещение. Однако кредиторы отметили, что выплаты были основаны на оценках за 2022 год, а не на текущих рыночных ценах. Президент Трамп заявил, что не помилует SBF, а рынки прогнозов в настоящее время оценивают вероятность помилования в 2026 году лишь в 5%.

GateNews1ч назад

Акции Chegg обрушились на 99%, поскольку ИИ нарушает рынок Edtech

Акции Новости индустрии ИИ

Кратко: Chegg взлетела на фоне спроса на онлайн-образование, затем инструменты на базе ИИ нарушили ее модель, что привело к массовым увольнениям и падению ниже $2, при этом более широкие изменения, обусловленные ИИ, ударили по майнерам криптовалют и финтех-компаниям. Аннотация: В этой статье рассматривается рост Chegg как любимца edtech в эпоху пандемии и ее последующее падение на фоне быстрого внедрения генеративного ИИ, который дает быстрые ответы и подрывает ценностное предложение Chegg. В ней описываются увольнения в 2025 году и обвал акций до уровня, близкого к исключению из листинга, а также опыт Chegg вписывается в более широкий контекст сбоя, вызванного ИИ и меняющего технологический сектор и криптоиндустрию: майнеры Bitcoin переходят к операциям на базе ИИ, а AI-ориентированные стратегии заново определяют конкурентоспособность в финтехе и за его пределами.

CryptoFrontier2ч назад

OpenAI выпустила модель с открытым исходным кодом для обнаружения и редактирования ПДн

Новости индустрии ИИ

Аннотация: Фильтр конфиденциальности OpenAI — это модель с открытым исходным кодом, выполняемая локально, которая обнаруживает и редактирует ПДн (персональные данные) в тексте. Она поддерживает большие контексты, выявляет множество категорий ПДн и предназначена для рабочих процессов с сохранением конфиденциальности, таких как подготовка данных, индексация, логирование и модерация. Фильтр конфиденциальности OpenAI — это локально запускаемая модель с открытым исходным кодом (128k-token context), которая обнаруживает и редактирует ПДн (персональные данные) в тексте, охватывая контактные, финансовые и учетные данные для рабочих процессов по защите конфиденциальности.

GateNews2ч назад

OpenAI планирует развернуть 30 ГВт вычислительных мощностей к 2030 году

Новости индустрии ИИ

OpenAI планирует обеспечить 30 ГВт вычислительных мощностей к 2030 году, чтобы удовлетворить растущий спрос на ИИ, при этом уже завершено 8 ГВт из целевых 10 ГВт на 2025 год. Расширение сигнализирует о стратегии наращивания инфраструктуры для разработки и развертывания ИИ следующего поколения. OpenAI намерена достичь 30 ГВт вычислительных мощностей к 2030 году, чтобы удовлетворить растущий спрос на ИИ, уже завершив 8 ГВт из целевого показателя 10 ГВт на 2025 год. Действие отражает стратегическое расширение инфраструктуры для поддержки разработки и развертывания ИИ следующего поколения.

GateNews2ч назад

комментарий

0/400

Нет комментариев