Согласно официальному документу Anthropic о выводе моделей из эксплуатации, Claude Haiku 3 (ID модели: claude-3-haiku-20240307) был официально прекращён и больше не обслуживается с 19 апреля 2026 года. После этой даты все API-запросы к данной модели напрямую будут возвращать ошибку; Anthropic не будет автоматически направлять трафик на новую версию, и разработчикам необходимо заранее обновить ID модели в коде до Haiku 4.5. Это первое в этом году крупное событие завершения жизненного цикла для модели Claude.

В основном затронуты лёгкие приложения

Claude Haiku 3 был представлен в марте 2024 года и в тот период был самым дешёвым и быстрым моделем у Anthropic; он широко использовался для часто выполняемых, но относительно лёгких задач, таких как чат-боты для поддержки клиентов, суммаризация, классификация, модерация контента. Сегодня, спустя два года, многие небольшие и средние SaaS и внутренние инструменты всё ещё продолжают использовать эту модель, поскольку prompt и стоимость были глубоко настроены, а замена требует повторного прохождения QA. Предупреждение о текущем выводе началось ещё с февраля; Anthropic через официальные уведомления, email и предупреждения в dashboard направил всем корпоративным клиентам по контрактам как минимум за 60 дней.

Две деструктивные (ломающие) правки при переходе на Haiku 4.5

Официально рекомендованная замена — Claude Haiku 4.5, но миграция — это не просто замена строки. Разработчикам нужно учесть две деструктивные правки: во-первых, параметры выборки temperature и top_p теперь допускают только один из двух вариантов — если в существующем коде для обоих параметров заданы явные значения, API Anthropic вернёт ошибку; во-вторых, в Haiku 4.5 добавлена refusal stop reason — при отказе модели отвечать она возвращает этот маркер, а не напрямую error или placeholder, как в Haiku 3 — продуктовый код должен обрабатывать refusal как нормальный сценарий.

Кроме того, на прошлой неделе возник спор из‑за изменений tokenizer для Opus 4.7, приведших к скрытому росту счетов; аналогичный подход может применяться и к Haiku 4.5 — даже если в rate card указана более низкая цена за per-token, фактическое потребление токенов в бизнес-задачах может отличаться из‑за различий tokenizer. Рекомендуется всем планам миграции провести тестирование и сравнение затрат именно в день переключения.

Управление жизненным циклом AI-моделей становится обязательным курсом для предприятий

Данное уведомление о выводе из эксплуатации указывает на структурное изменение в AI-инфраструктуре компании: LLM перешли от этапа «разовой покупки» к этапу «постоянного управления версиями», аналогично облачным сервисам и операционным системам. На странице deprecation от Anthropic также одновременно анонсировано, что Claude Opus 4 и Sonnet 4 будут выведены из эксплуатации 15 июня 2026 года — сроки плотные. В условия закупок AI для предприятий следует включить контрактные пункты вроде «минимального периода поддержки», «автоматически доступная замена модели» и «субсидии на миграционные тесты», иначе производственные сервисы могут быть прерваны из‑за снятия модели с обслуживания.

Рекомендации по действиям для разработчиков из Тайваня и команд SaaS

Три действия, которые нужно выполнить немедленно: во‑первых, найдите все репозитории кода и конфигурационные файлы и замените claude-3-haiku-20240307 на claude-haiku-4-5; во‑вторых, проверьте, не задаются ли в API-вызовах одновременно temperature и top_p — сохраните только один из вариантов; в‑третьих, в handler добавьте ветку обработки для refusal stop reason, чтобы избежать непредвиденных ошибок для конечных пользователей. Для организаций с контрактами по модели тарификации «pay-as-you-go» также необходимо отслеживать изменение расхода токенов в неделю переключения, чтобы избежать неожиданных перерасходов из‑за различий tokenizer.

В этой статье написано, что Claude Haiku 3 официально снят с обслуживания 4/19: Anthropic принудительно переводит на Haiku 4.5, и разработчикам нужно изменить ID модели и настройки параметров — самое раннее упоминание в 鏈新聞 ABMedia.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Генеральный директор Google Cloud: Gemini будет обеспечивать запуск персонализированной Siri от Apple в 2026 году

Новости индустрии ИИ

Резюме: Gemini будет поддерживать персонализированную Apple Siri в 2026 году, созданную на основе моделей Apple Foundation Models и сотрудничества с Gemini; Apple тестирует чатоподобную Siri в iOS 27/macOS 27, которая запланирована к показу на WWDC 2026. Аннотация: Google Cloud's Gemini должен обеспечивать персонализированную Apple Siri к 2026 году, сочетая Gemini с Apple's Foundation Models в рамках сотрудничества примерно на $1 миллиардов. Apple тестирует переработанную, чатоподобную Siri в iOS 27/macOS 27, с интерфейсом Dynamic Island и новыми функциями, до запланированного на WWDC 2026 анонса 8 июня.

GateNews20м назад

Сделка SpaceX-Cursor $60B предоставляет новые доказательства в поддержку аргументов СБФ о помиловании

Новости индустрии ИИ

Аннотация SpaceX объявляет партнерство $60 миллиарда с Cursor с опционом на приобретение, формируя ходатайство СБФ о помиловании, поскольку ранняя доля Cursor у Alameda сегодня могла бы стоить примерно $3 миллиарда. Материал рассматривает утверждения СБФ о неплатежеспособности, публичные действия его родителей, возражения кредиторов и крайне малые шансы на помилование. Краткое содержание Сделка SpaceX-Cursor подпитывает ходатайство СБФ о помиловании; доля Alameda $200k составила бы ~ $3B сегодня (15,000x). СБФ утверждает о неплатежеспособности FTX; рынки показывают низкие шансы на помилование; Трамп вряд ли помилует.

GateNews28м назад

Акции Chegg обрушились на 99%, поскольку ИИ нарушает рынок Edtech

Акции Новости индустрии ИИ

Кратко: Chegg взлетела на фоне спроса на онлайн-образование, затем инструменты на базе ИИ нарушили ее модель, что привело к массовым увольнениям и падению ниже $2, при этом более широкие изменения, обусловленные ИИ, ударили по майнерам криптовалют и финтех-компаниям. Аннотация: В этой статье рассматривается рост Chegg как любимца edtech в эпоху пандемии и ее последующее падение на фоне быстрого внедрения генеративного ИИ, который дает быстрые ответы и подрывает ценностное предложение Chegg. В ней описываются увольнения в 2025 году и обвал акций до уровня, близкого к исключению из листинга, а также опыт Chegg вписывается в более широкий контекст сбоя, вызванного ИИ и меняющего технологический сектор и криптоиндустрию: майнеры Bitcoin переходят к операциям на базе ИИ, а AI-ориентированные стратегии заново определяют конкурентоспособность в финтехе и за его пределами.

CryptoFrontier38м назад

OpenAI выпустила модель с открытым исходным кодом для обнаружения и редактирования ПДн

Новости индустрии ИИ

Аннотация: Фильтр конфиденциальности OpenAI — это модель с открытым исходным кодом, выполняемая локально, которая обнаруживает и редактирует ПДн (персональные данные) в тексте. Она поддерживает большие контексты, выявляет множество категорий ПДн и предназначена для рабочих процессов с сохранением конфиденциальности, таких как подготовка данных, индексация, логирование и модерация. Фильтр конфиденциальности OpenAI — это локально запускаемая модель с открытым исходным кодом (128k-token context), которая обнаруживает и редактирует ПДн (персональные данные) в тексте, охватывая контактные, финансовые и учетные данные для рабочих процессов по защите конфиденциальности.

GateNews1ч назад

OpenAI планирует развернуть 30 ГВт вычислительных мощностей к 2030 году

Новости индустрии ИИ

OpenAI планирует обеспечить 30 ГВт вычислительных мощностей к 2030 году, чтобы удовлетворить растущий спрос на ИИ, при этом уже завершено 8 ГВт из целевых 10 ГВт на 2025 год. Расширение сигнализирует о стратегии наращивания инфраструктуры для разработки и развертывания ИИ следующего поколения. OpenAI намерена достичь 30 ГВт вычислительных мощностей к 2030 году, чтобы удовлетворить растущий спрос на ИИ, уже завершив 8 ГВт из целевого показателя 10 ГВт на 2025 год. Действие отражает стратегическое расширение инфраструктуры для поддержки разработки и развертывания ИИ следующего поколения.

GateNews1ч назад

Агент 360 для обнаружения уязвимостей на базе ИИ находит почти 1 000 нулевых дней с эксплойтом, конкурируя с Mythos

ИИ-агент Новости индустрии ИИ

Агент на базе ИИ от 360 Digital Security утверждает, что нашёл около 1 000 новых уязвимостей, включая в Office и OpenClaw; сейчас ИИ является ключевым для обнаружения и подготовки цепочек эксплуатации, соперничая с Mythos. Абстракт: В отчёте, на который ссылается Bloomberg, говорится, что Vulnerability Discovery Agent компании 360 Digital Security на базе ИИ выявил почти 1 000 ранее неизвестных уязвимостей за последние месяцы, включая уязвимости в Microsoft Office и в фреймворке OpenClaw. Компания заявляет, что ИИ стал основным движком для обнаружения уязвимостей, и объявила об инструменте на базе ИИ, который ускорит построение цепочек эксплуатации. Бенинкаса описывает 360 как конкурента Mythos от Anthropic на основе обзора китайскоязычных анонсов компании, сделанного Natto Thoughts.

GateNews1ч назад

комментарий

0/400

Нет комментариев