Google запускает Gemma 4 с открытым исходным кодом: «локальный вывод» усиливает эффективность рабочих процессов ИИ-агентов

ChainNewsAbmedia

2026-04-03 03:24:51

Google официально выпустила Gemma 4 2 апреля 2026 года, являющуюся одной из самых мощных открытых моделей на сегодняшний день. Gemma 4 достигла значительных прорывов в области нативных вызовов функций, агентских рабочих процессов и мультимодального восприятия, а также использует коммерчески дружественную лицензию Apache 2.0, предоставляя разработчикам и компаниям по всему миру беспрецедентную свободу и гибкость.

Что такое Gemma 4? Основные особенности — в одном обзоре

Gemma 4 — это серия открытых крупных языковых моделей, разработанных Google DeepMind, объединяющая технологии, разделяемые с моделями серии Gemini. Основные преимущества включают:

Продвинутые возможности рассуждения: поддержка многошагового планирования и глубокого логического вывода, значительно превосходя аналогичные открытые модели по математическим задачам и соблюдению инструкций.

Нативные агентские рабочие процессы: встроенные вызовы функций, структурированный вывод JSON и поддержка системных команд, позволяющие напрямую управлять автономными ИИ-агентами и выполнять многошаговые задачи.

Локальное развертывание: версии E2B и E4B оптимизированы для мобильных устройств и других платформ, полностью работая офлайн.

Полная мультимодальная поддержка: все версии поддерживают входные данные в виде изображений и видео; версии E2B и E4B дополнительно поддерживают нативный аудиовход.

Длинный контекстный окно: модели на периферии поддерживают 128K токенов, крупные модели — до 256K токенов, что позволяет передавать целые кодовые базы или длинные документы за один запрос.

Высококачественное программирование: поддержка офлайн-кодирования, превращая личную рабочую станцию в локального помощника по программированию на базе ИИ.

Поддержка более 140 языков: обучение на более чем 140 языках по всему миру, помогая разработчикам создавать многоязычные приложения для международных пользователей.

Четыре модели — максимальная поддержка всех сценариев использования

Gemma 4 представлена четырьмя версиями, оптимизированными для различных аппаратных сред и сценариев:

Effective 2B (E2B): предназначена для мобильных устройств и IoT, поддерживает окно контекста 128K, нативный аудиовход, полностью работает офлайн на Android, Raspberry Pi и других периферийных устройствах.

Effective 4B (E4B): также оптимизирована для периферийных устройств, обладает мультимодальными возможностями, достигая отличного баланса между производительностью рассуждений и использованием памяти.

26B MoE (смесь экспертов): активирует только 3,8 миллиарда параметров при рассуждениях, обеспечивая сверхнизкую задержку и высокую скорость, подходит для локальных рабочих станций, ориентированных на пропускную способность.

31B Dense: флагманская модель, занимает третье место в рейтинге Arena AI по текстам, обеспечивает максимально качественный вывод и может полностью работать на одной видеокарте NVIDIA H100 объемом 80 ГБ.

Квантизации моделей 26B MoE и 31B Dense позволяют запускать их нативно на потребительских видеокартах, делая мощные возможности ИИ доступными для индивидуальных разработчиков на настольных ПК.

Значительный прорыв в локальном выводе: прощание с API

Одной из самых заметных особенностей Gemma 4 является акцент на «локальном (on-device)» выводе. Модели E2B и E4B специально разработаны для максимизации эффективности вычислений и использования памяти, что позволяет запускать их с минимальной задержкой на мобильных устройствах, Raspberry Pi, NVIDIA Jetson Orin Nano и других периферийных платформах.

Это существенно влияет на разработчиков: ранее вызовы облачных API требовали затрат за каждый запрос и сопровождались задержками сети и рисками утечки данных. Возможность локального вывода в Gemma 4 позволяет запускать модели на собственном оборудовании, значительно снижая расходы на API и сохраняя полный контроль над данными и возможность работы в офлайн-режиме.

Google тесно сотрудничает с командой Pixel, а также с Qualcomm, MediaTek и другими партнерами по мобильным аппаратным средствам, чтобы обеспечить оптимальную работу E2B/E4B на популярных Android-устройствах, а также предоставляет разработчикам Android предварительный просмотр AICore Developer Preview для интеграции Gemini Nano 4.

Усиление агентских рабочих процессов и нативные вызовы функций для повышения эффективности

Gemma 4 также реализовала нативную поддержку агентских рабочих процессов (Agentic Workflows), что является одним из самых заметных улучшений по сравнению с предыдущим поколением. Модель поддерживает:

Нативные вызовы функций (Function Calling): модель может напрямую вызывать внешние инструменты и API, выполнять реальные операции, такие как запросы к базам данных или вызовы сторонних сервисов.

Структурированный вывод JSON: обеспечивает соответствие вывода модели заданному формату, что облегчает интеграцию с бэкенд-системами.

Нативные системные инструкции (System Instructions): разработчики могут задавать поведение модели на системном уровне, делая роль ИИ-агента более стабильной и предсказуемой.

Эти возможности позволяют Gemma 4 стать универсальным автономным ИИ-агентом, который не только отвечает на вопросы, но и активно взаимодействует с инструментами и автоматически выполняет многошаговые рабочие процессы.

Мультимодальное расширение: визуальные, аудио и длинные тексты — всё в одном

Все серии моделей Gemma 4 обладают нативной мультимодальной поддержкой, значительно расширяя спектр возможных задач.

Изображения и видео

В области визуального восприятия все модели поддерживают нативную обработку изображений и видео, поддерживают переменное разрешение и показывают отличные результаты в задачах OCR (оптическое распознавание символов) и понимания графиков.

Аудио

В части аудио модели E2B и E4B дополнительно поддерживают нативный вход звука, что позволяет напрямую выполнять распознавание речи и понимание без дополнительных этапов преобразования.

Длинный контекст

В документации периферийные модели поддерживают окно контекста до 128K токенов, а крупные — до 256K, что позволяет передавать целые кодовые базы или длинные документы за один запрос.

Офлайн-кодирование

Поддержка высококачественного офлайн-кодирования, превращая личную рабочую станцию в локального помощника по программированию на базе ИИ.

Поддержка более 140 языков

Обучение на более чем 140 языках по всему миру помогает разработчикам создавать многоязычные приложения для глобальной аудитории.

Лицензия Apache 2.0: важный этап в открытом сообществе

Gemma 4 распространяется под лицензией Apache 2.0, которая является одной из самых дружественных к коммерческому использованию лицензий в открытом сообществе. Разработчики и компании могут свободно использовать, модифицировать и распространять модели, независимо от того, развертывают ли их на частных инфраструктурах, в гибридных облаках или интегрируют в коммерческие продукты, без дополнительных ограничений.

Богатая экосистема поддержки

Gemma 4 поддерживается основными инструментами индустрии, включая Hugging Face (Transformers, TRL, Transformers.js), Ollama, vLLM, llama.cpp, MLX, LM Studio, NVIDIA NIM и NeMo, Keras, Vertex AI и другие.

Разработчики могут напрямую скачивать веса моделей через Hugging Face, Kaggle или Ollama, а также тестировать версии 31B и 26B MoE онлайн в Google AI Studio или через Google AI Edge Gallery с помощью E2B и E4B.

Для крупных предприятий Google Cloud предлагает полноценные облачные решения, включая Vertex AI, Cloud Run, GKE, Sovereign Cloud и TPU для ускоренного вывода, устраняя ограничения локальных вычислительных мощностей.

Снижение затрат без потери возможностей: Gemma 4 — новый выбор для разработчиков

Выпуск Gemma 4 — важная веха в развитии открытых моделей ИИ. Как инструмент корпоративного уровня с возможностью промышленного развертывания, он способен работать офлайн на мобильных устройствах, вызывать внешние инструменты для выполнения задач, обрабатывать длинные документы и мультимодальные входные данные, при этом оставаясь доступным для всех.

Для разработчиков и компаний, стремящихся снизить расходы на API и одновременно сохранять мощность ИИ, Gemma 4 предлагает очень привлекательный путь.

Эта статья о запуске Google открытой модели Gemma 4: «Локальный вывод» для повышения эффективности агентских рабочих процессов впервые опубликована на ABMedia.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

комментарий

0/400

Нет комментариев