Я чув новини про запуск нової моделі штучного інтелекту від команди засновників miHoYo на початку цього місяця. Називається Anuttacon, вона випущена з LPM 1.0 — технологією створення відео персонажів у реальному часі, яка досить цікава.



З того, що я бачив, ця модель підтримує повноцінні відео-аудіо розмови. Вона легко говорить, співає, слухає та реагує одночасно. Відзначається реалістичністю деталей, таких як рух губ, міміка та рухи тіла, що робить її більш природною.

З технічної точки зору, LPM 1.0 використовує 17 мільярдів параметрів і налаштована для стрімінгової версії з низькою затримкою. Ще один цікавий аспект — підтримка різноманітних стилів персонажів, від реалістичних, 2D-анімації, 3D-ігор до істот, що не є людьми, без додаткової налаштування. Команда також представила LPM-Bench — стандарт оцінки поведінки персонажів.

Порівняно з конкурентами, застарілі обмеження, такі як можливість створення лише 30 секунд відео, були зняті. LPM 1.0 підтримує необмежений час виводу, що підходить для NPC у іграх та трансляцій у віртуальній реальності.

Варто зазначити, що Anuttacon чітко заявив, що цей запуск є академічним обміном. Наразі немає планів щодо надання API або публічних продуктів. Однак спільнота вважає, що це може бути способом залучення фахівців у галузі штучного інтелекту.

Насправді, це ще один крок Цай Хаою у розвитку штучного інтелекту після того, як miHoYo раніше займалася інструментами AI та чат-ботами. Здається, напрямок розвитку AI для ігрових рушіїв та розумних NPC у miHoYo входить у нову стадію.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити