Мирово известная игра дополненной реальности Pokémon Go разработана компанией Niantic. Подразделение AI компании Niantic — Niantic Spatial — использует миллиарды городских изображений, снятых игроками за годы, для создания системы визуальной локализации и AI-модели мира, способных понимать реальный мир. Эта технология обеспечивает точное позиционирование в городских условиях с нестабильным GPS-сигналом и уже тестируется совместно с компанией по доставке роботов, открывая новые возможности для навигации роботов и AI в реальной среде.
Игровые изображения Pokémon Go используются для обучения AI и построения модели мира на основе городских фотографий
С момента запуска в 2016 году Pokémon Go быстро стал популярной игрой по всему миру, позволяя игрокам с помощью камеры смартфона ловить покемонов в реальном мире. Эта известная AR-игра, разработанная Niantic, несмотря на многолетний возраст, сохраняет более 100 миллионов активных игроков ежегодно.
Однако, чтобы играть, игроки постоянно направляют камеры смартфонов на городские здания и достопримечательности, что случайно накопило огромный объем изображений.
Недавно компания Niantic Spatial заявила, что собрала и систематизировала около 30 миллиардов фотографий городских сред со всего мира, содержащих точные геолокационные и съемочные данные, такие как направление телефона, скорость движения и угол съемки. Эти данные используются для обучения AI и построения «модели мира» (World Model), которая способна понимать реальное пространство.
(Глубокий анализ: Недостатки LLM? Почему Ян Ликун делает ставку на путь «Модели мира»)
Визуальная система позиционирования против GPS: AI определяет точное местоположение по изображениям зданий
По сообщению NewsForce, новая технология Niantic Spatial — это система визуальной локализации (Visual Positioning System, VPS). Эта AI-модель анализирует фотографии зданий или достопримечательностей, чтобы определить местоположение пользователя с точностью до сантиметров.
Компания заявила, что база данных уже содержит более миллиона геолокационных точек по всему миру. В каждом месте собрано тысячи изображений, снятых в разное время, с разных ракурсов и при различных погодных условиях. AI сравнивает эти изображения по признакам, чтобы определить местоположение и направление взгляда устройства, обеспечивая достаточно точное позиционирование.
Технический директор Niantic Spatial Брайан Макклелланд отметил, что это отличается от традиционного GPS, который зависит от спутниковых сигналов. VPS использует «видение» окружающей среды:
В густонаселенных городах GPS часто дает погрешности, достигающие десятков метров или даже неправильных направлений.
Такая погрешность не критична для обычных пользователей, но для роботов, которым нужна высокая точность навигации, это может стать серьезной проблемой. Поэтому технология позиционирования с помощью изображений — важное решение для робототехники.
От игр с поиском покемонов до доставки: роботы начинают использовать технологии Niantic
В настоящее время Niantic Spatial сотрудничает с компанией по доставке роботов Coco Robotics для тестирования этой технологии. В США и Европе установлено около 1000 роботов для доставки еды и товаров. Эти роботы по размеру напоминают небольшие чемоданы и могут перевозить до 8 больших пицц или 4 пакета товаров.
Компания сообщила, что за время работы было выполнено более 500 тысяч доставок, однако иногда из-за неточности GPS роботы не могут точно остановиться у входа в ресторан или у двери клиента:
Используя визуальную систему позиционирования Niantic, роботы могут с помощью четырех встроенных камер анализировать окружающую среду для более точного определения местоположения и направления движения, повышая надежность доставки.
Наступление эпохи роботов: Niantic планирует создать «живую карту»
Генеральный директор Niantic Spatial Джон Хэнке отметил, что изначально технология визуальной локализации разрабатывалась для поддержки AR-очков и приложений дополненной реальности, но с быстрым развитием робототехники компания начала адаптировать ее для навигации роботов.
Он рассказал, что создается система под названием «Живая карта» (Living Map), которая представляет собой высокоточно и постоянно обновляемую цифровую модель мира, способную адаптироваться к изменениям в реальности.
В будущем доставка, умные устройства и даже AR-устройства могут стать источниками данных для этой карты, постоянно передавая информацию об окружающей среде и приближая цифровой мир к динамическому состоянию реальности.
AI и понимание реального мира: «Модель мира» — новая технологическая тенденция
В последние годы в области AI все больше внимания уделяется концепции «Модели мира» (World Model). Несмотря на успехи больших языковых моделей (LLM) в обработке текста и знаний, у них остаются ограничения в понимании физических пространств и реальных условий.
Объединяя карты, изображения и информацию об окружающей среде, модели мира позволяют AI понять объекты, пространственные отношения и изменения в окружении. Компании вроде Google DeepMind разрабатывают модели, способные создавать виртуальные миры для обучения AI-агентов.
Niantic Spatial использует иной подход: собирая огромный объем реальных изображений, она постепенно восстанавливает цифровую модель реального мира. По мере накопления данных эта система может стать важной инфраструктурой для будущего понимания реальности роботами и AI.