Автор: Haotian
Проснулся после сна, многие друзья попросили меня посмотреть на manus, который называется глобальным по-настоящему универсальным AI Agent, способным самостоятельно мыслить и планировать выполнение сложных задач, а также предоставлять полные результаты. Звучит очень круто, но помимо беспокойства друзей о потере работы в социальных сетях, что он принесет взрывной рост в сфере веб-3 DeFi?
Примерно месяц назад OpenAI выпустил аналогичный продукт Operator, искусственный интеллект может самостоятельно выполнять задачи, такие как бронирование столов, покупки, заказ билетов, заказ еды на вынос и т. д. в браузере, пользователи могут визуально наблюдать и в любой момент перехватить контроль.
Появление этого агента вызвало немного обсуждений из-за того, что он работает на основе одной модели или вызывает набор инструментов. Когда пользователи понимают, что им все равно нужно вмешиваться в ключевые решения, они теряют уверенность в идее выполнения задач.
2)Manus на первый взгляд тоже не отличается слишком сильно, просто имеет больше сценариев использования, включая фильтрацию резюме, исследование акций, покупку недвижимости и т. д., но на самом деле это различие в основе и системе исполнения, Manus, который поддерживается многомодовыми крупными моделями, и инновационно использует систему множественных подписей.
Другими словами, искусственный интеллект должен имитировать цикл PDCA (планирование-выполнение-проверка-действие), который выполняется человеком. Этот цикл будет завершаться совместным усилием нескольких крупных моделей, каждая из которых будет специализироваться на определенном этапе. Такой подход снизит риск принятия решений одной моделью и увеличит эффективность выполнения задач. Механизм “многократной подписи” на самом деле представляет собой механизм проверки решений, основанный на сотрудничестве нескольких моделей, что обеспечит надежность принимаемых решений и их выполнение.
3)В сравнении с этим, преимущества manus, очевидно, выделяются, плюс серия операций, продемонстрированных в видеодемонстрации, действительно придают непревзойденный опыт. Но объективно говоря, итерационные инновации Manus для оператора лишь начало и не достигают революционного значения.
Ключевой момент заключается в сложности выполнения задачи и определении уровня отказоустойчивости и успешности доставки крупной модели после ввода пользовательского ввода Prompt, а также нестандартизированного стандарта. В противном случае, можно ли сразу же применить этот набор инноваций к сценарию DeFai веб-3 и сделать его зрелым приложением? Очевидно, это еще не удается:
Например: в сценарии DeFai агент должен принимать решения о сделках, для этого необходим агент уровня Oracle, ответственный за сбор и проверку данных на цепи, их анализ, а также мониторинг цен на цепи для поиска сделок. Этот процесс представляет большие вызовы для реального времени анализа, возможно, что возможность сделки, которая была актуальной секунду назад, исчезнет после передачи большой модели Oracle исполняющему агенту сделок (окно арбитража);
Это на самом деле выявляет один из крупнейших уязвимых мест в таких многофункциональных крупных моделях для принятия решений - как подключиться к сети, привлечь цепочку для анализа данных уровня реального времени и выявить торговые возможности для последующего захвата. Сетевая среда в целом неплоха, многие цены заказов на сайтах электронной коммерции не изменяются в реальном времени, что не является серьезной проблемой для всей работы многофункционального сотрудничества, но если речь идет о цепочке, такие вызовы практически постоянно существуют.
Эту ситуацию нужно объективно понимать в контексте влияния web3 на сценарии применения DeFai.
Нельзя не признать, что это имеет огромное значение, в конце концов, идеи LLM OS и Less Structure more intelligence, особенно множественные подписи, дадут значительные вдохновляющие идеи для сочетания DeFi и искусственного интеллекта в web3.
Это фактически исправляет серьезное заблуждение большинства проектов DeFai: не следует сразу же пытаться достичь сложных целей автономного мышления и принятия решений AI-агента с помощью одной большой модели, это вообще не соответствует реальности в финансовой сфере.
Реализация истинного видения DeFai требует решения сложных проблем, таких как пределы возможностей одиночной модели ИИ, обеспечение атомарности многообразного взаимодействия и сотрудничества, единое распределение и управление ресурсами многообразных систем, механизмы обработки ошибок и сбоев системы и многое другое.
Например: слой Oracle Agent, отвечающий за сбор данных с цепи, анализ и мониторинг цен, обеспечивает эффективный источник данных;
Агент управленческого уровня анализирует и оценивает риски на основе данных, поступающих от Oracle, и разрабатывает набор решений и план действий;
Агент уровня исполнения работает в соответствии с различными решениями, предоставленными уровнем принятия решений, и учитывает фактическую ситуацию, включая оптимизацию платы за газ, межсетевой статус, конфликты сортировки транзакций и т. д.
Только когда вся серия агентов будет синхронизирована и установится обширная системная структура, наступит настоящая революция в DeFai.