¿Qué traerá Manus al boom de web3 DeFai?

robot
Generación de resúmenes en curso

La realización de la verdadera visión de DeFai requiere abordar problemas complejos como el límite de capacidad del modelo AI monolítico, la garantía de la atomicidad de la interacción colaborativa multimodal, la coordinación y el control unificado de recursos en sistemas multimodales, así como mecanismos de tolerancia a fallos y manejo de fallos, entre otros.

Escrito por: Haotian

Al despertar, muchos amigos me pidieron que viera #manus, que se autodenomina un Agente de IA verdaderamente universal a nivel mundial, capaz de pensar de forma independiente, planificar y ejecutar tareas complejas, y entregar resultados completos. Suena muy genial, pero aparte de las voces ansiosas en las redes sociales que temen perder sus trabajos, ¿qué traerá consigo el gran avance en el escenario web3 DeFai? A continuación, compartiré mis reflexiones:

Hace aproximadamente un mes, OpenAI lanzó Operator, un producto similar en el que la IA puede completar tareas como reservar restaurantes, compras, reservar boletos, pedir comida para llevar, etc., de forma independiente en el navegador. Los usuarios pueden supervisar de forma visual y tomar el control en cualquier momento.

La aparición de este Agente no ha sido ampliamente discutida, debido a que se trata de un solo modelo impulsado, o un marco de herramientas de llamada, cuando los usuarios piensan en la intervención necesaria para decisiones clave, pierden la idea de depender de su ejecución de tareas.

2)manus en apariencia no difiere mucho, solo que tiene muchos más casos de uso, como la selección de currículums, la investigación de acciones, la compra de propiedades, etc., pero en realidad la diferencia radica en el marco y el sistema de ejecución subyacentes. Manus está impulsado por un gran modelo multimodal e innovador, y utiliza un sistema de firma múltiple.

En resumen, la IA debe imitar el ciclo PDCA (Planificar - Ejecutar - Verificar - Actuar) realizado por personas, que será completado por varios grandes modelos trabajando juntos. Cada modelo se enfocará en una etapa específica, lo que no solo reducirá el riesgo de toma de decisiones por parte de un solo modelo, sino que también mejorará la eficiencia de la ejecución. El llamado sistema de “firma múltiple” es en realidad un mecanismo de verificación de decisiones cooperativas de varios modelos, que garantiza la fiabilidad de la toma de decisiones y la ejecución al requerir la confirmación conjunta de varios modelos especializados.

3)Al comparar de esta manera, las ventajas de manus obviamente se destacan, junto con una serie de experiencias operativas mostradas en el demo de video, realmente brindan una experiencia extraordinaria. Sin embargo, objetivamente hablando, la innovación iterativa de Manus para el Operador es solo el comienzo y no alcanza un significado revolucionario disruptivo.

El punto clave radica en la complejidad de sus tareas de ejecución, así como en la definición de la tolerancia a fallos y la tasa de éxito en la entrega de los grandes modelos después de que los usuarios input Prompt no estén sujetos a un estándar unificado. De lo contrario, ¿se puede aplicar de inmediato este conjunto de innovaciones para que el escenario DeFai de web3 sea maduro? Obviamente, aún no se puede lograr:

Por ejemplo, en el escenario DeFai, el Agente debe tomar decisiones comerciales y necesitará un Agente de capa Oracle para recopilar y verificar datos en la cadena, realizar análisis e integración de datos, y monitorear en tiempo real la captura de oportunidades comerciales basadas en precios en la cadena. Este proceso representa un gran desafío para el análisis en tiempo real, ya que una oportunidad comercial que era válida hace un segundo puede desaparecer una vez que el gran modelo Oracle se transmite al Agente de ejecución de transacciones (ventana de arbitraje).

Esto revela en realidad la mayor debilidad de este tipo de grandes modelos multimodales para tomar decisiones ejecutivas: cómo conectar, activar y analizar datos a nivel de Real-Time, identificar oportunidades comerciales y capturar transacciones. El entorno de conexión no es tan malo, muchos sitios web de comercio electrónico no tienen precios de pedido que cambien en tiempo real, lo que no representa un gran desafío dinámico para la colaboración multimodal en su conjunto. Sin embargo, si se trata de una cadena, este tipo de desafío está presente casi en todo momento.

4)Por lo tanto, en general, la aparición de manus realmente causará ansiedad en el círculo de amigos en el campo de web2, después de todo, muchos trabajos de oficina y trabajos de procesamiento de información con alta repetitividad podrían enfrentar el riesgo de ser reemplazados por la inteligencia artificial. Pero los hace ansiosos.

La importancia de este asunto en el impulso de los escenarios de aplicación de DeFai en web3 debe ser reconocida objetivamente:

Hay que admitir: definitivamente tiene un gran significado, ya que introduce el concepto de LLM OS y Less Structure more intelligence, especialmente el sistema de firmas múltiples, que sin duda proporciona ideas inspiradoras para la combinación de DeFi y AI en el mundo web3.

Esto en realidad corrige un gran malentendido en la mayoría de los proyectos DeFai, no se debe confiar en un gran modelo para lograr objetivos complejos como el pensamiento autónomo y la toma de decisiones del agente de IA, lo cual no es práctico en absoluto en el contexto financiero.

La realización de la visión verdadera de DeFai requiere abordar problemas complejos como el límite de capacidad del modelo de IA monolítico, la garantía de atomicidad en la interacción y colaboración multimodal, la asignación y control unificados de recursos en sistemas multimodales, y mecanismos de tolerancia a fallos y manejo de errores, entre otros.

Por ejemplo, el Agente de Capa Oracle, es responsable de recopilar y analizar datos en la cadena, monitorear precios y formar una fuente de datos efectiva;

La capa de toma de decisiones del agente, analiza y evalúa el riesgo según los datos proporcionados por Oracle, y desarrolla un conjunto de decisiones y planes de acción;

El agente de nivel de ejecución, de acuerdo con las múltiples soluciones proporcionadas por la capa de toma de decisiones y considerando la situación real, realiza la ejecución, incluida la optimización de los costos de gas, el estado entre cadenas, conflictos de orden de transacción, etc.

Solo cuando toda esta serie de Agent esté sincronizada y respaldada por un marco de sistema sólido, se iniciará una verdadera revolución DeFai.

AGENT0,29%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • بالعربية
  • Português (Brasil)
  • 简体中文
  • English
  • Español
  • Français (Afrique)
  • Bahasa Indonesia
  • 日本語
  • Português (Portugal)
  • Русский
  • 繁體中文
  • Українська
  • Tiếng Việt