Penulis: Haotian
Setelah bangun tidur, banyak teman meminta saya untuk melihat manus, yang diklaim sebagai agen AI yang benar-benar universal secara global, mampu berpikir mandiri dan merencanakan serta melaksanakan tugas-tugas kompleks, dan memberikan hasil yang lengkap. Terdengar sangat keren, tetapi selain suara kekhawatiran di lingkaran banyak teman tentang kehilangan pekerjaan, apa yang akan dibawa ke dalam ledakan besar-besaran dalam skenario web3 DeFai? Berikut ini adalah pemikiran saya:
Sebulan yang lalu, OpenAI meluncurkan Operator, produk sejenis, di mana AI dapat menyelesaikan tugas seperti pemesanan restoran, berbelanja, memesan tiket, pesan antar makanan secara mandiri di browser. Pengguna dapat melakukan supervisi secara visual dan mengambil alih kendali kapan saja.
Kehadiran agen ini tidak banyak dibahas, alasannya adalah karena ia didorong oleh model tunggal, atau kerangka kerja yang memanggil alat, pengguna kehilangan kepercayaan pada ide bahwa mereka perlu campur tangan untuk keputusan kunci yang diperlukan untuk menyelesaikan tugasnya.
2)meskipun Manus tampaknya tidak jauh berbeda, hanya saja memiliki banyak skenario aplikasi tambahan, termasuk penyaringan resume, penelitian saham, pembelian properti, dan lain-lain, tetapi sebenarnya perbedaannya terletak pada kerangka dan sistem eksekusi di belakangnya, Manus didorong oleh model besar multimodal, dan secara inovatif mengadopsi sistem tanda tangan ganda.
Singkatnya, AI harus meniru tindakan siklus PDCA (rencana-eksekusi-pemeriksaan-tindakan) yang dilakukan oleh manusia, akan diselesaikan melalui kolaborasi beberapa model besar, setiap model fokus pada tahap tertentu, yang dapat menurunkan risiko keputusan tugas model tunggal, dan juga meningkatkan efisiensi eksekusi. Sistem tanda tangan ganda sebenarnya adalah mekanisme verifikasi keputusan kolaboratif model, yang memastikan keandalan keputusan dan eksekusi dengan meminta konfirmasi bersama dari beberapa model ahli.
3)Dengan membandingkannya, keunggulan manus jelas terlihat, ditambah dengan serangkaian pengalaman operasi yang ditampilkan dalam video Demo, membuat orang benar-benar merasakan pengalaman yang luar biasa. Namun secara objektif, inovasi iteratif manus terhadap operator hanyalah permulaan, belum mencapai arti revolusi yang mengguncang.
Titik kunci terletak pada kompleksitas pelaksanaan tugasnya, serta definisi tingkat kesalahan dan tingkat keberhasilan pengiriman model besar setelah pengguna input Prompt non-uniform masuk. Jika tidak, apakah dengan inovasi ini, skenario DeFai web3 bisa segera menjadi aplikasi yang matang? Tampaknya masih belum bisa:
Misalnya: Di bawah skenario DeFai, Agent harus membuat keputusan perdagangan, memerlukan seorang Agen Oracle di lapisan untuk mengumpulkan dan memvalidasi data rantai, melakukan analisis integrasi data, serta memantau harga rantai secara real-time untuk menangkap peluang perdagangan. Proses ini menantang untuk analisis real-time, karena peluang perdagangan yang berguna mungkin sudah tidak ada dalam satu detik sebelum model besar Oracle dikirimkan ke Agen eksekusi perdagangan (jendela arbitrase);
Ini sebenarnya mengekspos kelemahan terbesar dari model besar multimodal semacam ini dalam pengambilan keputusan, yaitu bagaimana menyambungkan, mengaitkan, dan mengambil analisis data pada tingkat Real-Time, lalu menganalisis peluang perdagangan dari data tersebut, dan kemudian menangkap peluang perdagangan. Lingkungan penyambungan sebenarnya tidak terlalu sulit, sebagian besar harga pesanan di situs e-commerce tidak berubah secara real-time, sehingga tidak menyebabkan ketidakseimbangan dinamis yang besar pada kerja sama multimodal secara keseluruhan. Namun, jika berada dalam jaringan, tantangan semacam ini hampir selalu ada.
Jadi, secara keseluruhan, kemunculan manus memang akan menimbulkan kecemasan di lingkungan web2, terutama karena banyak pekerjaan administratif dan pemrosesan informasi yang tinggi kemungkinan akan diambil alih oleh kecerdasan buatan (AI). Tapi biarkan mereka merasa cemas.
Peran inisiatif ini dalam mendorong aplikasi DeFi di web3 harus dipahami secara obyektif oleh kita:
Harus diakui: artinya pasti sangat penting, setelah semua, konsep LLM OS yang diajukan dan konsep Less Structure more intelligence, terutama sistem tanda tangan ganda, akan memberikan inspirasi yang besar bagi pengembangan DeFi dan kombinasi AI di web3.
Ini sebenarnya memperbaiki kesalahpahaman besar dalam sebagian besar proyek DeFai, jangan langsung bergantung pada model besar untuk mencapai tujuan yang kompleks seperti pemikiran otonom AI Agent + pengambilan keputusan, ini sama sekali tidak sesuai dengan situasi keuangan.
Pencapaian visi DeFai yang sebenarnya memerlukan penyelesaian masalah kompleks seperti batasan kemampuan model AI tunggal, jaminan atomisitas interaksi kolaboratif multimodal, koordinasi dan kontrol sumber daya yang seragam pada sistem multimodal, serta mekanisme penanganan kesalahan dan kegagalan sistem.
Misalnya, agen lapisan Oracle bertanggung jawab untuk mengumpulkan data dan analisis on-chain, memantau harga, dan membentuk sumber data yang efektif;
Pihak pengambil keputusan Agent, menganalisis dan mengevaluasi risiko berdasarkan data yang diberikan oleh Oracle, dan merancang serangkaian keputusan dan rencana tindakan;
Agennya lapisan pelaksana, akan mengeksekusi berbagai skenario yang diberikan oleh lapisan pengambil keputusan, sambil mempertimbangkan situasi aktual, termasuk optimisasi biaya gas, status lintas-rantai, konflik urutan transaksi, dan lain-lain.
Hanya jika Seri Agent ini kuat secara bersamaan dan memiliki kerangka sistem yang besar, revolusi DeFai yang sebenar akan berlaku.