Des experts du secteur se réunissent pour réfléchir et se démarquer à l'ère des Agents IA

null

Aujourd’hui, l’économie des agents n’est plus un concept de science-fiction : ce qu’elle apporte, ce n’est pas seulement un bond en efficacité, mais aussi une refonte des modes d’organisation économique et une redistribution. En particulier, le projet open source OpenClaw est devenu viral à l’échelle mondiale, ce qui a en outre accéléré le passage des grands modèles, du laboratoire vers des applications à grande échelle, et incite toutes les parties à se ruer dans une « bataille des entrées Agent ».

Alors, quel grand modèle faut-il choisir ? Les ressources en jetons (Token) peuvent-elles suffire pour un usage à long terme ? Ne pas suivre la tendance d’OpenClaw (homard) signifie-t-il être éliminé par le temps ? Dans cette transformation de l’IA qui évolue à toute vitesse, comment un individu peut-il s’y retrouver et percer ?

Avec ces questions en tête, le 3 avril, Xu Jia Hui Innovation & Créativité, l’Association shanghaïenne pour la technologie de consensus distribuée, PANews et le cabinet d’avocats Man Kun ont conjointement organisé un événement thématique intitulé « Ne soyez pas anxieux à propos du “homard” ».

Lors de la conférence thématique « Accueillir la vague d’IA imprévisible », Li Chenxing, architecte en chef de Tree Graph (Conflux), a déclaré qu’en ce stade, la tendance inévitable consiste à donner davantage d’autonomie à l’IA plutôt qu’à trop la contraindre avec l’expérience limitée des humains. Les problèmes actuels d’« absence de considération » de l’IA résident essentiellement dans sa difficulté à capter de manière stable et à mémoriser durablement des contraintes clés de contexte dans des scénarios complexes. Du point de vue de l’architecture technique, l’IA s’appuie principalement sur la mémoire par paramètres, la mémoire de contexte et la mémoire externe, mais ces mécanismes rencontrent encore des difficultés de mise à jour, des fenêtres limitées et une efficacité de sollicitation insuffisante. Par conséquent, à l’avenir, il faut renforcer en priorité les capacités d’appel de mémoire externe, explorer des mécanismes d’apprentissage continu et de réutilisation d’expériences, et faire mûrir progressivement une mémoire de type expérientiel via la pratique dans des domaines verticaux, afin d’améliorer l’intégralité et la fiabilité des décisions de l’IA dans des scénarios réels complexes.

Il a aussi indiqué que les progrès clés actuels de l’IA se reflètent principalement dans l’amélioration des capacités d’analyse autonome et de réflexion ; à l’avenir, avec le renforcement des capacités de mémoire, il est possible de lever des goulots d’étranglement critiques et d’avoir un impact profond sur tous les secteurs. Par exemple, à l’heure actuelle, le potentiel des systèmes d’identité numérique et de paiement numérique est longtemps limité par les seuils de développement et d’utilisation ; l’IA pourrait libérer sa valeur en réduisant les coûts de développement et en remplaçant l’apprentissage des utilisateurs par des agents. De façon générale, l’IA ne devrait pas être considérée comme une menace pour l’emploi, mais comme un outil clé pour améliorer la productivité et faire naître de nouvelles opportunités ; les individus et les secteurs devraient garder un esprit ouvert et explorer activement les voies de l’intégration de l’IA.

Selon Feng Heqing, architecte produit de Workbuddy de Tencent Cloud, à mesure que les capacités des grands modèles augmentent de manière significative, l’IA est passée d’un stade initial où elle ne prenait en charge que des aides basiques comme l’auto-complétion de code, à une capacité à accomplir seule des tâches complexes. Parmi elles, la capacité fondamentale des agents personnalisés se manifeste par la prise en charge de tâches de bout en bout, la collaboration à plusieurs rôles, un système de mémoire en couches et la décomposition intelligente des tâches fondée sur le contexte ; en outre, grâce à la collaboration multi-agents, on peut assurer le transfert de données entre tâches et le traitement parallèle, et, sur le plan de la sécurité, utiliser un stockage de données local et un mécanisme de confirmation humaine pour les opérations critiques afin de garantir la sécurité des données. Au niveau de l’application, WorkBuddy couvre déjà des scénarios de travail de bureau typiques comme la sélection de CV, la génération automatique de PPT, l’analyse de données et l’intégration des rapports hebdomadaires ; et grâce à des capacités d’intégration au niveau entreprise, il peut s’interfacer avec des systèmes comme Qiye Weixin, pour assurer une gestion unifiée des tâches. Son architecture technique met l’accent sur un développement full-stack en interne, l’isolement de l’environnement d’exécution et un contrôle des droits au niveau entreprise ; elle prend en charge le déploiement local et dans le cloud. Côté modèle commercial, il peut s’adresser aux entreprises en研发 (développement) et aux utilisateurs occupant des postes de travail numérique à haute fréquence. Dans l’ensemble, WorkBuddy vise à améliorer la productivité des entreprises grâce aux capacités d’agents personnalisés et de collaboration multi-tâches ; et en optimisant en continu la capacité de décomposition des tâches et en élargissant l’écosystème, il renforce encore son adéquation et sa capacité de mise en œuvre dans des scénarios d’entreprise complexes.

Les fondateurs de Biteye et de XHunt, Teddy, ont principalement partagé des sujets tels que la pratique des « employés numériques », les applications des grands modèles et les problèmes de coûts, la configuration technique et les risques de sécurité, ainsi que l’optimisation des modes de collaboration. En ce qui concerne la pratique des employés numériques, pour réduire les hallucinations du modèle et le taux d’erreurs de code, il est nécessaire d’introduire des agents d’examen plus avancés pour effectuer une seconde vérification du code généré par des agents de niveau inférieur, afin de mettre en place un processus d’évaluation de code obligatoire ; comme des bugs existent encore dans l’écriture de code par les agents à l’heure actuelle, on peut réduire les erreurs via des processus de développement standardisés, en renforçant la conception des prompts, et en ajoutant des mécanismes de validation sur plusieurs tours. Dans les scénarios opérationnels, il faut surtout contrôler la fréquence de publication et, autant que possible, passer par des API backend pour une planification unifiée afin de garantir la stabilité. Dans des environnements de collaboration d’équipes complexes, Discord est généralement plus adapté que Telegram pour la collaboration des agents et la distribution des tâches ; en plus, pour la gestion des ressources, il faut faire particulièrement attention à la consommation de Token. Par ailleurs, les systèmes d’agents nécessitent encore que les humains investissent du temps pour l’entraînement, l’ajustement et la correction du comportement.

Concernant l’installation et le déploiement d’OpenClaw, Teddy recommande de l’exécuter sur des ordinateurs inutilisés ou sur un Mac Mini ; il dispose d’un niveau élevé de contrôle autonome, l’ensemble du code est open source, met l’accent sur la protection de la confidentialité, et peut être connecté à un écosystème internationalisé, mais son installation et sa configuration présentent des seuils relativement élevés. Pendant l’utilisation, il faut faire particulièrement attention aux risques de modification du modèle et de la configuration des chaînes (channels), afin d’éviter tout dysfonctionnement du système causé par une configuration incorrecte. En cas de problème, on peut s’appuyer sur des outils comme Grok et Gemini pour aider au diagnostic. Par ailleurs, du point de vue de la sécurité, il faut se prémunir contre des risques tels que l’attaque par prompts et l’injection malveillante de compétences (malicious skill injection). En matière de ressources et de coûts, il faut également surveiller le contrôle de la consommation de Token pour éviter des coûts d’exécution trop élevés.

Le partenaire avocat du cabinet Man Kun, Zhao Xuan, dans son discours thématique, a présenté trois grands problèmes juridiques et leurs solutions que les entrepreneurs doivent prendre en compte à l’ère de l’IA. Le premier concerne l’enveloppe externe de l’organisation : la « séparation fictive » créée par une société d’une personne (OPC). En apparence, elle forme une entité indépendante, mais en réalité, il est difficile de véritablement isoler la responsabilité et les risques ; il faut mettre en place une séparation physique et juridique réelle, y compris, au niveau de l’architecture, l’introduction de partenaires, l’utilisation d’une carte de crédit bancaire d’entreprise dédiée, et l’insertion dans les contrats d’un avertissement concernant les disclaimers de l’IA et d’un plafond d’indemnisation. Le deuxième concerne la question de la propriété de l’actif clé : « ne pas lésiner en efforts » ne signifie pas « avoir des droits » ; il faut prouver son autorité de domination, enregistrer intégralement le processus de création et en conserver les preuves. Le troisième concerne le risque systémique du « débranchement » (拔网线) causé par la domination de la plateforme : des clauses « comme celle du Tout-Puissant (God clause) », le verrouillage technologique, etc. Il faut séparer les données essentielles des services tiers, planifier à l’avance des solutions de remplacement, et introduire des technologies décentralisées.

« Du délire à la lucidité : vrais besoins en IA et faux problèmes vus par les VC » : lors de la table ronde, plusieurs investisseurs ont partagé leurs vues sur l’étape de développement de l’IA, les limites d’application et la logique d’investissement, etc.

Juli Crab, fondateur et associé de Waterdrop Capital, estime que l’IA en est encore à ses débuts : pour atteindre vraiment un niveau de maturité de l’expérience utilisateur et être largement considérée comme « utile et significative », il faudra encore plus longtemps. Il a souligné que la vitesse d’itération de la technologie de l’IA est extrêmement rapide ; se contenter d’être en tête sur le plan technologique ne suffit pas à créer une digue durable. Par conséquent, l’investissement devrait davantage se concentrer sur des capacités de base qui ne peuvent pas être remplacées, comme des ressources centrales telles que la puissance de calcul. Au niveau des applications, il a donné un exemple : des outils comme « le homard » ne sont pas adaptés aux utilisateurs ordinaires en programmation, mais à l’avenir, ils pourraient être mieux adaptés à des scénarios verticaux emballés, comme « médecin de famille », offrant des conseils professionnels via des données de santé en temps réel. Il estime également que l’IA côté entreprise peut remplacer des outils de production d’informations comme les rapports de recherche, mais ne peut pas remplacer le rôle final de décision ; elle ne peut exister que comme un outil d’aide à la décision.

Tang Yi, fondateur et associé d’Enlight Capital, a déclaré qu’à l’heure actuelle, il est difficile de former des opportunités clairement non consensuelles dans le domaine de l’investissement en IA, et que la rapide itération des grands modèles pourrait continuer à « aplanir » les avantages des entreprises applicatives. Il est relativement optimiste quant à la direction de la combinaison entre Web3 et IA, pensant que les deux représentent chacun une productivité avancée dans leur domaine respectif. Concernant des outils open source comme OpenClaw, il estime qu’ils donnent en quelque sorte une paire de « mains » et de « pieds » aux grands modèles, renforçant la capacité de connexion avec des systèmes externes et des applications sociales ; mais en même temps, cela entraîne des risques élevés en matière de sécurité et de données. Par conséquent, des configurations complexes sont nécessaires et ce n’est pas adapté aux utilisateurs ordinaires. Pour lui, l’itinéraire le plus idéal consiste à améliorer l’utilisabilité globale et l’expérience via un emballage (encapsulation).

L’investisseur d’First Rule Ventures, Yinghao, a abordé les opportunités d’application à partir des points de vue des utilisateurs et des produits : il s’intéresse aux applications dans le « deep water » (eaux profondes) de l’industrie, à la création par IA, à la combinaison logiciel/matériel, etc., et évalue le potentiel des projets à travers les comportements des utilisateurs et les données d’interaction. Il a indiqué qu’on peut ne pas essayer soi-même tous les nouveaux produits IA, et cela ne signifie pas manquer les tendances clés, car les capacités techniques sont souvent rapidement modulaires et intégrées dans l’écosystème de produits existant.

Par rapport à un seul produit, il s’intéresse davantage à trois changements structurels de long terme : premièrement, si l’interaction avec l’IA est en train de former de nouveaux supports de mémoire, permettant d’ancrer la cognition et le travail des utilisateurs dans un certain système ; deuxièmement, si cette mémoire a la capacité de migrer entre produits, ou si elle finira par être liée à un seul produit, entraînant des coûts de migration élevés et un verrouillage de l’expérience ; troisièmement, s’il apparaîtra de nouveaux super points d’entrée, devenant le nœud central pour l’interaction IA et la distribution du trafic.

Le partenaire avocat du cabinet Man Kun, Zhao Xuan, a déclaré qu’en utilisant des produits IA, il met davantage les outils au service du traitement des données, de la recherche et de l’analyse, et qu’il espère voir à l’avenir davantage de produits intégrés permettant d’agréger ces capacités. Il a aussi souligné que, dans le lancement de projets IA, il est plus important d’éviter un échec majeur ponctuel. Il recommande aux entreprises de mettre dès le début l’accent sur les conceptions juridiques clés telles que la conformité des données, les clauses d’arbitrage et les clauses d’exonération de responsabilité, afin de réaliser au maximum l’isolation des risques et la protection des responsabilités lorsqu’apparaissent des risques incontrôlables, et ainsi d’éviter l’effondrement global de l’entreprise dû à un seul point de défaillance. Par ailleurs, il a également indiqué que, à l’avenir, les agents deviendront le principal acteur d’exécution économique, responsables de l’acquisition de données, de l’achat d’informations, de l’exécution de stratégies et même de transactions inter-systèmes, formant ainsi une activité économique et un système de paiements de machine à machine.

Dans la discussion en table ronde ayant pour thème « Les N façons d’ouvrir l’IA : parlons des opportunités pour les innovateurs », plusieurs invités ont exploré, sous différents angles, les changements apportés par l’IA. Le PDG de Matrix Intelligence, Zeno, a proposé que les utilisateurs puissent, en modifiant eux-mêmes des scripts ou des plugins, connecter plusieurs appareils, réaliser une synchronisation de mémoire « multi-en-un » et assurer l’unicité de l’état, afin que l’information ne soit pas perdue et que les tâches ne s’interrompent pas. En outre, ils peuvent aussi ajouter des mécanismes quotidiens de « purification/revue » pour maintenir la stabilité du système. Par rapport à l’utilisation d’outils prêts à l’emploi, une personnalisation approfondie à partir de capacités de niveau entreprise ou de capacités de plateforme est plus efficace, plus libre, et permet plus facilement de construire des workflows adaptés aux habitudes individuelles. En regardant vers l’avenir, il pense que l’IA deviendra un point d’entrée unifié : il suffira aux utilisateurs d’interagir via un seul « hub IA » pour appeler divers outils et systèmes et accomplir toutes les tâches. Avec l’augmentation de l’utilisation, l’IA accumulera continuellement la mémoire, les préférences et les workflows des utilisateurs, créant un effet de roue motrice « données-capacités », la rendant de plus en plus compréhensive pour l’utilisateur et de plus en plus efficace. Dans cette tendance, les individus pourraient, en configurant des systèmes IA et en payant des abonnements, obtenir un gain de productivité bien supérieur à celui du travail humain traditionnel, ce qui accentuera fortement l’écart d’efficacité entre les personnes.

Le cofondateur de ClawFirm.dev, 0xOlivia, a révélé que, dans l’utilisation réelle de l’IA, il existe encore des problèmes comme une instabilité du système, une fragmentation des capacités de mémoire et d’automatisation ; les utilisateurs doivent, comme avec des Legos, assembler continuellement divers outils et scripts. Pour les utilisateurs qui ne sont pas de haut niveau, l’adoption directe de plateformes commerciales matures, combinée aux applications officielles et aux capacités d’itération continue, est souvent plus stable et plus efficace que des systèmes construits très fragmentés. De plus, l’introduction d’éléments open source peut renforcer encore les capacités de traitement des données et de génération de contenu. Elle a souligné que la limite principale actuelle de l’IA ne réside pas dans la capacité du modèle lui-même, mais dans le fait que la façon d’utiliser l’ingénierie n’est pas encore parfaitement alignée avec la capacité du modèle ; il existe donc encore un vaste espace d’optimisation et de mise en œuvre. À l’avenir, à mesure que les capacités des grands modèles se renforcent rapidement, les scénarios d’application de l’IA couvriront progressivement tous les aspects du travail et de la vie, et continueront à fusionner avec différentes formes de produits.

En parlant des employés numériques IA, le fondateur de Biteye/XHunt, Teddy, a indiqué qu’on peut connecter l’IA aux systèmes internes via des API ou des interfaces d’automatisation, afin qu’elle exécute des tâches concrètes comme la génération de code, la réalisation des besoins et le traitement du contenu, tandis que l’humain se concentre sur la conception de produits et la définition des besoins, conservant ainsi le contrôle sur les décisions clés. Ce mode de collaboration, plus stable et extensible, améliore non seulement l’efficacité globale du développement, mais réduit aussi nettement le taux d’erreur, faisant de l’IA davantage une équipe d’externalisation distribuable et gérable qu’un outil unique. Il a également insisté sur le fait que tout travail fortement procédural et répétitif a la possibilité d’être transformé ou remplacé par l’IA ; même si les résultats ne sont pas stables au début, ils continueront à s’optimiser et à renforcer la productivité sur le long terme. Dans les domaines de tâches complexes et de décisions de gestion, l’IA a déjà commencé à montrer des capacités d’assistance évidentes, et s’infiltre actuellement dans des scénarios métier de niveau supérieur.

L’ingénieur senior en développement d’applications IA, Douge, a complété en indiquant que tout le monde s’accorde généralement sur la tendance à l’externalisation, à l’automatisation et à la collaboration outillée de l’IA ; et du point de vue des entreprises, il est encore plus nécessaire de se concentrer sur la sécurité, la gestion des autorisations, les mécanismes de collaboration entre employés et la consolidation des actifs. Aujourd’hui, le marché compte plusieurs frameworks de développement IA et des écosystèmes d’outils ; ils se concentrent chacun sur des axes tels que la légèreté, le low-code, la haute intégration et le contrôle de sécurité. Les entreprises doivent, lors du choix, trouver un équilibre entre flexibilité et contrôlabilité, et concevoir l’architecture en fonction des scénarios métier réels. En outre, comprendre et déployer réellement ces systèmes IA ne peut pas s’arrêter au niveau théorique ; il faut investir effectivement du temps et supporter des coûts d’usage. Il a insisté sur le fait que l’IA est en train d’accélérer la refonte des workflows et de la structure organisationnelle ; que ce soit pour un individu ou pour une entreprise, il faut s’adapter rapidement à ce changement, améliorer l’efficacité grâce à l’apprentissage continu et à l’application outillée, sinon on risque facilement d’être distancé par la vitesse d’itération technologique.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler