Le protocole Coral surpasse Microsoft de 34 % avec le meilleur Benchmark GAIA pour le mini-modèle AI

MpostMediaGroup

En bref

Le système multi-agent de Coral Protocol a surpassé Magnetic-UI soutenu par Microsoft de 34 % sur le benchmark GAIA, démontrant que l’orchestration intelligente de modèles plus petits peut rivaliser ou dépasser les approches traditionnelles de l’IA à grande échelle.

Le Protocole Coral Établit un Nouveau Référentiel Pour les Systèmes d'IA Mini-Agent, Dépassant Microsoft de 34 % sur le Test GAIA

Infrastructure décentralisée pour l’IA collaborative, le Coral Protocol a rapporté que son système multi-agents a surpassé Magnetic-UI soutenu par Microsoft de 34 % sur le GAIA Benchmark—un résultat sans précédent qui suggère que l’évolutivité horizontale pourrait offrir une approche plus efficace que l’expansion des paramètres du modèle. Le système du protocole exploite une orchestration intelligente entre plusieurs agents, plutôt que de se concentrer uniquement sur l’augmentation de la taille du modèle.

Cette performance a marqué le score vérifié le plus élevé sur le GAIA Benchmark utilisant des mini agents, soutenant la prémisse de NVIDIA selon laquelle des modèles plus petits bien coordonnés pourraient jouer un rôle clé dans l’avenir de l’IA. Le résultat, selon les développeurs de Coral, reflète un changement conceptuel dans l’approche de la scalabilité de l’IA plutôt qu’une simple augmentation de la puissance du système.

En tant que protocole ouvert, Coral facilite l’expansion des capacités de l’IA en permettant la coordination entre des agents spécialisés à l’échelle mondiale, au lieu de se fier à des modèles généraux centralisés. Son architecture permet une interaction parallèle et sécurisée entre les agents, améliorant ainsi la fonctionnalité des modèles de langage de toutes tailles dans des tâches nécessitant un raisonnement avancé, une planification et une résolution de problèmes.

« Cette avancée marque un tournant dans l’infrastructure de l’IA », a déclaré Caelum Forder, CTO de Coral, dans un communiqué écrit. « C’est la preuve que la mise à l’échelle horizontale n’est pas seulement possible, mais pratique, et Coral est le moyen le plus efficace de le faire. L’Internet des Agents est désormais une réalité fonctionnelle. Si vous êtes un développeur d’agents, il vous suffit de Coraliser. Si vous êtes un développeur d’applications, construisez-le mieux pour moins en utilisant notre infrastructure », a-t-il ajouté.

Coral Tops GAIA Benchmark, Valide la Puissance des Petits Modèles dans les Systèmes Agentiques Avancés

Dans un contexte de concurrence croissante pour développer des systèmes agentiques avancés, une grande partie de l’attention est restée portée sur l’augmentation de l’échelle des modèles pour gérer la complexité croissante des tâches. Les récentes performances de Coral remettent en question cette approche prédominante, s’alignant avec les conclusions d’une récente étude de NVIDIA suggérant que des systèmes plus petits peuvent offrir de hautes performances sans compromettre la vitesse, la sécurité ou l’efficacité. Le GAIA Benchmark, une suite d’évaluation complète pour l’IA avancée, est conçu pour évaluer dans quelle mesure les systèmes gèrent des tâches du monde réel qui nécessiteraient normalement un temps et des compétences considérables de la part d’experts humains. Comportant 450 invites complexes qui testent les capacités de recherche, d’analyse et de raisonnement, le benchmark sert de métrique clé de l’industrie pour évaluer l’efficacité des agents de modèle de langage général (LLM).

Le système GAIA Agent de Coral, utilisé dans le test de référence, est basé sur le protocole Coral et s’inspire des principes de conception de l’OWL de CAMEL. Il incorpore des agents spécialisés pour réaliser une gamme de tâches incluant la recherche, l’analyse, la critique, la planification et la navigation sur le web, toutes communiquant via l’infrastructure serveur MCP de Coral.

Être en tête du classement GAIA Benchmark pour les modèles plus petits indique le potentiel de Coral à étendre la fonctionnalité des systèmes d’IA via une structure basée sur des graphes. Ce résultat suggère que des agents légers et performants peuvent être créés en utilisant des modèles plus petits, facilitant ainsi un traitement de données plus large, une intégration plus fluide dans l’écosystème et une communication améliorée entre les agents.

« Le rôle des petits modèles dans les systèmes agentiques a été sous-estimé jusqu’à présent, mais la tendance commence à changer », a déclaré Caelum Forder. « Nous avons prouvé que ces modèles peuvent évoluer au-delà de leurs limites connues et surpasser les acteurs établis. Je suis convaincu qu’ils auront un rôle central à jouer dans l’avenir de l’IA agentique », a-t-il conclu.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire