Source : TokenPost
Titre original : Anthropic, lancement du grand modèle linguistique ‘Claude opus 4.5’… Renforcement de l'automatisation des tâches et réduction des coûts d'inférence
Lien original :
La startup d'IA Anthropic( a officiellement lancé son modèle de langage de nouvelle génération)LLM( 'Claude Opus 4.5)Claude Opus 4.5('. Ce dernier modèle est considéré par la société comme un flagship AI alliant performance et sécurité de haut niveau. Claude Opus 4.5 est le modèle phare de la gamme Claude 4.5, succédant aux modèles intermédiaires 'Sonnet)Sonnet( 4.5' et d'entrée de gamme 'Haiku)Haiku( 4.5'.
Selon Anthropic, l'Opus 4.5 offre des performances qui se démarquent par rapport aux modèles concurrents en matière d'automatisation des tâches basée sur des agents autonomes. En particulier, même en cas d'échec lors de la première tentative, le modèle améliore progressivement ses capacités au cours du processus itératif de résolution de problèmes. Les résultats des tests d'Anthropic montrent que ce modèle a généralement atteint des performances optimales en quatre cycles d'apprentissage, tandis que les LLM concurrents nécessitaient en moyenne plus de dix répétitions.
Opus 4.5 présente des atouts même pour effectuer des tâches à long terme, telles que la réécriture d'applications à grande échelle, qui peuvent prendre plusieurs heures. Les développeurs exploitent souvent plusieurs agents simultanément dans des environnements de travail complexes, et Anthropic a déclaré qu'ils peuvent traiter la tâche principale avec Opus 4.5, tout en configurant les tâches secondaires pour utiliser le léger Haiku 4.5 afin de réduire les coûts. Cette approche devrait également permettre de réduire les coûts d'inférence.
Les performances de programmation ont également été améliorées. Selon l'entreprise, la dépendance aux directives des développeurs est plus faible que celle des modèles précédents, et il est capable d'interpréter des phrases ambiguës de manière plus précise. Par exemple, il est capable de passer en revue plusieurs systèmes et d'identifier les causes des bugs avec une seule commande.
La nouvelle fonctionnalité a renforcé l'intégration pour une utilisation conviviale. Les fonctionnalités d'intégration avec Excel et Google Chrome le montrent. Claude, accessible via la barre latérale d'Excel, a récemment ajouté des fonctionnalités de création de tableaux croisés dynamiques et de graphiques, et les utilisateurs des plans Team, Max et Enterprise peuvent utiliser cette fonctionnalité immédiatement. L'extension Chrome permet à Claude d'effectuer directement des tâches utilisateur dans l'application web, et elle est également équipée d'une fonction de réponse aux invites malveillantes. Cette fonctionnalité est également entièrement ouverte aux utilisateurs du plan Max.
En plus, cette version comprend plusieurs améliorations de fonctionnalités. Par exemple, l'assistant de programmation 'Claude Code' a été intégré au client de bureau, et les limites d'utilisation ont été augmentées pour les forfaits Max et Team. La fonction de résumé de l'historique des conversations précédentes a également été nouvellement ajoutée à Claude Chat.
L'Opus 4.5 est accessible via Claude Chat, code et API, et les utilisateurs de l'API peuvent également profiter de la fonction “réglage de l'effort”, qui permet d'ajuster le temps de traitement et l'allocation des ressources lors de l'exécution des tâches. Plus les ressources de calcul sont importantes, meilleure est la qualité de sortie. Le prix est fixé à 5 dollars pour 1 million de tokens d'entrée et à 25 dollars pour 1 million de tokens de sortie.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
15 J'aime
Récompense
15
6
Reposter
Partager
Commentaire
0/400
MiningDisasterSurvivor
· 11-25 02:02
Encore une "performance maximale", j'ai déjà connu ça... En 2018, on parlait déjà de la même manière, et qu'est-ce que ça a donné ?
Voir l'originalRépondre0
fren.eth
· 11-25 02:02
opus 4.5 est vraiment arrivé, OpenAI doit maintenant s'inquiéter haha
Voir l'originalRépondre0
MidnightTrader
· 11-25 02:02
Un nouveau modèle est arrivé, cette fois combien Claude peut-il coûter moins cher ? Ce qui est vraiment important, c'est de savoir si le coût d'inférence peut être réduit.
Voir l'originalRépondre0
YieldHunter
· 11-25 02:01
franchement, anthropic joue dur au jeu de la réduction des coûts mais comme... en fait, ont-ils vraiment montré les chiffres d'inférence réels ? si vous regardez les données, les gains de performance ne se traduisent pas toujours par des retours durables pour les développeurs utilisant ces apis à vrai dire. sceptique jusqu'à ce que je voie le véritable coefficient de corrélation entre leurs revendications et les taux d'adoption sur le marché fr
Voir l'originalRépondre0
ETHmaxi_NoFilter
· 11-25 01:58
Claude 4.5 sort encore une nouvelle version, et le coût baisse encore ? La vitesse, c’est vraiment hallucinant, haha.
Voir l'originalRépondre0
WagmiWarrior
· 11-25 01:43
Claude a encore sorti une nouvelle version, les coûts peuvent-ils encore baisser ? Cette fois, vont-ils vraiment faire tomber OpenAI ?
Anthropic, lancement du grand modèle de langage 'Claude Opus 4.5'... renforcement de l'automatisation des tâches et réduction des coûts d'inférence.
Source : TokenPost Titre original : Anthropic, lancement du grand modèle linguistique ‘Claude opus 4.5’… Renforcement de l'automatisation des tâches et réduction des coûts d'inférence Lien original : La startup d'IA Anthropic( a officiellement lancé son modèle de langage de nouvelle génération)LLM( 'Claude Opus 4.5)Claude Opus 4.5('. Ce dernier modèle est considéré par la société comme un flagship AI alliant performance et sécurité de haut niveau. Claude Opus 4.5 est le modèle phare de la gamme Claude 4.5, succédant aux modèles intermédiaires 'Sonnet)Sonnet( 4.5' et d'entrée de gamme 'Haiku)Haiku( 4.5'.
Selon Anthropic, l'Opus 4.5 offre des performances qui se démarquent par rapport aux modèles concurrents en matière d'automatisation des tâches basée sur des agents autonomes. En particulier, même en cas d'échec lors de la première tentative, le modèle améliore progressivement ses capacités au cours du processus itératif de résolution de problèmes. Les résultats des tests d'Anthropic montrent que ce modèle a généralement atteint des performances optimales en quatre cycles d'apprentissage, tandis que les LLM concurrents nécessitaient en moyenne plus de dix répétitions.
Opus 4.5 présente des atouts même pour effectuer des tâches à long terme, telles que la réécriture d'applications à grande échelle, qui peuvent prendre plusieurs heures. Les développeurs exploitent souvent plusieurs agents simultanément dans des environnements de travail complexes, et Anthropic a déclaré qu'ils peuvent traiter la tâche principale avec Opus 4.5, tout en configurant les tâches secondaires pour utiliser le léger Haiku 4.5 afin de réduire les coûts. Cette approche devrait également permettre de réduire les coûts d'inférence.
Les performances de programmation ont également été améliorées. Selon l'entreprise, la dépendance aux directives des développeurs est plus faible que celle des modèles précédents, et il est capable d'interpréter des phrases ambiguës de manière plus précise. Par exemple, il est capable de passer en revue plusieurs systèmes et d'identifier les causes des bugs avec une seule commande.
La nouvelle fonctionnalité a renforcé l'intégration pour une utilisation conviviale. Les fonctionnalités d'intégration avec Excel et Google Chrome le montrent. Claude, accessible via la barre latérale d'Excel, a récemment ajouté des fonctionnalités de création de tableaux croisés dynamiques et de graphiques, et les utilisateurs des plans Team, Max et Enterprise peuvent utiliser cette fonctionnalité immédiatement. L'extension Chrome permet à Claude d'effectuer directement des tâches utilisateur dans l'application web, et elle est également équipée d'une fonction de réponse aux invites malveillantes. Cette fonctionnalité est également entièrement ouverte aux utilisateurs du plan Max.
En plus, cette version comprend plusieurs améliorations de fonctionnalités. Par exemple, l'assistant de programmation 'Claude Code' a été intégré au client de bureau, et les limites d'utilisation ont été augmentées pour les forfaits Max et Team. La fonction de résumé de l'historique des conversations précédentes a également été nouvellement ajoutée à Claude Chat.
L'Opus 4.5 est accessible via Claude Chat, code et API, et les utilisateurs de l'API peuvent également profiter de la fonction “réglage de l'effort”, qui permet d'ajuster le temps de traitement et l'allocation des ressources lors de l'exécution des tâches. Plus les ressources de calcul sont importantes, meilleure est la qualité de sortie. Le prix est fixé à 5 dollars pour 1 million de tokens d'entrée et à 25 dollars pour 1 million de tokens de sortie.