La vitesse de génération explose 6 fois ! La face obscure de la lune lance Kimi K2.7 Code version haute vitesse, API facturée au double.

Le secteur de la génération de code connaît une tempête éclair ! La licorne de l'IA Moonshot AI annonce officiellement aujourd'hui (15) sur ses comptes officiels, le lancement d'un tout nouveau mode ultra-rapide pour son grand modèle open source de programmation multimodale — « Kimi K2.7 Code HighSpeed ».
Ce mode offre une augmentation de vitesse épique allant jusqu'à 6 fois, avec une vitesse de sortie pour les tâches à contexte court atteignant 260 tokens/sec. Actuellement, cette fonctionnalité est déployée par lots en quantité limitée pour les développeurs et les utilisateurs d'entreprise, son prix API étant fixé à deux fois celui de la version standard.
(Précédent : La nouvelle levée de fonds de Moonshot AI valorise la société à 30 milliards de dollars ! Trois tours en six mois, Meituan en lead, ARR dépassant 200 millions de dollars en un seul mois)
(Contexte supplémentaire : Bloomberg : La Chine interdit strictement aux licornes de l'IA de recevoir des « fonds américains » ! ByteDance et Moonshot AI sont tous deux nommés)

Table des matières

Toggle

  • Jusqu'à 260 tok/sec en contexte court ! Une efficacité de génération multipliée par six
  • Tarification à double tarif ! Prix de l'API du mode ultra-rapide dévoilé
  • Capacité de calcul limitée ! Déploiement par lots pour les membres testeurs et entreprises

La communauté mondiale des développeurs en IA assiste à une révolution de l'efficacité. Moonshot AI, un leader dans le domaine des grands modèles, a officiellement lancé aujourd'hui (15) via son compte officiel @Kimi_Moonshot, la nouvelle version ultra-rapide de son grand modèle open source de programmation multimodale Kimi K2.7 Code — « Kimi K2.7 Code HighSpeed ».

Une vidéo de comparaison côte à côte de 22 minutes a été publiée simultanément, montrant de manière intuitive la différence énorme entre le « mode ultra-rapide » et le « mode normal » lors de l'édition, de la génération de code, du traitement de tableaux Excel et des tâches complexes d'agents. La société insiste sur le fait que l'intelligence ouverte doit être instantanée et accessible, et continuera à optimiser pour offrir une expérience de développement sans frontières et en temps réel.

🌘 Découvrez Kimi K2.7 Code HighSpeed !
Un mode à haute vitesse de notre dernier modèle open source de codage multimodal, Kimi K2.7 Code.

⚡️ Jusqu'à 6× plus rapide : environ 180 tokens/sec pour les tâches de codage avec des entrées de longueur médiane, et jusqu'à 260 tokens/sec pour les tâches à contexte court.

🔷 Déploiement en version bêta de Kimi Code… pic.twitter.com/syOOgIdtI4

— Kimi.ai (@Kimi_Moonshot) 15 juin 2026

Jusqu'à 260 tok/sec en contexte court ! Une efficacité de génération multipliée par six

Selon les spécifications techniques officielles, Kimi K2.7 Code HighSpeed a réalisé une évolution spectaculaire, atteignant jusqu'à 6 fois la vitesse de génération globale. Dans des scénarios concrets :

  • Tâches avec entrées de longueur moyenne : la vitesse de raisonnement en mode ultra-rapide peut se maintenir à environ 180 tokens/sec.
  • Scénarios à contexte court : la vitesse de sortie peut atteindre un impressionnant 260 tokens/sec.

Cette avancée en vitesse signifie que, lors de débogages quotidiens, d'auto-complétions en temps réel ou de génération de code multimodal, les développeurs peuvent presque réagir instantanément sans délai, augmentant considérablement la productivité en ingénierie logicielle.

Tarification à double tarif ! Prix de l'API du mode ultra-rapide dévoilé

Avec le lancement du mode ultra-rapide, la question du tarif est également révélée. Selon les informations communautaires et la section développeurs officielle, la tarification de l'API de Kimi K2.7 Code HighSpeed est fixée à deux fois celle de la version standard :

Pour le prix précis, le cache (mémoire tampon) du mode ultra-rapide coûte 0,38 USD par million de tokens en hit, 1,90 USD par million de tokens en miss, et la sortie (Output) principale est facturée à 8,00 USD par million de tokens. En comparaison, la version standard de Kimi K2.7 Code, disponible en open source, coûte respectivement 0,19 USD, 0,95 USD et 4,00 USD par million de tokens. Bien que le prix soit doublé, la communauté quantitatif de Wall Street et les développeurs réagissent favorablement, estimant que la performance instantanée jusqu'à 6 fois justifie largement cette prime.

Capacité de calcul limitée ! Déploiement par lots pour les membres testeurs et entreprises

Moonshot AI admet que, en raison de la capacité de calcul extrêmement limitée nécessaire pour le raisonnement ultra-rapide, le mode HighSpeed est actuellement déployé par lots en quantité limitée. Pour assurer la stabilité du réseau principal, l’accès a été d’abord réservé aux membres du programme bêta Kimi Code, aux développeurs avec comptes API Kimi, et aux utilisateurs d'entreprise Kimi Business.

Cependant, la société souligne que cette phase de test « ne nécessite pas de code d'invitation supplémentaire » ; tout développeur intéressé peut soumettre sa demande pour rejoindre le programme bêta, et des accès seront distribués par système par lots. À mesure que l'infrastructure de Moonshot AI s'élargira, le mode ultra-rapide sera progressivement étendu à tous les utilisateurs de cloud public.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé