Microsoft dévoile ses premiers modèles d'IA internes : MAI-Voice-1 pour une reconnaissance vocale ultra-rapide et MAI-1-Preview pour les tâches de suivi d'instructions.

MpostMediaGroup
MAI-9,06%
IN-5,58%
UOS-1,24%

En bref

Microsoft a lancé ses premiers modèles d’IA internes, MAI-Voice-1 pour la génération rapide de la parole et MAI-1-preview pour les tâches de suivi d’instructions.

Microsoft Dévoile Ses Premiers Modèles d'IA Internes : MAI-Voice-1 Pour La Reconnaissance Vocale Ultra-Rapide Et MAI-1-Preview Pour Les Tâches de Suivi d'Instructions

Microsoft AI, une division dédiée au développement et à l’intégration des technologies d’IA au sein de Microsoft, a annoncé la sortie de MAI-Voice-1, son premier modèle de génération de discours haute fidélité et expressif. Le modèle est actuellement disponible dans Copilot Daily et Podcasts, ainsi que dans la nouvelle expérience Copilot Labs, permettant aux utilisateurs d’explorer les capacités de discours expressif et de narration.

MAI-Voice-1 fournit un audio naturel dans des scénarios à un ou plusieurs locuteurs et est conçu pour la vitesse, générant une minute complète de discours en moins d’une seconde sur un seul GPU, ce qui en fait l’un des systèmes de génération de discours les plus efficaces actuellement disponibles. Le modèle permet des applications telles que des histoires interactives « choisissez votre propre aventure » ou des méditations guidées personnalisées, mettant en valeur le potentiel de la voix en tant qu’interface principale pour les compagnons IA.

Microsoft AI lance les tests publics de MAI-1-Preview, son premier modèle de base entièrement entraîné.

En plus de cela, Microsoft AI a lancé des tests publics de MAI-1-preview sur LMArena, une plateforme largement utilisée pour l’évaluation des modèles communautaires. Cela marque le premier modèle fondamental entièrement entraîné de la division et offre un aperçu précoce des capacités qui seront intégrées dans Copilot. Le MAI-1-preview est un modèle interne de mélange d’experts, pré- et post-entraîné sur environ 15 000 GPU NVIDIA H100, conçu pour gérer le suivi des instructions et fournir des réponses utiles pour les tâches quotidiennes.

Le modèle sera progressivement introduit pour des cas d’utilisation textuels sélectionnés dans Copilot, permettant à l’IA de Microsoft de recueillir des retours et d’affiner ses performances. L’équipe combine des modèles internes, des contributions de partenaires et des innovations open-source pour optimiser les résultats à travers des millions d’interactions quotidiennes. MAI-1-preview est également disponible pour des testeurs de confiance, avec des demandes d’accès à l’API ouvertes pour recueillir des informations sur ses forces et ses domaines d’amélioration.

En regardant vers l’avenir, Microsoft AI prévoit d’améliorer davantage le modèle tout en orchestrant une suite de modèles spécialisés adaptés à différentes intentions et scénarios d’utilisateur. La division vise à continuer de développer des solutions d’IA de premier plan et à les rendre accessibles aux utilisateurs du monde entier.

Voir l'original
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire