API abierta de Xiaomi MiMo-V2.5-TTS: admite canto, ajuste de emociones en lenguaje natural, clonación de voz en segundos

robot
Generación de resúmenes en curso

ME News Noticias, 24 de abril (UTC+8), según la monitorización de Dòngchá Beating, Xiaomi lanzó la serie de modelos de síntesis de voz MiMo-V2.5-TTS, que ofrece servicios a través de la API de la plataforma abierta MiMo, durante la fase de prueba pública de forma gratuita por tiempo limitado. Esta serie incluye tres modelos, dirigidos a diferentes escenarios. MiMo-V2.5-TTS cuenta con varias voces premium integradas, soporta modo de canto, y puede expresar con precisión la altura y el ritmo. MiMo-V2.5-TTS-VoiceDesign permite generar una nueva voz a partir de una descripción en lenguaje natural, sin necesidad de referencia de audio, y puede definirla en dimensiones como edad, género, acento y carácter. MiMo-V2.5-TTS-VoiceClone realiza clonación de voz, ofreciendo replicar la voz del hablante objetivo con solo unos segundos de audio de referencia, conservando respiración, ritmo y pausas, sin necesidad de entrenamiento o ajuste fino. Los tres modelos soportan controlar el estilo de voz mediante instrucciones en lenguaje natural, por ejemplo, ajustando emociones con descripciones como «suave pero cansado» o «ternura en medio de la agitación», y también soportan etiquetas de audio (como «inhale», «risa», «sollozo») para un control preciso. En cuanto a idiomas, soportan chino, inglés, así como dialectos como el dialecto del noreste, Sichuanés, Henanés y cantonés. La salida de audio tiene una tasa de muestreo de 24000 Hz, y se recomienda el formato pcm16 para la transmisión en streaming. (Fuente: BlockBeats)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado