¡Crea un agente de IA en 2 minutos! xAI lanza Voice Agent Builder sin código, supera a OpenAI en puntuación de voz.

El mercado de asistentes de voz con IA recibe a un disruptor de peso! xAI, liderado por Elon Musk, lanzó hoy (1) la versión Beta de "Voice Agent Builder", que se enfoca en una operación completamente sin código (No-code), permitiendo a los usuarios construir agentes de voz de nivel empresarial en solo 2 minutos. La plataforma utiliza una arquitectura de voz de extremo a extremo, que no solo ha superado a GPT y Gemini en las últimas pruebas de referencia, sino que también admite clonación de voz ultrarrápida en 2 minutos e integración con números telefónicos reales, con un costo de cómputo de solo 0.05 dólares por minuto.
(Antecedentes: Inversor legendario dispara: SpaceX no es una empresa de IA, xAI es un "fracaso total" con todos los 11 cofundadores fuera)
(Complemento: SpaceX emite bonos corporativos de grado de inversión por primera vez, atrayendo 89 mil millones de dólares, con sobresuscripción de casi 4 veces, allanando el camino para xAI y Starship)

Índice del artículo

Toggle

  • Abandonando el montaje, la arquitectura de extremo a extremo derrota a GPT y Gemini
  • Proceso de construcción en 2 minutos y cuatro funciones principales
  • Observabilidad en tiempo real y barandillas de seguridad

La empresa de Elon Musk, xAI, vuelve a lanzar un ataque feroz contra los gigantes tecnológicos. El 1 de julio de 2026, xAI anunció oficialmente el lanzamiento de la versión Beta de Voice Agent Builder, declarando que el modelo de alto rendimiento Grok Voice se integra formalmente en entornos de producción empresarial, reduciendo significativamente la barrera técnica.

Esta plataforma, diseñada para manejar llamadas de alta frecuencia y alta carga (como servicio al cliente, ventas, reservas), se centra en ser "todo en uno" y "sin código (No-code)", permitiendo que el personal operativo obtenga funciones completas listas para usar sin necesidad de construir complejas pilas de voz desde cero.

Abandonando el montaje, la arquitectura de extremo a extremo derrota a GPT y Gemini

En el pasado, para construir asistentes de voz con IA para atención al cliente, las empresas generalmente necesitaban integrar tres sistemas independientes: conversión de voz a texto (STT), modelo de lenguaje grande (LLM) y conversión de texto a voz (TTS). Esta arquitectura de "montaje" no solo aumentaba la latencia de múltiples saltos, sino que también elevaba significativamente las tasas de error y los costos operativos.

xAI Voice Agent Builder revoluciona esto por completo. Adopta una ruta de voz única de extremo a extremo Speech-to-Speech estrechamente acoplada con Grok Voice. La empresa enfatiza que Grok Voice se entrenó con situaciones de llamadas reales y "las más difíciles", capaz de manejar perfectamente ruido telefónico de baja calidad, acentos fuertes, interrupciones del usuario, e incluso instrucciones ambiguas cuando el usuario cambia de opinión mientras habla, y admite de forma nativa más de 25 idiomas.

En la prueba de referencia de voz más reciente, $\tau$-voice Bench, la versión Grok Voice Think Fast 1.0 obtuvo una gran victoria en la tabla de clasificación, superando directamente en velocidad de respuesta y capacidad de razonamiento a sus poderosos rivales Google Gemini 3.1 Flash Live y OpenAI GPT Realtime 1.5.

Proceso de construcción en 2 minutos y cuatro funciones principales

xAI enfatiza que en menos de 2 minutos, los usuarios pueden configurar su propio agente de voz en la plataforma mediante indicaciones en lenguaje natural (Prompt). A continuación se presentan las funciones principales y el desglose de precios de la plataforma:

| Módulo de función | | --- | Especificaciones técnicas y detalles de soporte | | --- | --- | | Base de conocimiento (Knowledge Base) | Admite la carga de múltiples formatos como Word, Excel, PDF, JSON, y se puede organizar en colecciones compartidas entre agentes para garantizar la coherencia de las especificaciones del producto y las políticas. | | Herramientas y acciones (Tools & Connectors) | Integraciones integradas con Google/Outlook Calendar, búsqueda web, búsqueda en X (Twitter) y Notion. Admite transferencia a un agente humano, finalización de llamadas y notificaciones en tiempo real al equipo. | | Voz y telefonía (Voice & Telephony) | Ofrece más de 80 voces integradas, admite clonación de voz de marca que se completa con solo 2 minutos de audio. Se puede obtener un número telefónico gratuito o integrar con la centralita existente mediante SIP. | | Precios transparentes (Pricing) | La tarifa de API de cómputo es de 0.05 dólares/minuto (sin tarifa adicional de plataforma). Si se utiliza el número telefónico gratuito proporcionado por xAI, se cobra una tarifa de comunicación adicional de 0.01 dólares/minuto. |

Observabilidad en tiempo real y barandillas de seguridad

Para los usuarios empresariales, la seguridad y el control de riesgos son cruciales. Voice Agent Builder incorpora potentes mecanismos de monitoreo (Observability) y barandillas de seguridad (Guardrails). Cada llamada se graba automáticamente y se genera una transcripción palabra por palabra. Los administradores pueden ver en cualquier momento qué herramientas ha utilizado la IA y establecer límites de conversación estrictos (por ejemplo, prohibir obligatoriamente que la IA lea los números de tarjeta de crédito del cliente, o prohibir que hable de temas políticos irrelevantes con el usuario).

xAI concluyó el anuncio desafiando a desarrolladores y empresarios de todo el mundo: "Juzgar con los oídos es más preciso que mirar los puntos de referencia: construye un agente y pruébalo llamando con tu flujo de trabajo más difícil." Actualmente, la plataforma ya está disponible para pruebas en xAI Console, y se espera que tenga un gran impacto en la industria tradicional del software de atención al cliente.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado