Saltar al contenido principal

Descripción General

La voz de tu agente es una parte crítica de la experiencia del cliente. La voz correcta puede generar confianza, transmitir profesionalismo y alinearse con la identidad de tu marca. itellicoAI transmite catálogos en vivo desde ElevenLabs, voces neuronales de Microsoft Azure y Cartesia para que puedas elegir audio de alta calidad sin cargas manuales.
La selección de voz se realiza en la pestaña Voz en la configuración de tu agente. Los cambios se aplican inmediatamente.

Proveedores de Voz

ElevenLabs

Voces IA premium con naturalidad excepcional y rango emocional.Por qué funciona:
  • Ultra-realista, casi indistinguible del habla humana
  • Fuerte rango emocional para servicio al cliente
  • Calidad consistente en todo el contenido
  • Baja latencia para conversaciones en tiempo real
Ideal para:
  • Agentes de cara al cliente donde la calidad de voz es crítica
  • Aplicaciones sensibles a la marca
  • Casos de uso que requieren inteligencia emocional
Voces populares:
  • Rachel: Mujer americana cálida y profesional
  • Adam: Hombre americano confiado y claro
  • Susi: Mujer alemana natural y profesional (recomendado para agentes alemanes)
  • Antoni: Hombre tranquilo y reconfortante
Las voces de ElevenLabs admiten configuraciones avanzadas como estabilidad y aumento de similitud—configura en Configuración de Voz.
Voces de nivel empresarial con cobertura de idiomas masiva.Por qué funciona:
  • 100+ idiomas y localidades
  • Alojamiento en UE disponible para cumplimiento GDPR
  • Calidad profesional consistente
  • Precios empresariales predecibles
Ideal para:
  • Agentes multilingües (un proveedor para todos los idiomas)
  • Requisitos de cumplimiento empresarial
  • Aplicaciones de alto volumen con restricciones de costo
  • Implementaciones globales
Voces populares:
  • en-US-JennyNeural: Mujer americana natural
  • en-GB-SoniaNeural: Mujer británica, profesional
  • de-DE-KatjaNeural: Mujer alemana, autoritaria
Niveles de voz:
  • Neural Estándar: Alta calidad, rentable
  • Neural HD: Calidad mejorada
  • Neural Personalizado: Entrena tu propia voz (solo empresas)
Compensaciones:
  • Matices emocionales ligeramente menores que ElevenLabs
  • Mejor para conversaciones fácticas y profesionales
Voces de latencia ultra-baja optimizadas para IA conversacional.Por qué funciona:
  • Optimizado para toma de turnos en menos de un segundo
  • Entregas expresivas y enérgicas
  • Sonido moderno ajustado para agentes interactivos
Ideal para:
  • Experiencias web críticas en velocidad
  • Pruebas A/B junto con ElevenLabs
  • Aplicaciones sensibles a latencia
Compensaciones:
  • Catálogo más pequeño (principalmente inglés)
  • Menos opciones de personalización
¿Necesitas otro proveedor TTS (Google Cloud, Amazon Polly)? Contacta a tu gerente de éxito—lo agregaremos al catálogo.

Elegir la Voz Correcta

Marco de Selección

Elige según tus requisitos:¿Calidad primero? → ElevenLabs (más natural, rango emocional)¿Necesitas idioma específico? → Azure Speech (fuerte cobertura de idiomas, 100+ idiomas)¿Crítico en velocidad? → Cartesia (latencia ultra-baja)¿Cumplimiento UE? → Azure (opciones alojadas en UE)
Contexto de industria:
  • Salud: Empático, profesional, reconfortante
  • Ventas: Confiado, entusiasta, persuasivo
  • Soporte Técnico: Paciente, claro, conocedor
  • Hospitalidad: Cálido, acogedor, amigable
Consideraciones de acento:
  • Acentos locales generan rapport con clientes locales
  • Acentos neutros funcionan para audiencias globales
  • Filtra por región/localidad en biblioteca de voz
Proceso de prueba:
  1. Previsualiza voces de ElevenLabs usando el botón de reproducción
  2. Preselecciona 3-5 voces que coincidan con tus criterios
  3. Despliega cada una en un agente de prueba
  4. Llama y prueba con escenarios realistas
  5. Haz que miembros del equipo evalúen
Criterios de evaluación:
  • Ajuste de marca y coincidencia de personalidad
  • Claridad y naturalidad
  • Rendimiento con terminología de la industria
  • Agradable de escuchar en conversaciones de 5+ minutos

Características de la Biblioteca de Voz

La biblioteca de voz proporciona búsqueda y filtrado para encontrar la voz correcta rápidamente: Buscar por:
  • Nombre de voz (ej., “Sarah”, “Professional Male”)
  • Proveedor (ElevenLabs, Azure, Cartesia)
  • Género (masculino, femenino, neutral)
  • Código de idioma o localidad (en-US, es-ES, de-DE)
  • Acento o región (británico, australiano, americano)
Filtrar por:
  • Proveedor: Mostrar solo proveedores específicos
  • Idioma: Reducir a requisitos de idioma
  • Género: Masculino, femenino o neutral de género
Vista previa:
  • Haz clic en el botón de reproducción en voces de ElevenLabs para escuchar muestras
  • Despliega en agente de prueba para vistas previas extendidas con escenarios reales
Metadatos mostrados:
  • Proveedor y tecnología de generación de voz
  • Soporte de idiomas y capacidades multilingües
  • Insignia de alojamiento en UE
  • Características de género, acento y tono

Próximos Pasos