Descripción General
El transcriptor es el primer paso en el proceso de su agente. Convierte el habla del cliente en texto que el modelo de IA puede comprender y responder. La transcripción precisa es crítica—los errores en este paso se propagan a través de toda la conversación.Configure el transcriptor en Modelos > Transcriptor en la configuración de su agente. Los cambios se aplican inmediatamente.
Transcriptores Disponibles
Deepgram Nova-3 General
Deepgram Nova-3 General
Última generación con precisión mejorada y soporte multilingüe.Por qué funciona:
- Latencia ultra-baja (~300ms) para conversaciones en tiempo real
- Soporta 21 idiomas: variantes de inglés más búlgaro, checo, finlandés, hindi, húngaro, japonés, coreano, polaco, ruso, ucraniano, vietnamita y más
- Fuerte precisión en audio telefónico y entornos ruidosos
- Maneja bien las conversaciones cruzadas y palabras de relleno
- Recomendación predeterminada cuando su idioma es soportado
- Aplicaciones críticas en velocidad
- Agentes multilingües (cuando todos los idiomas están cubiertos por Nova-3)
- Interacciones con clientes en tiempo real
- Modo multilingüe: Inglés, español, francés, alemán, hindi, ruso, portugués, japonés, italiano, holandés
- Inglés: en-US, en-GB, en-AU, en-IN, en-NZ
- Europeos: Alemán (de), holandés (nl), sueco (sv), danés (da), búlgaro (bg), checo (cs), finlandés (fi), húngaro (hu), polaco (pl), ruso (ru), ucraniano (uk)
- Asiáticos: Hindi (hi), japonés (ja), coreano (ko), vietnamita (vi)
Azure Speech
Azure Speech
Cobertura masiva de idiomas (150+) con confiabilidad de nivel empresarial.Por qué funciona:
- 150+ idiomas y configuraciones regionales
- Auto-detección multilingüe (2-10 idiomas)
- Alojamiento en la UE disponible
- Precios empresariales predecibles
- Calidad consistente en todos los idiomas
- Idiomas no ingleses no cubiertos por Deepgram
- Agentes multilingües con necesidades de auto-detección
- Requisitos de cumplimiento empresarial
- Despliegues globales que sirven mercados diversos
- 150+ idiomas incluyendo: 18 variantes de árabe, 24 variantes de español, 18 variantes de inglés, más afrikáans, amhárico, bengalí, catalán, chino (6 variantes incluyendo wu y cantonés), checo, danés, holandés, filipino, finlandés, francés, alemán, griego, hebreo, hindi, húngaro, indonesio, italiano, japonés, coreano, malayo, noruego, polaco, portugués, rumano, ruso, sueco, tailandés, turco, ucraniano, vietnamita y muchos más
- Mayor latencia que Deepgram (~500-700ms)
Otros Transcriptores
Deepgram Nova-3 Medical
Deepgram Nova-3 Medical
Especializado para terminología médica (solo inglés).Por qué funciona:
- Optimizado para vocabulario médico en inglés
- Reconocimiento preciso de términos médicos, procedimientos, medicamentos
- Baja latencia como Nova-3 General (~300ms)
- Aplicaciones de salud (cumplimiento HIPAA disponible con BAA)
- Reserva de citas médicas
- Servicios de telesalud
- Documentación clínica
- Inglés: en-US, en-GB, en-AU, en-CA, en-IE, en-IN, en-NZ
- Solo inglés
- Requiere caso de uso específico de salud
Deepgram Nova-2 General
Deepgram Nova-2 General
Generación anterior con la cobertura de idiomas más amplia (40+).Por qué funciona:
- Excelente precisión y baja latencia (~300ms)
- Lista de idiomas más amplia: búlgaro, catalán, checo, danés, alemán, griego, estonio, finlandés, francés, hindi, húngaro, indonesio, italiano, japonés, coreano, lituano, letón, malayo, holandés, noruego, polaco, portugués, rumano, ruso, eslovaco, sueco, tailandés, turco, ucraniano, vietnamita, variantes chinas y más
- Rendimiento probado para equipos globales
- Soporte de palabras clave para nombres de marca
- Idiomas que aún no están en Nova-3 (catalán, portugués-BR, tailandés, chino, etc.)
- Despliegues multilingües globales
- Equipos que necesitan idiomas regionales específicos
- Modo multilingüe: Solo inglés + español
- 40+ idiomas incluyendo: Catalán (ca), griego (el), estonio (et), indonesio (id), lituano (lt), letón (lv), malayo (ms), noruego (no), portugués (pt, pt-BR, pt-PT), rumano (ro), eslovaco (sk), tailandés (th), turco (tr), chino (zh, zh-CN, zh-TW, zh-Hans, zh-Hant, zh-HK), francés (fr, fr-CA), español (es, es-419)
- Ligeramente por detrás de Nova-3 en mejoras de precisión
Modelos Especializados Deepgram Nova-2
Modelos Especializados Deepgram Nova-2
Variantes específicas de tareas optimizadas para casos de uso limitados.Nova-2 Phone Call:
- Optimizado específicamente para audio de telefonía (solo inglés)
- Inglés: en-US, en-GB
- Optimizado para transcripción de reuniones (solo inglés)
- Inglés: en-US, en-GB
- Optimizado para conversaciones con IA (solo inglés)
- Inglés: en-US, en-GB
- La mayoría de equipos deben usar Nova-3 General o Nova-2 General
- Estos modelos especializados son para necesidades de optimización específicas
Elegir el Transcriptor Correcto
Marco de Selección
1. Requisitos de Idioma
1. Requisitos de Idioma
Elija según los idiomas que necesita:¿Idioma soportado por Nova-3? → Deepgram Nova-3 General (recomendado - más rápido y preciso)
- 21 idiomas: inglés, español, francés, alemán, holandés, sueco, danés, búlgaro, checo, finlandés, hindi, húngaro, japonés, coreano, polaco, ruso, ucraniano, vietnamita y más
- Use modo multilingüe Nova-3 cuando sirva múltiples idiomas de esta lista
- 40+ idiomas incluyendo: catalán, portugués, tailandés, chino, griego, estonio, indonesio, lituano, letón, malayo, noruego, rumano, eslovaco, turco
2. Latencia vs. Cobertura
2. Latencia vs. Cobertura
¿Velocidad crítica (menos de 400ms)?
- Deepgram Nova-3 o Nova-2 (~300ms)
- Azure Speech (~500-700ms)
- Azure Speech (150+ idiomas, sacrifica velocidad)
3. Cumplimiento Regional
3. Cumplimiento Regional
¿Alojamiento en la UE requerido?
- Azure Speech (regiones de la UE: Europa Occidental, Europa del Norte)
- Deepgram usa puntos finales de la UE pero los datos pueden procesarse en servidores de EE.UU.
Configuración de Idioma
Configuración de Idioma Único
Para agentes que sirven un idioma:- Abra Modelos > Transcriptor
- Use el Selector de Idioma para filtrar transcriptores
- Seleccione por nombre de idioma (ej., “Inglés”) o código de configuración regional (ej., “en-US”)
- Elija el transcriptor con mejor latencia/precisión para sus necesidades
- en-US: Inglés americano
- en-GB: Inglés británico
- en-AU: Inglés australiano
- en-IN: Inglés indio
- de-DE: Alemán
- es-ES: Español (España)
- fr-FR: Francés
- zh-CN: Chino (simplificado)
- zh-TW: Chino (tradicional)
Soporte Multilingüe
Deepgram Nova-3 Multilingüe:- Modelo único que soporta inglés, español, francés, alemán, hindi, ruso, portugués, japonés, italiano, holandés
- No se necesita selección de idioma—maneja automáticamente los 10 idiomas
- Seleccione múltiples idiomas (2-10) para auto-detección
- Azure detecta el idioma desde las primeras palabras y transcribe en consecuencia
Palabras Clave
Ayude a su transcriptor a reconocer nombres de marca y términos técnicos con precisión.Las palabras clave son soportadas en modelos Deepgram Nova-2 y Azure Speech. Nova-3 actualmente no soporta palabras clave.
Qué Reforzar
Los transcriptores pueden tener dificultades con:- Nombres de marca (empresa, productos, competidores)
- Jerga de la industria (términos técnicos, acrónimos)
- Nombres propios (nombres de personas, ubicaciones)
Cómo Agregar Palabras Clave
- Abra Modelos > Transcriptor
- Seleccione un transcriptor Deepgram Nova-2 o Azure Speech
- En la sección Recognition Keywords en la parte inferior, escriba palabras clave y presione Enter después de cada una
- Las palabras clave se guardan automáticamente
Probar la Transcripción
- Realice una llamada de prueba y hable escenarios que usan los clientes (nombres de marca, direcciones)
- Abra el registro de conversación y revise la transcripción
- Note cualquier palabra mal escuchada
- Agregue errores recurrentes a palabras clave (si usa Nova-2 o Azure)
- Cambie de transcriptores si los problemas persisten
- Nombres de marca y nombres de productos
- Terminología técnica
- Números y direcciones
- Diferentes acentos y patrones de habla
- Condiciones de ruido de fondo