Saltar al contenido principal

Descripción General

El transcriptor es el primer paso en el proceso de su agente. Convierte el habla del cliente en texto que el modelo de IA puede comprender y responder. La transcripción precisa es crítica—los errores en este paso se propagan a través de toda la conversación.
Configure el transcriptor en Modelos > Transcriptor en la configuración de su agente. Los cambios se aplican inmediatamente.

Transcriptores Disponibles

Deepgram Nova-3 General

Última generación con precisión mejorada y soporte multilingüe.Por qué funciona:
  • Latencia ultra-baja (~300ms) para conversaciones en tiempo real
  • Soporta 21 idiomas: variantes de inglés más búlgaro, checo, finlandés, hindi, húngaro, japonés, coreano, polaco, ruso, ucraniano, vietnamita y más
  • Fuerte precisión en audio telefónico y entornos ruidosos
  • Maneja bien las conversaciones cruzadas y palabras de relleno
Mejor para:
  • Recomendación predeterminada cuando su idioma es soportado
  • Aplicaciones críticas en velocidad
  • Agentes multilingües (cuando todos los idiomas están cubiertos por Nova-3)
  • Interacciones con clientes en tiempo real
Idiomas soportados:
  • Modo multilingüe: Inglés, español, francés, alemán, hindi, ruso, portugués, japonés, italiano, holandés
  • Inglés: en-US, en-GB, en-AU, en-IN, en-NZ
  • Europeos: Alemán (de), holandés (nl), sueco (sv), danés (da), búlgaro (bg), checo (cs), finlandés (fi), húngaro (hu), polaco (pl), ruso (ru), ucraniano (uk)
  • Asiáticos: Hindi (hi), japonés (ja), coreano (ko), vietnamita (vi)
Cobertura masiva de idiomas (150+) con confiabilidad de nivel empresarial.Por qué funciona:
  • 150+ idiomas y configuraciones regionales
  • Auto-detección multilingüe (2-10 idiomas)
  • Alojamiento en la UE disponible
  • Precios empresariales predecibles
  • Calidad consistente en todos los idiomas
Mejor para:
  • Idiomas no ingleses no cubiertos por Deepgram
  • Agentes multilingües con necesidades de auto-detección
  • Requisitos de cumplimiento empresarial
  • Despliegues globales que sirven mercados diversos
Idiomas soportados:
  • 150+ idiomas incluyendo: 18 variantes de árabe, 24 variantes de español, 18 variantes de inglés, más afrikáans, amhárico, bengalí, catalán, chino (6 variantes incluyendo wu y cantonés), checo, danés, holandés, filipino, finlandés, francés, alemán, griego, hebreo, hindi, húngaro, indonesio, italiano, japonés, coreano, malayo, noruego, polaco, portugués, rumano, ruso, sueco, tailandés, turco, ucraniano, vietnamita y muchos más
Compensaciones:
  • Mayor latencia que Deepgram (~500-700ms)

Otros Transcriptores

Especializado para terminología médica (solo inglés).Por qué funciona:
  • Optimizado para vocabulario médico en inglés
  • Reconocimiento preciso de términos médicos, procedimientos, medicamentos
  • Baja latencia como Nova-3 General (~300ms)
Mejor para:
  • Aplicaciones de salud (cumplimiento HIPAA disponible con BAA)
  • Reserva de citas médicas
  • Servicios de telesalud
  • Documentación clínica
Idiomas soportados:
  • Inglés: en-US, en-GB, en-AU, en-CA, en-IE, en-IN, en-NZ
Limitaciones:
  • Solo inglés
  • Requiere caso de uso específico de salud
Generación anterior con la cobertura de idiomas más amplia (40+).Por qué funciona:
  • Excelente precisión y baja latencia (~300ms)
  • Lista de idiomas más amplia: búlgaro, catalán, checo, danés, alemán, griego, estonio, finlandés, francés, hindi, húngaro, indonesio, italiano, japonés, coreano, lituano, letón, malayo, holandés, noruego, polaco, portugués, rumano, ruso, eslovaco, sueco, tailandés, turco, ucraniano, vietnamita, variantes chinas y más
  • Rendimiento probado para equipos globales
  • Soporte de palabras clave para nombres de marca
Mejor para:
  • Idiomas que aún no están en Nova-3 (catalán, portugués-BR, tailandés, chino, etc.)
  • Despliegues multilingües globales
  • Equipos que necesitan idiomas regionales específicos
Idiomas soportados:
  • Modo multilingüe: Solo inglés + español
  • 40+ idiomas incluyendo: Catalán (ca), griego (el), estonio (et), indonesio (id), lituano (lt), letón (lv), malayo (ms), noruego (no), portugués (pt, pt-BR, pt-PT), rumano (ro), eslovaco (sk), tailandés (th), turco (tr), chino (zh, zh-CN, zh-TW, zh-Hans, zh-Hant, zh-HK), francés (fr, fr-CA), español (es, es-419)
Compensaciones:
  • Ligeramente por detrás de Nova-3 en mejoras de precisión
Variantes específicas de tareas optimizadas para casos de uso limitados.Nova-2 Phone Call:
  • Optimizado específicamente para audio de telefonía (solo inglés)
  • Inglés: en-US, en-GB
Nova-2 Meeting:
  • Optimizado para transcripción de reuniones (solo inglés)
  • Inglés: en-US, en-GB
Nova-2 Conversational AI:
  • Optimizado para conversaciones con IA (solo inglés)
  • Inglés: en-US, en-GB
Cuándo usar:
  • La mayoría de equipos deben usar Nova-3 General o Nova-2 General
  • Estos modelos especializados son para necesidades de optimización específicas

Elegir el Transcriptor Correcto

Marco de Selección

Elija según los idiomas que necesita:¿Idioma soportado por Nova-3? → Deepgram Nova-3 General (recomendado - más rápido y preciso)
  • 21 idiomas: inglés, español, francés, alemán, holandés, sueco, danés, búlgaro, checo, finlandés, hindi, húngaro, japonés, coreano, polaco, ruso, ucraniano, vietnamita y más
  • Use modo multilingüe Nova-3 cuando sirva múltiples idiomas de esta lista
¿Idioma solo en Nova-2? → Deepgram Nova-2 General
  • 40+ idiomas incluyendo: catalán, portugués, tailandés, chino, griego, estonio, indonesio, lituano, letón, malayo, noruego, rumano, eslovaco, turco
¿Idioma no en Deepgram? → Azure Speech (150+ idiomas)¿Múltiples idiomas con auto-detección? → Azure Speech (modo multilingüe para cualquier combinación)¿Inglés médico? → Deepgram Nova-3 Medical
¿Velocidad crítica (menos de 400ms)?
  • Deepgram Nova-3 o Nova-2 (~300ms)
¿Latencia moderada aceptable (menos de 700ms)?
  • Azure Speech (~500-700ms)
¿Cobertura de idiomas más importante que velocidad?
  • Azure Speech (150+ idiomas, sacrifica velocidad)
¿Alojamiento en la UE requerido?
  • Azure Speech (regiones de la UE: Europa Occidental, Europa del Norte)
  • Deepgram usa puntos finales de la UE pero los datos pueden procesarse en servidores de EE.UU.

Configuración de Idioma

Configuración de Idioma Único

Para agentes que sirven un idioma:
  1. Abra Modelos > Transcriptor
  2. Use el Selector de Idioma para filtrar transcriptores
  3. Seleccione por nombre de idioma (ej., “Inglés”) o código de configuración regional (ej., “en-US”)
  4. Elija el transcriptor con mejor latencia/precisión para sus necesidades
Variantes de idioma comunes:
  • en-US: Inglés americano
  • en-GB: Inglés británico
  • en-AU: Inglés australiano
  • en-IN: Inglés indio
  • de-DE: Alemán
  • es-ES: Español (España)
  • fr-FR: Francés
  • zh-CN: Chino (simplificado)
  • zh-TW: Chino (tradicional)
Seleccione la variante que coincida con su base de clientes para mejor precisión.

Soporte Multilingüe

Deepgram Nova-3 Multilingüe:
  • Modelo único que soporta inglés, español, francés, alemán, hindi, ruso, portugués, japonés, italiano, holandés
  • No se necesita selección de idioma—maneja automáticamente los 10 idiomas
Azure Speech Multilingüe:
  • Seleccione múltiples idiomas (2-10) para auto-detección
  • Azure detecta el idioma desde las primeras palabras y transcribe en consecuencia

Palabras Clave

Ayude a su transcriptor a reconocer nombres de marca y términos técnicos con precisión.
Las palabras clave son soportadas en modelos Deepgram Nova-2 y Azure Speech. Nova-3 actualmente no soporta palabras clave.

Qué Reforzar

Los transcriptores pueden tener dificultades con:
  • Nombres de marca (empresa, productos, competidores)
  • Jerga de la industria (términos técnicos, acrónimos)
  • Nombres propios (nombres de personas, ubicaciones)

Cómo Agregar Palabras Clave

  1. Abra Modelos > Transcriptor
  2. Seleccione un transcriptor Deepgram Nova-2 o Azure Speech
  3. En la sección Recognition Keywords en la parte inferior, escriba palabras clave y presione Enter después de cada una
  4. Las palabras clave se guardan automáticamente
Agregue palabras clave según sea necesario durante las pruebas. Revise las transcripciones de llamadas para palabras mal escuchadas y agréguelas como palabras clave para mejorar el reconocimiento.

Probar la Transcripción

  1. Realice una llamada de prueba y hable escenarios que usan los clientes (nombres de marca, direcciones)
  2. Abra el registro de conversación y revise la transcripción
  3. Note cualquier palabra mal escuchada
  4. Agregue errores recurrentes a palabras clave (si usa Nova-2 o Azure)
  5. Cambie de transcriptores si los problemas persisten
Qué probar:
  • Nombres de marca y nombres de productos
  • Terminología técnica
  • Números y direcciones
  • Diferentes acentos y patrones de habla
  • Condiciones de ruido de fondo

Próximos Pasos