Visão Geral
O transcritor é o primeiro passo no pipeline de processamento do seu agente. Ele converte a fala do cliente em texto que o modelo de IA pode entender e responder. Transcrição precisa é crítica—erros nesta etapa se propagam por toda a conversa.Configure o transcritor em Modelos > Transcritor nas configurações do seu agente. As alterações são aplicadas imediatamente.
Transcritores Disponíveis
Deepgram Nova-3 General
Deepgram Nova-3 General
Geração mais recente com precisão aprimorada e suporte multilíngue.Por que funciona:
- Latência ultra-baixa (~300ms) para conversas em tempo real
- Suporta 21 idiomas: variantes do inglês mais búlgaro, tcheco, finlandês, hindi, húngaro, japonês, coreano, polonês, russo, ucraniano, vietnamita e outros
- Forte precisão em áudio telefônico e ambientes ruidosos
- Lida bem com conversas cruzadas e palavras de preenchimento
- Recomendação padrão quando seu idioma é suportado
- Aplicações críticas em termos de velocidade
- Agentes multilíngues (quando todos os idiomas cobertos por Nova-3)
- Interações em tempo real com clientes
- Modo multilíngue: Inglês, Espanhol, Francês, Alemão, Hindi, Russo, Português, Japonês, Italiano, Holandês
- Inglês: en-US, en-GB, en-AU, en-IN, en-NZ
- Europeus: Alemão (de), Holandês (nl), Sueco (sv), Dinamarquês (da), Búlgaro (bg), Tcheco (cs), Finlandês (fi), Húngaro (hu), Polonês (pl), Russo (ru), Ucraniano (uk)
- Asiáticos: Hindi (hi), Japonês (ja), Coreano (ko), Vietnamita (vi)
Azure Speech
Azure Speech
Cobertura massiva de idiomas (150+) com confiabilidade de nível empresarial.Por que funciona:
- 150+ idiomas e localidades
- Detecção automática multilíngue (2-10 idiomas)
- Hospedagem na UE disponível
- Preços empresariais previsíveis
- Qualidade consistente em todos os idiomas
- Idiomas não ingleses não cobertos pelo Deepgram
- Agentes multilíngues com necessidades de detecção automática
- Requisitos de conformidade empresarial
- Implantações globais servindo mercados diversos
- 150+ idiomas incluindo: 18 variantes de árabe, 24 variantes de espanhol, 18 variantes de inglês, mais afrikaans, amárico, bengali, catalão, chinês (6 variantes incluindo wu e cantonês), tcheco, dinamarquês, holandês, filipino, finlandês, francês, alemão, grego, hebraico, hindi, húngaro, indonésio, italiano, japonês, coreano, malaio, norueguês, polonês, português, romeno, russo, sueco, tailandês, turco, ucraniano, vietnamita e muitos outros
- Latência maior que Deepgram (~500-700ms)
Outros Transcritores
Deepgram Nova-3 Medical
Deepgram Nova-3 Medical
Especializado em terminologia de saúde (apenas inglês).Por que funciona:
- Otimizado para vocabulário médico em inglês
- Reconhecimento preciso de termos médicos, procedimentos, medicamentos
- Baixa latência como Nova-3 General (~300ms)
- Aplicações de saúde (conformidade HIPAA disponível com BAA)
- Agendamento de consultas médicas
- Serviços de telemedicina
- Documentação clínica
- Inglês: en-US, en-GB, en-AU, en-CA, en-IE, en-IN, en-NZ
- Apenas inglês
- Requer caso de uso específico de saúde
Deepgram Nova-2 General
Deepgram Nova-2 General
Geração anterior com cobertura de idiomas mais ampla (40+).Por que funciona:
- Excelente precisão e baixa latência (~300ms)
- Lista de idiomas mais ampla: Búlgaro, Catalão, Tcheco, Dinamarquês, Alemão, Grego, Estoniano, Finlandês, Francês, Hindi, Húngaro, Indonésio, Italiano, Japonês, Coreano, Lituano, Letão, Malaio, Holandês, Norueguês, Polonês, Português, Romeno, Russo, Eslovaco, Sueco, Tailandês, Turco, Ucraniano, Vietnamita, variantes do chinês e outros
- Desempenho comprovado para equipes globais
- Suporte a palavras-chave para nomes de marcas
- Idiomas ainda não no Nova-3 (Catalão, Português-BR, Tailandês, Chinês, etc.)
- Implantações multilíngues globais
- Equipes que precisam de idiomas regionais específicos
- Modo multilíngue: Inglês + Espanhol apenas
- 40+ idiomas incluindo: Catalão (ca), Grego (el), Estoniano (et), Indonésio (id), Lituano (lt), Letão (lv), Malaio (ms), Norueguês (no), Português (pt, pt-BR, pt-PT), Romeno (ro), Eslovaco (sk), Tailandês (th), Turco (tr), Chinês (zh, zh-CN, zh-TW, zh-Hans, zh-Hant, zh-HK), Francês (fr, fr-CA), Espanhol (es, es-419)
- Ligeiramente atrás do Nova-3 em melhorias de precisão
Modelos Especializados Deepgram Nova-2
Modelos Especializados Deepgram Nova-2
Variantes específicas de tarefas otimizadas para casos de uso estreitos.Nova-2 Phone Call:
- Otimizado especificamente para áudio de telefonia (apenas inglês)
- Inglês: en-US, en-GB
- Otimizado para transcrição de reuniões (apenas inglês)
- Inglês: en-US, en-GB
- Otimizado para conversas de IA (apenas inglês)
- Inglês: en-US, en-GB
- A maioria das equipes deve usar Nova-3 General ou Nova-2 General
- Estes modelos especializados são para necessidades específicas de otimização
Escolhendo o Transcritor Certo
Framework de Seleção
1. Requisitos de Idioma
1. Requisitos de Idioma
Escolha com base nos idiomas que você precisa:Idioma suportado por Nova-3? → Deepgram Nova-3 General (recomendado - mais rápido e preciso)
- 21 idiomas: Inglês, Espanhol, Francês, Alemão, Holandês, Sueco, Dinamarquês, Búlgaro, Tcheco, Finlandês, Hindi, Húngaro, Japonês, Coreano, Polonês, Russo, Ucraniano, Vietnamita e outros
- Use modo multilíngue Nova-3 ao atender múltiplos idiomas desta lista
- 40+ idiomas incluindo: Catalão, Português, Tailandês, Chinês, Grego, Estoniano, Indonésio, Lituano, Letão, Malaio, Norueguês, Romeno, Eslovaco, Turco
2. Latência vs. Cobertura
2. Latência vs. Cobertura
Velocidade crítica (abaixo de 400ms)?
- Deepgram Nova-3 ou Nova-2 (~300ms)
- Azure Speech (~500-700ms)
- Azure Speech (150+ idiomas, sacrifica velocidade)
3. Conformidade Regional
3. Conformidade Regional
Hospedagem na UE necessária?
- Azure Speech (regiões UE: Europa Ocidental, Europa do Norte)
- Deepgram usa endpoints da UE mas dados podem ser processados em servidores dos EUA
Configuração de Idioma
Configuração de Idioma Único
Para agentes atendendo um idioma:- Abra Modelos > Transcritor
- Use o Seletor de Idioma para filtrar transcritores
- Selecione por nome de idioma (ex: “Português”) ou código de localidade (ex: “pt-BR”)
- Escolha o transcritor com melhor latência/precisão para suas necessidades
- en-US: Inglês Americano
- en-GB: Inglês Britânico
- en-AU: Inglês Australiano
- en-IN: Inglês Indiano
- de-DE: Alemão
- es-ES: Espanhol (Espanha)
- fr-FR: Francês
- pt-BR: Português (Brasil)
- pt-PT: Português (Portugal)
- zh-CN: Chinês (Simplificado)
- zh-TW: Chinês (Tradicional)
Suporte Multilíngue
Deepgram Nova-3 Multilíngue:- Modelo único suportando Inglês, Espanhol, Francês, Alemão, Hindi, Russo, Português, Japonês, Italiano, Holandês
- Não é necessária seleção de idioma—lida automaticamente com todos os 10 idiomas
- Selecione múltiplos idiomas (2-10) para detecção automática
- Azure detecta idioma das primeiras palavras e transcreve de acordo
Palavras-Chave
Ajude seu transcritor a reconhecer nomes de marcas e termos técnicos com precisão.Palavras-chave são suportadas nos modelos Deepgram Nova-2 e Azure Speech. Nova-3 atualmente não suporta palavras-chave.
O Que Reforçar
Transcritores podem ter dificuldade com:- Nomes de marcas (empresa, produtos, concorrentes)
- Jargão da indústria (termos técnicos, acrônimos)
- Nomes próprios (nomes de pessoas, localizações)
Como Adicionar Palavras-Chave
- Abra Modelos > Transcritor
- Selecione um transcritor Deepgram Nova-2 ou Azure Speech
- Na seção Palavras-Chave de Reconhecimento no final, digite palavras-chave e pressione Enter após cada uma
- Palavras-chave são salvas automaticamente
Testando Transcrição
- Faça uma chamada de teste e fale cenários que clientes usam (nomes de marcas, endereços)
- Abra o log de conversação e revise a transcrição
- Note quaisquer palavras mal ouvidas
- Adicione erros recorrentes a palavras-chave (se usando Nova-2 ou Azure)
- Mude de transcritor se problemas persistirem
- Nomes de marcas e produtos
- Terminologia técnica
- Números e endereços
- Diferentes sotaques e padrões de fala
- Condições de ruído de fundo