Saltar para o conteúdo principal

Visão Geral

A voz do seu agente é uma parte crítica da experiência do cliente. A voz certa pode construir confiança, transmitir profissionalismo e alinhar-se com a identidade da sua marca. itellicoAI transmite catálogos ao vivo de ElevenLabs, vozes neurais Microsoft Azure e Cartesia para que você possa escolher áudio de alta qualidade sem uploads manuais.
A seleção de voz acontece na aba Voz na configuração do seu agente. As alterações se aplicam imediatamente.

Provedores de Voz

ElevenLabs

Vozes IA premium com naturalidade excepcional e alcance emocional.Por que funciona:
  • Ultra-realista, quase indistinguível da fala humana
  • Forte alcance emocional para atendimento ao cliente
  • Qualidade consistente em todo o conteúdo
  • Baixa latência para conversas em tempo real
Ideal para:
  • Agentes voltados ao cliente onde qualidade de voz é crítica
  • Aplicações sensíveis à marca
  • Casos de uso que requerem inteligência emocional
Vozes populares:
  • Rachel: Mulher americana calorosa e profissional
  • Adam: Homem americano confiante e claro
  • Susi: Mulher alemã natural e profissional (recomendado para agentes alemães)
  • Antoni: Homem calmo e tranquilizador
Vozes ElevenLabs suportam configurações avançadas como estabilidade e boost de similaridade—configure em Configurações de Voz.
Vozes de nível empresarial com cobertura de idiomas massiva.Por que funciona:
  • 100+ idiomas e localidades
  • Hospedagem na UE disponível para conformidade GDPR
  • Qualidade profissional consistente
  • Preços empresariais previsíveis
Ideal para:
  • Agentes multilíngues (um provedor para todos os idiomas)
  • Requisitos de conformidade empresarial
  • Aplicações de alto volume com restrições de custo
  • Implementações globais
Vozes populares:
  • en-US-JennyNeural: Mulher americana natural
  • en-GB-SoniaNeural: Mulher britânica, profissional
  • de-DE-KatjaNeural: Mulher alemã, autoritária
Níveis de voz:
  • Neural Padrão: Alta qualidade, econômico
  • Neural HD: Qualidade aprimorada
  • Neural Personalizado: Treine sua própria voz (apenas empresas)
Compensações:
  • Nuances emocionais ligeiramente menores que ElevenLabs
  • Melhor para conversas factuais e profissionais
Vozes de latência ultra-baixa otimizadas para IA conversacional.Por que funciona:
  • Otimizado para troca de turnos em menos de um segundo
  • Entregas expressivas e enérgicas
  • Som moderno ajustado para agentes interativos
Ideal para:
  • Experiências web críticas em velocidade
  • Testes A/B ao lado de ElevenLabs
  • Aplicações sensíveis à latência
Compensações:
  • Catálogo menor (principalmente inglês)
  • Menos opções de personalização
Precisa de outro provedor TTS (Google Cloud, Amazon Polly)? Entre em contato com seu gerente de sucesso—adicionaremos ao catálogo.

Escolher a Voz Certa

Framework de Seleção

Escolha com base em seus requisitos:Qualidade primeiro? → ElevenLabs (mais natural, alcance emocional)Precisa de idioma específico? → Azure Speech (forte cobertura de idiomas, 100+ idiomas)Velocidade crítica? → Cartesia (latência ultra-baixa)Conformidade UE? → Azure (opções hospedadas na UE)
Contexto de indústria:
  • Saúde: Empático, profissional, tranquilizador
  • Vendas: Confiante, entusiasta, persuasivo
  • Suporte Técnico: Paciente, claro, conhecedor
  • Hospitalidade: Caloroso, acolhedor, amigável
Considerações de sotaque:
  • Sotaques locais criam rapport com clientes locais
  • Sotaques neutros funcionam para públicos globais
  • Filtre por região/localidade na biblioteca de voz
Processo de teste:
  1. Pré-visualize vozes ElevenLabs usando o botão play
  2. Pré-selecione 3-5 vozes que correspondem aos seus critérios
  3. Implante cada uma em um agente de teste
  4. Ligue e teste com cenários realistas
  5. Peça aos membros da equipe para avaliar
Critérios de avaliação:
  • Adequação à marca e correspondência de personalidade
  • Clareza e naturalidade
  • Desempenho com terminologia da indústria
  • Agradável de ouvir em conversas de 5+ minutos

Recursos da Biblioteca de Voz

A biblioteca de voz fornece pesquisa e filtragem para encontrar a voz certa rapidamente: Pesquisar por:
  • Nome da voz (ex., “Sarah”, “Professional Male”)
  • Provedor (ElevenLabs, Azure, Cartesia)
  • Gênero (masculino, feminino, neutro)
  • Código de idioma ou localidade (en-US, es-ES, de-DE)
  • Sotaque ou região (britânico, australiano, americano)
Filtrar por:
  • Provedor: Mostrar apenas provedores específicos
  • Idioma: Restringir a requisitos de idioma
  • Gênero: Masculino, feminino ou neutro
Pré-visualização:
  • Clique no botão play nas vozes ElevenLabs para ouvir amostras
  • Implante em agente de teste para pré-visualizações estendidas com cenários reais
Metadados exibidos:
  • Provedor e tecnologia de geração de voz
  • Suporte de idiomas e capacidades multilíngues
  • Badge de hospedagem na UE
  • Características de gênero, sotaque e tom

Próximos Passos