Aperçu
La voix de ton agent est un élément critique de l’expérience client. La bonne voix peut établir la confiance, transmettre le professionnalisme et s’aligner avec l’identité de ton marque. itellicoAI diffuse des catalogues en direct depuis ElevenLabs, les voix neuronales Microsoft Azure et Cartesia afin que tu puisses choisir un audio de haute qualité sans téléchargements manuels.La sélection de la voix se fait sous l’onglet Voix dans la configuration de ton agent. Les modifications s’appliquent immédiatement.
Fournisseurs de Voix
ElevenLabs
ElevenLabs
Voix IA premium avec un naturel exceptionnel et une gamme émotionnelle.Pourquoi ça fonctionne :
- Ultra-réaliste, presque impossible à distinguer d’un discours humain
- Forte gamme émotionnelle pour le service client
- Qualité constante sur tout le contenu
- Faible latence pour les conversations en temps réel
- Agents face aux clients où la qualité vocale est critique
- Applications sensibles à la marque
- Cas d’usage nécessitant l’intelligence émotionnelle
- Rachel : Femme américaine chaleureuse et professionnelle
- Adam : Homme américain confiant et clair
- Susi : Femme allemande naturelle et professionnelle (recommandé pour les agents allemands)
- Antoni : Homme calme et rassurant
Les voix ElevenLabs prennent en charge des paramètres avancés comme la stabilité et le boost de similarité—Configure dans Paramètres Vocaux.
Azure Speech (Voix Neuronales)
Azure Speech (Voix Neuronales)
Voix de niveau entreprise avec une couverture linguistique massive.Pourquoi ça fonctionne :
- 100+ langues et locales
- Hébergement UE disponible pour la conformité RGPD
- Qualité professionnelle constante
- Tarification d’entreprise prévisible
- Agents multilingues (un fournisseur pour toutes les langues)
- Exigences de conformité d’entreprise
- Applications à haut volume avec contraintes de coût
- Déploiements mondiaux
- en-US-JennyNeural : Femme américaine naturelle
- en-GB-SoniaNeural : Femme britannique, professionnelle
- de-DE-KatjaNeural : Femme allemande, autoritaire
- Neural Standard : Haute qualité, rentable
- Neural HD : Qualité améliorée
- Neural Personnalisé : Entraînez ton propre voix (entreprise uniquement)
- Légèrement moins de nuances émotionnelles qu’ElevenLabs
- Meilleur pour les conversations factuelles et professionnelles
Cartesia
Cartesia
Voix à latence ultra-faible optimisées pour l’IA conversationnelle.Pourquoi ça fonctionne :
- Optimisé pour les prises de parole en moins d’une seconde
- Livraisons expressives et énergiques
- Son moderne adapté aux agents interactifs
- Expériences web critiques en termes de vitesse
- Tests A/B aux côtés d’ElevenLabs
- Applications sensibles à la latence
- Catalogue plus petit (principalement anglais)
- Moins d’options de personnalisation
Choisir la Bonne Voix
Cadre de Sélection
1. Faire Correspondre le Fournisseur à tes Besoins
1. Faire Correspondre le Fournisseur à tes Besoins
Choisis en fonction de tes exigences :Qualité d’abord ? → ElevenLabs (le plus naturel, gamme émotionnelle)Besoin d’une langue spécifique ? → Azure Speech (forte couverture linguistique, 100+ langues)Critique en termes de vitesse ? → Cartesia (latence ultra-faible)Conformité UE ? → Azure (options hébergées en UE)
2. Considérez la Marque et l'Audience
2. Considérez la Marque et l'Audience
Contexte industriel :
- Santé : Empathique, professionnel, rassurant
- Ventes : Confiant, enthousiaste, persuasif
- Support Technique : Patient, clair, connaisseur
- Hospitalité : Chaleureux, accueillant, amical
- Les accents locaux créent une affinité avec les clients locaux
- Les accents neutres fonctionnent pour les audiences mondiales
- Filtrez par région/locale dans la bibliothèque vocale
3. Teste Avant de t'engager
3. Teste Avant de t'engager
Processus de test :
- Prévisualisez les voix ElevenLabs en utilisant le bouton lecture
- Présélectionnez 3-5 voix qui correspondent à tes critères
- Déployez chacune sur un agent de test
- Appelez et Teste avec des scénarios réalistes
- Fais évaluer par les membres de l’équipe
- Adéquation avec la marque et correspondance de personnalité
- Clarté et naturel
- Performance avec la terminologie de l’industrie
- Agréable à écouter lors de conversations de 5+ minutes
Fonctionnalités de la Bibliothèque Vocale
La bibliothèque vocale offre recherche et filtrage pour trouver rapidement la bonne voix : Rechercher par :- Nom de voix (par ex., “Sarah”, “Professional Male”)
- Fournisseur (ElevenLabs, Azure, Cartesia)
- Genre (masculin, féminin, neutre)
- Code de langue ou locale (en-US, es-ES, de-DE)
- Accent ou région (britannique, australien, américain)
- Fournisseur : Afficher seulement des fournisseurs spécifiques
- Langue : Restreindre aux exigences linguistiques
- Genre : Masculin, féminin ou neutre
- Clique sur le bouton lecture sur les voix ElevenLabs pour entendre des échantillons
- Déployez sur un agent de test pour des aperçus étendus avec des scénarios réels
- Fournisseur et technologie de génération vocale
- Support linguistique et capacités multilingues
- Badge d’hébergement UE
- Caractéristiques de genre, accent et ton