Aperçu
Le transcripteur est la première étape dans le pipeline de traitement de ton agent. Il convertit la parole du client en texte que le modèle IA peut comprendre et auquel répondre. Une transcription précise est critique—les erreurs à cette étape se répercutent sur l’ensemble de la conversation.Configure le transcripteur sous Modèles > Transcripteur dans les paramètres de ton agent. Les modifications s’appliquent immédiatement.
Transcripteurs Disponibles
Deepgram Nova-3 General
Deepgram Nova-3 General
Dernière génération avec précision améliorée et support multilingue.Pourquoi ça fonctionne :
- Latence ultra-faible (~300ms) pour les conversations en temps réel
- Support de 21 langues : variantes anglaises plus bulgare, tchèque, finnois, hindi, hongrois, japonais, coréen, polonais, russe, ukrainien, vietnamien, et plus
- Forte précision sur audio téléphonique et environnements bruyants
- Gère bien les chevauchements de voix et les mots de remplissage
- Recommandation par défaut lorsque ton langue est supportée
- Applications critiques en termes de vitesse
- Agents multilingues (quand toutes les langues couvertes par Nova-3)
- Interactions clients en temps réel
- Mode multilingue : anglais, espagnol, français, allemand, hindi, russe, portugais, japonais, italien, néerlandais
- Anglais : en-US, en-GB, en-AU, en-IN, en-NZ
- Européen : allemand (de), néerlandais (nl), suédois (sv), danois (da), bulgare (bg), tchèque (cs), finnois (fi), hongrois (hu), polonais (pl), russe (ru), ukrainien (uk)
- Asiatique : hindi (hi), japonais (ja), coréen (ko), vietnamien (vi)
Azure Speech
Azure Speech
Couverture linguistique massive (150+) avec fiabilité de niveau entreprise.Pourquoi ça fonctionne :
- 150+ langues et locales
- Détection automatique multilingue (2-10 langues)
- Hébergement UE disponible
- Tarification d’entreprise prévisible
- Qualité constante sur toutes les langues
- Langues non anglaises non couvertes par Deepgram
- Agents multilingues avec besoins de détection automatique
- Exigences de conformité d’entreprise
- Déploiements mondiaux servant des marchés diversifiés
- 150+ langues incluant : 18 variantes arabes, 24 variantes espagnoles, 18 variantes anglaises, plus afrikaans, amharique, bengali, catalan, chinois (6 variantes incluant wu et cantonais), tchèque, danois, néerlandais, filipino, finnois, français, allemand, grec, hébreu, hindi, hongrois, indonésien, italien, japonais, coréen, malais, norvégien, polonais, portugais, roumain, russe, suédois, thaï, turc, ukrainien, vietnamien, et bien d’autres
- Latence plus élevée que Deepgram (~500-700ms)
Autres Transcripteurs
Deepgram Nova-3 Medical
Deepgram Nova-3 Medical
Spécialisé pour la terminologie médicale (anglais uniquement).Pourquoi ça fonctionne :
- Optimisé pour le vocabulaire médical anglais
- Reconnaissance précise des termes médicaux, procédures, médicaments
- Faible latence comme Nova-3 General (~300ms)
- Applications de santé (conformité HIPAA disponible avec BAA)
- Prise de rendez-vous médicaux
- Services de télésanté
- Documentation clinique
- Anglais : en-US, en-GB, en-AU, en-CA, en-IE, en-IN, en-NZ
- Anglais uniquement
- Nécessite un cas d’usage spécifique au secteur de la santé
Deepgram Nova-2 General
Deepgram Nova-2 General
Génération précédente avec la couverture linguistique la plus large (40+).Pourquoi ça fonctionne :
- Excellente précision et faible latence (~300ms)
- Liste de langues la plus large : bulgare, catalan, tchèque, danois, allemand, grec, estonien, finnois, français, hindi, hongrois, indonésien, italien, japonais, coréen, lituanien, letton, malais, néerlandais, norvégien, polonais, portugais, roumain, russe, slovaque, suédois, thaï, turc, ukrainien, vietnamien, variantes chinoises, et plus
- Performance éprouvée pour les équipes mondiales
- Support des mots-clés pour les noms de marque
- Langues pas encore dans Nova-3 (catalan, portugais-BR, thaï, chinois, etc.)
- Déploiements multilingues mondiaux
- Équipes ayant besoin de langues régionales spécifiques
- Mode multilingue : anglais + espagnol uniquement
- 40+ langues incluant : catalan (ca), grec (el), estonien (et), indonésien (id), lituanien (lt), letton (lv), malais (ms), norvégien (no), portugais (pt, pt-BR, pt-PT), roumain (ro), slovaque (sk), thaï (th), turc (tr), chinois (zh, zh-CN, zh-TW, zh-Hans, zh-Hant, zh-HK), français (fr, fr-CA), espagnol (es, es-419)
- Légèrement en retard sur Nova-3 pour les améliorations de précision
Modèles Spécialisés Deepgram Nova-2
Modèles Spécialisés Deepgram Nova-2
Variantes spécifiques à des tâches optimisées pour des cas d’usage précis.Nova-2 Phone Call :
- Optimisé spécifiquement pour audio téléphonique (anglais uniquement)
- Anglais : en-US, en-GB
- Optimisé pour transcription de réunions (anglais uniquement)
- Anglais : en-US, en-GB
- Optimisé pour conversations IA (anglais uniquement)
- Anglais : en-US, en-GB
- La plupart des équipes devraient utiliser Nova-3 General ou Nova-2 General
- Ces modèles spécialisés sont pour des besoins d’optimisation spécifiques
Choisir le Bon Transcripteur
Cadre de Sélection
1. Exigences Linguistiques
1. Exigences Linguistiques
Choisis en fonction des langues dont tu as besoin :Langue supportée par Nova-3 ? → Deepgram Nova-3 General (recommandé - plus rapide et plus précis)
- 21 langues : anglais, espagnol, français, allemand, néerlandais, suédois, danois, bulgare, tchèque, finnois, hindi, hongrois, japonais, coréen, polonais, russe, ukrainien, vietnamien, et plus
- Utilise le mode multilingue Nova-3 lorsque tu sers plusieurs langues de cette liste
- 40+ langues incluant : catalan, portugais, thaï, chinois, grec, estonien, indonésien, lituanien, letton, malais, norvégien, roumain, slovaque, turc
2. Latence vs. Couverture
2. Latence vs. Couverture
Vitesse critique (moins de 400ms) ?
- Deepgram Nova-3 ou Nova-2 (~300ms)
- Azure Speech (~500-700ms)
- Azure Speech (150+ langues, sacrifie la vitesse)
3. Conformité Régionale
3. Conformité Régionale
Hébergement UE requis ?
- Azure Speech (régions UE : Europe Ouest, Europe Nord)
- Deepgram utilise des endpoints UE mais les données peuvent être traitées sur des serveurs US
Configuration de Langue
Configuration Langue Unique
Pour les agents servant une langue :- Ouvre Modèles > Transcripteur
- Utilise le Sélecteur de Langue pour filtrer les transcripteurs
- Sélectionne par nom de langue (ex., “Français”) ou code de locale (ex., “fr-FR”)
- Choisis le transcripteur avec la meilleure latence/précision pour tes besoins
- en-US : Anglais américain
- en-GB : Anglais britannique
- en-AU : Anglais australien
- en-IN : Anglais indien
- de-DE : Allemand
- es-ES : Espagnol (Espagne)
- fr-FR : Français
- zh-CN : Chinois (Simplifié)
- zh-TW : Chinois (Traditionnel)
Support Multilingue
Deepgram Nova-3 Multilingue :- Modèle unique supportant anglais, espagnol, français, allemand, hindi, russe, portugais, japonais, italien, néerlandais
- Pas de sélection de langue nécessaire—gère automatiquement les 10 langues
- Sélectionne plusieurs langues (2-10) pour la détection automatique
- Azure détecte la langue depuis les premiers mots et transcrit en conséquence
Mots-clés
Aidez ton transcripteur à reconnaître avec précision les noms de marque et les termes techniques.Les mots-clés sont supportés sur les modèles Deepgram Nova-2 et Azure Speech. Nova-3 ne supporte actuellement pas les mots-clés.
Quoi Booster
Les transcripteurs peuvent avoir du mal avec :- Noms de marque (entreprise, produits, concurrents)
- Jargon de l’industrie (termes techniques, acronymes)
- Noms propres (noms de personnes, lieux)
Comment Ajouter des Mots-clés
- Ouvre Modèles > Transcripteur
- Sélectionne un transcripteur Deepgram Nova-2 ou Azure Speech
- Dans la section Mots-clés de Reconnaissance en bas, tapez les mots-clés et appuyez sur Entrée après chacun
- Les mots-clés sont sauvegardés automatiquement
Tester la Transcription
- Passe un appel test et parlez de scénarios que les clients utilisent (noms de marque, adresses)
- Ouvre le journal de conversation et Examine la transcription
- Note les mots mal entendus
- Ajoute les erreurs récurrentes aux mots-clés (si tu utilises Nova-2 ou Azure)
- Change de transcripteurs si les problèmes persistent
- Noms de marque et de produits
- Terminologie technique
- Numéros et adresses
- Différents accents et schémas de parole
- Conditions de bruit de fond