Panoramica
Il trascrittore è il primo passo nella pipeline di elaborazione del tuo agente. Converte il parlato del cliente in testo che il modello AI può comprendere e a cui può rispondere. Una trascrizione accurata è critica—gli errori in questo passaggio si propagano attraverso l’intera conversazione.Configura il trascrittore sotto Models > Transcriber nelle impostazioni del tuo agente. Le modifiche si applicano immediatamente.
Trascrittori Disponibili
Deepgram Nova-3 General
Deepgram Nova-3 General
Ultima generazione con accuratezza migliorata e supporto multilingue.Perché funziona:
- Latenza ultra-bassa (~300ms) per conversazioni in tempo reale
- Supporta 21 lingue: varianti inglesi più bulgaro, ceco, finlandese, hindi, ungherese, giapponese, coreano, polacco, russo, ucraino, vietnamita e altre
- Forte accuratezza su audio telefonico e ambienti rumorosi
- Gestisce bene sovrapposizioni vocali e parole di riempimento
- Raccomandazione predefinita quando la tua lingua è supportata
- Applicazioni critiche per la velocità
- Agenti multilingue (quando tutte le lingue sono coperte da Nova-3)
- Interazioni con clienti in tempo reale
- Modalità multilingue: Inglese, spagnolo, francese, tedesco, hindi, russo, portoghese, giapponese, italiano, olandese
- Inglese: en-US, en-GB, en-AU, en-IN, en-NZ
- Europee: Tedesco (de), olandese (nl), svedese (sv), danese (da), bulgaro (bg), ceco (cs), finlandese (fi), ungherese (hu), polacco (pl), russo (ru), ucraino (uk)
- Asiatiche: Hindi (hi), giapponese (ja), coreano (ko), vietnamita (vi)
Azure Speech
Azure Speech
Copertura linguistica massiccia (150+) con affidabilità di livello enterprise.Perché funziona:
- 150+ lingue e varianti locali
- Rilevamento automatico multilingue (2-10 lingue)
- Hosting UE disponibile
- Prezzi enterprise prevedibili
- Qualità coerente in tutte le lingue
- Lingue non inglesi non coperte da Deepgram
- Agenti multilingue con esigenze di rilevamento automatico
- Requisiti di conformità enterprise
- Implementazioni globali che servono mercati diversi
- 150+ lingue incluse: 18 varianti arabe, 24 varianti spagnole, 18 varianti inglesi, più afrikaans, amarico, bengalese, catalano, cinese (6 varianti inclusi wu e cantonese), ceco, danese, olandese, filippino, finlandese, francese, tedesco, greco, ebraico, hindi, ungherese, indonesiano, italiano, giapponese, coreano, malese, norvegese, polacco, portoghese, rumeno, russo, svedese, thai, turco, ucraino, vietnamita e molte altre
- Latenza più alta di Deepgram (~500-700ms)
Altri Trascrittori
Deepgram Nova-3 Medical
Deepgram Nova-3 Medical
Specializzato per terminologia sanitaria (solo inglese).Perché funziona:
- Ottimizzato per vocabolario medico inglese
- Riconoscimento accurato di termini medici, procedure, farmaci
- Bassa latenza come Nova-3 General (~300ms)
- Applicazioni sanitarie (conformità HIPAA disponibile con BAA)
- Prenotazione appuntamenti medici
- Servizi di telemedicina
- Documentazione clinica
- Inglese: en-US, en-GB, en-AU, en-CA, en-IE, en-IN, en-NZ
- Solo inglese
- Richiede caso d’uso specifico sanitario
Deepgram Nova-2 General
Deepgram Nova-2 General
Generazione precedente con copertura linguistica più ampia (40+).Perché funziona:
- Eccellente accuratezza e bassa latenza (~300ms)
- Lista di lingue più ampia: bulgaro, catalano, ceco, danese, tedesco, greco, estone, finlandese, francese, hindi, ungherese, indonesiano, italiano, giapponese, coreano, lituano, lettone, malese, olandese, norvegese, polacco, portoghese, rumeno, russo, slovacco, svedese, thai, turco, ucraino, vietnamita, varianti cinesi e altre
- Prestazioni comprovate per team globali
- Supporto keywords per nomi di brand
- Lingue non ancora in Nova-3 (catalano, portoghese-BR, thai, cinese, ecc.)
- Implementazioni multilingue globali
- Team che necessitano di lingue regionali specifiche
- Modalità multilingue: Solo inglese + spagnolo
- 40+ lingue incluse: Catalano (ca), greco (el), estone (et), indonesiano (id), lituano (lt), lettone (lv), malese (ms), norvegese (no), portoghese (pt, pt-BR, pt-PT), rumeno (ro), slovacco (sk), thai (th), turco (tr), cinese (zh, zh-CN, zh-TW, zh-Hans, zh-Hant, zh-HK), francese (fr, fr-CA), spagnolo (es, es-419)
- Leggermente dietro Nova-3 nei miglioramenti di accuratezza
Modelli Specializzati Deepgram Nova-2
Modelli Specializzati Deepgram Nova-2
Varianti specifiche per compito ottimizzate per casi d’uso ristretti.Nova-2 Phone Call:
- Ottimizzato specificamente per audio telefonico (solo inglese)
- Inglese: en-US, en-GB
- Ottimizzato per trascrizione riunioni (solo inglese)
- Inglese: en-US, en-GB
- Ottimizzato per conversazioni AI (solo inglese)
- Inglese: en-US, en-GB
- La maggior parte dei team dovrebbe usare Nova-3 General o Nova-2 General
- Questi modelli specializzati sono per esigenze di ottimizzazione specifiche
Scegliere il Trascrittore Giusto
Framework di Selezione
1. Requisiti Linguistici
1. Requisiti Linguistici
Scegli in base alle lingue di cui hai bisogno:Lingua supportata da Nova-3? → Deepgram Nova-3 General (consigliato - più veloce e più accurato)
- 21 lingue: Inglese, spagnolo, francese, tedesco, olandese, svedese, danese, bulgaro, ceco, finlandese, hindi, ungherese, giapponese, coreano, polacco, russo, ucraino, vietnamita e altre
- Usa la modalità multilingue Nova-3 quando servi più lingue da questa lista
- 40+ lingue incluse: Catalano, portoghese, thai, cinese, greco, estone, indonesiano, lituano, lettone, malese, norvegese, rumeno, slovacco, turco
2. Latenza vs. Copertura
2. Latenza vs. Copertura
Velocità critica (sotto 400ms)?
- Deepgram Nova-3 o Nova-2 (~300ms)
- Azure Speech (~500-700ms)
- Azure Speech (150+ lingue, sacrifica velocità)
3. Conformità Regionale
3. Conformità Regionale
Richiesto hosting UE?
- Azure Speech (regioni UE: West Europe, North Europe)
- Deepgram usa endpoint UE ma i dati possono essere elaborati su server US
Configurazione Lingua
Configurazione Lingua Singola
Per agenti che servono una lingua:- Apri Models > Transcriber
- Usa il Language Picker per filtrare i trascrittori
- Seleziona per nome lingua (es. “Italian”) o codice locale (es. “it-IT”)
- Scegli il trascrittore con migliore latenza/accuratezza per le tue esigenze
- en-US: Inglese americano
- en-GB: Inglese britannico
- en-AU: Inglese australiano
- en-IN: Inglese indiano
- de-DE: Tedesco
- es-ES: Spagnolo (Spagna)
- fr-FR: Francese
- zh-CN: Cinese (semplificato)
- zh-TW: Cinese (tradizionale)
Supporto Multilingue
Deepgram Nova-3 Multilingue:- Modello singolo che supporta inglese, spagnolo, francese, tedesco, hindi, russo, portoghese, giapponese, italiano, olandese
- Non è necessaria la selezione della lingua—gestisce automaticamente tutte le 10 lingue
- Seleziona più lingue (2-10) per il rilevamento automatico
- Azure rileva la lingua dalle prime parole e trascrive di conseguenza
Keywords
Aiuta il tuo trascrittore a riconoscere accuratamente nomi di brand e termini tecnici.Le keywords sono supportate sui modelli Deepgram Nova-2 e Azure Speech. Nova-3 attualmente non supporta le keywords.
Cosa Potenziare
I trascrittori possono avere difficoltà con:- Nomi di brand (azienda, prodotti, concorrenti)
- Gergo del settore (termini tecnici, acronimi)
- Nomi propri (nomi di persone, luoghi)
Come Aggiungere Keywords
- Apri Models > Transcriber
- Seleziona un trascrittore Deepgram Nova-2 o Azure Speech
- Nella sezione Recognition Keywords in basso, digita le keywords e premi Invio dopo ciascuna
- Le keywords vengono salvate automaticamente
Testare la Trascrizione
- Effettua una chiamata di test e parla scenari che i clienti usano (nomi di brand, indirizzi)
- Apri il log della conversazione e rivedi la trascrizione
- Nota eventuali parole male sentite
- Aggiungi errori ricorrenti alle keywords (se usi Nova-2 o Azure)
- Cambia trascrittori se i problemi persistono
- Nomi di brand e prodotti
- Terminologia tecnica
- Numeri e indirizzi
- Accenti e modelli di parlato diversi
- Condizioni di rumore di fondo