Übersicht
Der Transcriber ist der erste Schritt in der Verarbeitungspipeline deines Agenten. Er wandelt Kundensprache in Text um, den das KI-Modell verstehen und darauf antworten kann. Genaue Transkription ist entscheidend – Fehler in diesem Schritt wirken sich auf das gesamte Gespräch aus.Konfiguriere den Transcriber unter Modelle > Transcriber in deinen Agenteneinstellungen. Änderungen werden sofort wirksam.
Verfügbare Transcriber
Deepgram Nova-3 General
Deepgram Nova-3 General
Neueste Generation mit verbesserter Genauigkeit und mehrsprachiger Unterstützung.Warum es funktioniert:
- Ultra-niedrige Latenz (~300ms) für Echtzeit-Gespräche
- Unterstützt 21 Sprachen: Englische Varianten plus Bulgarisch, Tschechisch, Finnisch, Hindi, Ungarisch, Japanisch, Koreanisch, Polnisch, Russisch, Ukrainisch, Vietnamesisch und mehr
- Starke Genauigkeit bei Telefon-Audio und lauten Umgebungen
- Bewältigt Übersprechen und Füllwörter gut
- Standard-Empfehlung, wenn deine Sprache unterstützt wird
- Geschwindigkeitskritische Anwendungen
- Mehrsprachige Agenten (wenn alle Sprachen von Nova-3 abgedeckt werden)
- Echtzeit-Kundeninteraktionen
- Mehrsprachiger Modus: Englisch, Spanisch, Französisch, Deutsch, Hindi, Russisch, Portugiesisch, Japanisch, Italienisch, Niederländisch
- Englisch: en-US, en-GB, en-AU, en-IN, en-NZ
- Europäisch: Deutsch (de), Niederländisch (nl), Schwedisch (sv), Dänisch (da), Bulgarisch (bg), Tschechisch (cs), Finnisch (fi), Ungarisch (hu), Polnisch (pl), Russisch (ru), Ukrainisch (uk)
- Asiatisch: Hindi (hi), Japanisch (ja), Koreanisch (ko), Vietnamesisch (vi)
Azure Speech
Azure Speech
Massive Sprachabdeckung (150+) mit Enterprise-Grade-Zuverlässigkeit.Warum es funktioniert:
- 150+ Sprachen und Lokalitäten
- Mehrsprachige Auto-Erkennung (2-10 Sprachen)
- EU-Hosting verfügbar
- Vorhersehbare Enterprise-Preise
- Konsistente Qualität in allen Sprachen
- Nicht-englische Sprachen, die nicht von Deepgram abgedeckt werden
- Mehrsprachige Agenten mit Auto-Erkennungsbedarf
- Enterprise-Compliance-Anforderungen
- Globale Bereitstellungen, die verschiedene Märkte bedienen
- 150+ Sprachen einschließlich: 18 arabische Varianten, 24 spanische Varianten, 18 englische Varianten, plus Afrikaans, Amharisch, Bengali, Katalanisch, Chinesisch (6 Varianten einschließlich Wu und Kantonesisch), Tschechisch, Dänisch, Niederländisch, Filipino, Finnisch, Französisch, Deutsch, Griechisch, Hebräisch, Hindi, Ungarisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Malaiisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Schwedisch, Thai, Türkisch, Ukrainisch, Vietnamesisch und viele mehr
- Höhere Latenz als Deepgram (~500-700ms)
Andere Transcriber
Deepgram Nova-3 Medical
Deepgram Nova-3 Medical
Spezialisiert auf Gesundheitsterminologie (nur Englisch).Warum es funktioniert:
- Optimiert für englisches medizinisches Vokabular
- Genaue Erkennung von medizinischen Begriffen, Verfahren, Medikamenten
- Niedrige Latenz wie Nova-3 General (~300ms)
- Gesundheitsanwendungen (HIPAA-Compliance mit BAA verfügbar)
- Medizinische Terminbuchung
- Telemedizin-Dienste
- Klinische Dokumentation
- Englisch: en-US, en-GB, en-AU, en-CA, en-IE, en-IN, en-NZ
- Nur Englisch
- Erfordert gesundheitsspezifischen Anwendungsfall
Deepgram Nova-2 General
Deepgram Nova-2 General
Vorherige Generation mit breitester Sprachabdeckung (40+).Warum es funktioniert:
- Hervorragende Genauigkeit und niedrige Latenz (~300ms)
- Breiteste Sprachliste: Bulgarisch, Katalanisch, Tschechisch, Dänisch, Deutsch, Griechisch, Estnisch, Finnisch, Französisch, Hindi, Ungarisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Litauisch, Lettisch, Malaiisch, Niederländisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Slowakisch, Schwedisch, Thai, Türkisch, Ukrainisch, Vietnamesisch, Chinesische Varianten und mehr
- Bewährte Leistung für globale Teams
- Keywords-Unterstützung für Markennamen
- Sprachen, die noch nicht in Nova-3 sind (Katalanisch, Portugiesisch-BR, Thai, Chinesisch usw.)
- Globale mehrsprachige Bereitstellungen
- Teams, die bestimmte regionale Sprachen benötigen
- Mehrsprachiger Modus: Nur Englisch + Spanisch
- 40+ Sprachen einschließlich: Katalanisch (ca), Griechisch (el), Estnisch (et), Indonesisch (id), Litauisch (lt), Lettisch (lv), Malaiisch (ms), Norwegisch (no), Portugiesisch (pt, pt-BR, pt-PT), Rumänisch (ro), Slowakisch (sk), Thai (th), Türkisch (tr), Chinesisch (zh, zh-CN, zh-TW, zh-Hans, zh-Hant, zh-HK), Französisch (fr, fr-CA), Spanisch (es, es-419)
- Etwas hinter Nova-3 bei Genauigkeitsverbesserungen
Deepgram Nova-2 Spezialisierte Modelle
Deepgram Nova-2 Spezialisierte Modelle
Aufgabenspezifische Varianten, optimiert für enge Anwendungsfälle.Nova-2 Phone Call:
- Speziell für Telefonie-Audio optimiert (nur Englisch)
- Englisch: en-US, en-GB
- Optimiert für Meeting-Transkription (nur Englisch)
- Englisch: en-US, en-GB
- Optimiert für KI-Gespräche (nur Englisch)
- Englisch: en-US, en-GB
- Die meisten Teams sollten Nova-3 General oder Nova-2 General verwenden
- Diese spezialisierten Modelle sind für spezifische Optimierungsanforderungen
Auswahl des richtigen Transcribers
Auswahlrahmen
1. Sprachanforderungen
1. Sprachanforderungen
Wähle basierend auf den benötigten Sprachen:Sprache von Nova-3 unterstützt? → Deepgram Nova-3 General (empfohlen - schnellste und genaueste)
- 21 Sprachen: Englisch, Spanisch, Französisch, Deutsch, Niederländisch, Schwedisch, Dänisch, Bulgarisch, Tschechisch, Finnisch, Hindi, Ungarisch, Japanisch, Koreanisch, Polnisch, Russisch, Ukrainisch, Vietnamesisch und mehr
- Verwende Nova-3-mehrsprachigen Modus, wenn du mehrere Sprachen aus dieser Liste bedienst
- 40+ Sprachen einschließlich: Katalanisch, Portugiesisch, Thai, Chinesisch, Griechisch, Estnisch, Indonesisch, Litauisch, Lettisch, Malaiisch, Norwegisch, Rumänisch, Slowakisch, Türkisch
2. Latenz vs. Abdeckung
2. Latenz vs. Abdeckung
Geschwindigkeit kritisch (unter 400ms)?
- Deepgram Nova-3 oder Nova-2 (~300ms)
- Azure Speech (~500-700ms)
- Azure Speech (150+ Sprachen, opfert Geschwindigkeit)
3. Regionale Compliance
3. Regionale Compliance
EU-Hosting erforderlich?
- Azure Speech (EU-Regionen: Westeuropa, Nordeuropa)
- Deepgram verwendet EU-Endpunkte, aber Daten können auf US-Servern verarbeitet werden
Sprachkonfiguration
Einsprachige Einrichtung
Für Agenten, die eine Sprache bedienen:- Öffne Modelle > Transcriber
- Verwende den Sprachpicker, um Transcriber zu filtern
- Wähle nach Sprachname (z.B. “Deutsch”) oder Locale-Code (z.B. “de-DE”)
- Wähle den Transcriber mit bester Latenz/Genauigkeit für deine Bedürfnisse
- en-US: Amerikanisches Englisch
- en-GB: Britisches Englisch
- en-AU: Australisches Englisch
- en-IN: Indisches Englisch
- de-DE: Deutsch
- es-ES: Spanisch (Spanien)
- fr-FR: Französisch
- zh-CN: Chinesisch (Vereinfacht)
- zh-TW: Chinesisch (Traditionell)
Mehrsprachige Unterstützung
Deepgram Nova-3 Mehrsprachig:- Einzelnes Modell, das Englisch, Spanisch, Französisch, Deutsch, Hindi, Russisch, Portugiesisch, Japanisch, Italienisch, Niederländisch unterstützt
- Keine Sprachauswahl erforderlich – verarbeitet automatisch alle 10 Sprachen
- Wähle mehrere Sprachen (2-10) für Auto-Erkennung
- Azure erkennt Sprache aus den ersten Worten und transkribiert entsprechend
Keywords
Hilf deinem Transcriber, Markennamen und technische Begriffe genau zu erkennen.Keywords werden auf Deepgram Nova-2 und Azure Speech-Modellen unterstützt. Nova-3 unterstützt derzeit keine Keywords.
Was zu boosten
Transcriber können Schwierigkeiten haben mit:- Markennamen (Firma, Produkte, Wettbewerber)
- Branchenjargon (technische Begriffe, Akronyme)
- Eigennamen (Personennamen, Orte)
Wie man Keywords hinzufügt
- Öffne Modelle > Transcriber
- Wähle einen Deepgram Nova-2 oder Azure Speech Transcriber
- Gib im Abschnitt Recognition Keywords am unteren Rand Keywords ein und drücke nach jedem Enter
- Keywords werden automatisch gespeichert
Testen der Transkription
- Tätige einen Testanruf und sprich Szenarien, die Kunden verwenden (Markennamen, Adressen)
- Öffne das Gesprächsprotokoll und überprüfe das Transkript
- Notiere falsch gehörte Wörter
- Füge wiederkehrende Fehler zu Keywords hinzu (falls Nova-2 oder Azure verwendet wird)
- Wechsle Transcriber, wenn Probleme bestehen bleiben
- Markennamen und Produktnamen
- Technische Terminologie
- Zahlen und Adressen
- Verschiedene Akzente und Sprachmuster
- Hintergrundgeräuschbedingungen