Zum Hauptinhalt springen

Übersicht

Der Transcriber ist der erste Schritt in der Verarbeitungspipeline deines Agenten. Er wandelt Kundensprache in Text um, den das KI-Modell verstehen und darauf antworten kann. Genaue Transkription ist entscheidend – Fehler in diesem Schritt wirken sich auf das gesamte Gespräch aus.
Konfiguriere den Transcriber unter Modelle > Transcriber in deinen Agenteneinstellungen. Änderungen werden sofort wirksam.

Verfügbare Transcriber

Deepgram Nova-3 General

Neueste Generation mit verbesserter Genauigkeit und mehrsprachiger Unterstützung.Warum es funktioniert:
  • Ultra-niedrige Latenz (~300ms) für Echtzeit-Gespräche
  • Unterstützt 21 Sprachen: Englische Varianten plus Bulgarisch, Tschechisch, Finnisch, Hindi, Ungarisch, Japanisch, Koreanisch, Polnisch, Russisch, Ukrainisch, Vietnamesisch und mehr
  • Starke Genauigkeit bei Telefon-Audio und lauten Umgebungen
  • Bewältigt Übersprechen und Füllwörter gut
Am besten für:
  • Standard-Empfehlung, wenn deine Sprache unterstützt wird
  • Geschwindigkeitskritische Anwendungen
  • Mehrsprachige Agenten (wenn alle Sprachen von Nova-3 abgedeckt werden)
  • Echtzeit-Kundeninteraktionen
Unterstützte Sprachen:
  • Mehrsprachiger Modus: Englisch, Spanisch, Französisch, Deutsch, Hindi, Russisch, Portugiesisch, Japanisch, Italienisch, Niederländisch
  • Englisch: en-US, en-GB, en-AU, en-IN, en-NZ
  • Europäisch: Deutsch (de), Niederländisch (nl), Schwedisch (sv), Dänisch (da), Bulgarisch (bg), Tschechisch (cs), Finnisch (fi), Ungarisch (hu), Polnisch (pl), Russisch (ru), Ukrainisch (uk)
  • Asiatisch: Hindi (hi), Japanisch (ja), Koreanisch (ko), Vietnamesisch (vi)
Massive Sprachabdeckung (150+) mit Enterprise-Grade-Zuverlässigkeit.Warum es funktioniert:
  • 150+ Sprachen und Lokalitäten
  • Mehrsprachige Auto-Erkennung (2-10 Sprachen)
  • EU-Hosting verfügbar
  • Vorhersehbare Enterprise-Preise
  • Konsistente Qualität in allen Sprachen
Am besten für:
  • Nicht-englische Sprachen, die nicht von Deepgram abgedeckt werden
  • Mehrsprachige Agenten mit Auto-Erkennungsbedarf
  • Enterprise-Compliance-Anforderungen
  • Globale Bereitstellungen, die verschiedene Märkte bedienen
Unterstützte Sprachen:
  • 150+ Sprachen einschließlich: 18 arabische Varianten, 24 spanische Varianten, 18 englische Varianten, plus Afrikaans, Amharisch, Bengali, Katalanisch, Chinesisch (6 Varianten einschließlich Wu und Kantonesisch), Tschechisch, Dänisch, Niederländisch, Filipino, Finnisch, Französisch, Deutsch, Griechisch, Hebräisch, Hindi, Ungarisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Malaiisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Schwedisch, Thai, Türkisch, Ukrainisch, Vietnamesisch und viele mehr
Kompromisse:
  • Höhere Latenz als Deepgram (~500-700ms)

Andere Transcriber

Spezialisiert auf Gesundheitsterminologie (nur Englisch).Warum es funktioniert:
  • Optimiert für englisches medizinisches Vokabular
  • Genaue Erkennung von medizinischen Begriffen, Verfahren, Medikamenten
  • Niedrige Latenz wie Nova-3 General (~300ms)
Am besten für:
  • Gesundheitsanwendungen (HIPAA-Compliance mit BAA verfügbar)
  • Medizinische Terminbuchung
  • Telemedizin-Dienste
  • Klinische Dokumentation
Unterstützte Sprachen:
  • Englisch: en-US, en-GB, en-AU, en-CA, en-IE, en-IN, en-NZ
Einschränkungen:
  • Nur Englisch
  • Erfordert gesundheitsspezifischen Anwendungsfall
Vorherige Generation mit breitester Sprachabdeckung (40+).Warum es funktioniert:
  • Hervorragende Genauigkeit und niedrige Latenz (~300ms)
  • Breiteste Sprachliste: Bulgarisch, Katalanisch, Tschechisch, Dänisch, Deutsch, Griechisch, Estnisch, Finnisch, Französisch, Hindi, Ungarisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Litauisch, Lettisch, Malaiisch, Niederländisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Slowakisch, Schwedisch, Thai, Türkisch, Ukrainisch, Vietnamesisch, Chinesische Varianten und mehr
  • Bewährte Leistung für globale Teams
  • Keywords-Unterstützung für Markennamen
Am besten für:
  • Sprachen, die noch nicht in Nova-3 sind (Katalanisch, Portugiesisch-BR, Thai, Chinesisch usw.)
  • Globale mehrsprachige Bereitstellungen
  • Teams, die bestimmte regionale Sprachen benötigen
Unterstützte Sprachen:
  • Mehrsprachiger Modus: Nur Englisch + Spanisch
  • 40+ Sprachen einschließlich: Katalanisch (ca), Griechisch (el), Estnisch (et), Indonesisch (id), Litauisch (lt), Lettisch (lv), Malaiisch (ms), Norwegisch (no), Portugiesisch (pt, pt-BR, pt-PT), Rumänisch (ro), Slowakisch (sk), Thai (th), Türkisch (tr), Chinesisch (zh, zh-CN, zh-TW, zh-Hans, zh-Hant, zh-HK), Französisch (fr, fr-CA), Spanisch (es, es-419)
Kompromisse:
  • Etwas hinter Nova-3 bei Genauigkeitsverbesserungen
Aufgabenspezifische Varianten, optimiert für enge Anwendungsfälle.Nova-2 Phone Call:
  • Speziell für Telefonie-Audio optimiert (nur Englisch)
  • Englisch: en-US, en-GB
Nova-2 Meeting:
  • Optimiert für Meeting-Transkription (nur Englisch)
  • Englisch: en-US, en-GB
Nova-2 Conversational AI:
  • Optimiert für KI-Gespräche (nur Englisch)
  • Englisch: en-US, en-GB
Wann verwenden:
  • Die meisten Teams sollten Nova-3 General oder Nova-2 General verwenden
  • Diese spezialisierten Modelle sind für spezifische Optimierungsanforderungen

Auswahl des richtigen Transcribers

Auswahlrahmen

Wähle basierend auf den benötigten Sprachen:Sprache von Nova-3 unterstützt? → Deepgram Nova-3 General (empfohlen - schnellste und genaueste)
  • 21 Sprachen: Englisch, Spanisch, Französisch, Deutsch, Niederländisch, Schwedisch, Dänisch, Bulgarisch, Tschechisch, Finnisch, Hindi, Ungarisch, Japanisch, Koreanisch, Polnisch, Russisch, Ukrainisch, Vietnamesisch und mehr
  • Verwende Nova-3-mehrsprachigen Modus, wenn du mehrere Sprachen aus dieser Liste bedienst
Sprache nur in Nova-2? → Deepgram Nova-2 General
  • 40+ Sprachen einschließlich: Katalanisch, Portugiesisch, Thai, Chinesisch, Griechisch, Estnisch, Indonesisch, Litauisch, Lettisch, Malaiisch, Norwegisch, Rumänisch, Slowakisch, Türkisch
Sprache nicht in Deepgram? → Azure Speech (150+ Sprachen)Mehrere Sprachen mit Auto-Erkennung? → Azure Speech (mehrsprachiger Modus für jede Kombination)Gesundheitswesen Englisch? → Deepgram Nova-3 Medical
Geschwindigkeit kritisch (unter 400ms)?
  • Deepgram Nova-3 oder Nova-2 (~300ms)
Moderate Latenz akzeptabel (unter 700ms)?
  • Azure Speech (~500-700ms)
Sprachabdeckung wichtiger als Geschwindigkeit?
  • Azure Speech (150+ Sprachen, opfert Geschwindigkeit)
EU-Hosting erforderlich?
  • Azure Speech (EU-Regionen: Westeuropa, Nordeuropa)
  • Deepgram verwendet EU-Endpunkte, aber Daten können auf US-Servern verarbeitet werden

Sprachkonfiguration

Einsprachige Einrichtung

Für Agenten, die eine Sprache bedienen:
  1. Öffne Modelle > Transcriber
  2. Verwende den Sprachpicker, um Transcriber zu filtern
  3. Wähle nach Sprachname (z.B. “Deutsch”) oder Locale-Code (z.B. “de-DE”)
  4. Wähle den Transcriber mit bester Latenz/Genauigkeit für deine Bedürfnisse
Häufige Sprachvarianten:
  • en-US: Amerikanisches Englisch
  • en-GB: Britisches Englisch
  • en-AU: Australisches Englisch
  • en-IN: Indisches Englisch
  • de-DE: Deutsch
  • es-ES: Spanisch (Spanien)
  • fr-FR: Französisch
  • zh-CN: Chinesisch (Vereinfacht)
  • zh-TW: Chinesisch (Traditionell)
Wähle die Variante, die zu deinem Kundenstamm passt, für beste Genauigkeit.

Mehrsprachige Unterstützung

Deepgram Nova-3 Mehrsprachig:
  • Einzelnes Modell, das Englisch, Spanisch, Französisch, Deutsch, Hindi, Russisch, Portugiesisch, Japanisch, Italienisch, Niederländisch unterstützt
  • Keine Sprachauswahl erforderlich – verarbeitet automatisch alle 10 Sprachen
Azure Speech Mehrsprachig:
  • Wähle mehrere Sprachen (2-10) für Auto-Erkennung
  • Azure erkennt Sprache aus den ersten Worten und transkribiert entsprechend

Keywords

Hilf deinem Transcriber, Markennamen und technische Begriffe genau zu erkennen.
Keywords werden auf Deepgram Nova-2 und Azure Speech-Modellen unterstützt. Nova-3 unterstützt derzeit keine Keywords.

Was zu boosten

Transcriber können Schwierigkeiten haben mit:
  • Markennamen (Firma, Produkte, Wettbewerber)
  • Branchenjargon (technische Begriffe, Akronyme)
  • Eigennamen (Personennamen, Orte)

Wie man Keywords hinzufügt

  1. Öffne Modelle > Transcriber
  2. Wähle einen Deepgram Nova-2 oder Azure Speech Transcriber
  3. Gib im Abschnitt Recognition Keywords am unteren Rand Keywords ein und drücke nach jedem Enter
  4. Keywords werden automatisch gespeichert
Füge Keywords nach Bedarf während des Testens hinzu. Überprüfe Anruftranskripte auf falsch gehörte Wörter und füge sie als Keywords hinzu, um die Erkennung zu verbessern.

Testen der Transkription

  1. Tätige einen Testanruf und sprich Szenarien, die Kunden verwenden (Markennamen, Adressen)
  2. Öffne das Gesprächsprotokoll und überprüfe das Transkript
  3. Notiere falsch gehörte Wörter
  4. Füge wiederkehrende Fehler zu Keywords hinzu (falls Nova-2 oder Azure verwendet wird)
  5. Wechsle Transcriber, wenn Probleme bestehen bleiben
Was zu testen:
  • Markennamen und Produktnamen
  • Technische Terminologie
  • Zahlen und Adressen
  • Verschiedene Akzente und Sprachmuster
  • Hintergrundgeräuschbedingungen

Nächste Schritte