Zum Hauptinhalt springen

Übersicht

Die Stimme deines Agenten ist ein entscheidender Teil der Kundenerfahrung. Die richtige Stimme kann Vertrauen aufbauen, Professionalität vermitteln und mit deiner Markenidentität übereinstimmen. itellicoAI streamt Live-Kataloge von ElevenLabs, Microsoft Azure Neural Voices und Cartesia, damit du qualitativ hochwertige Audio-Optionen ohne manuelle Uploads auswählen kannst.
Die Stimmenauswahl erfolgt unter dem Stimme-Tab in deiner Agentenkonfiguration. Änderungen werden sofort wirksam.

Stimmenanbieter

ElevenLabs

Premium-KI-Stimmen mit außergewöhnlicher Natürlichkeit und emotionaler Bandbreite.Warum es funktioniert:
  • Ultra-realistisch, nahezu nicht von menschlicher Sprache zu unterscheiden
  • Starke emotionale Bandbreite für Kundenservice
  • Konsistente Qualität über alle Inhalte hinweg
  • Niedrige Latenz für Echtzeit-Gespräche
Am besten für:
  • Kundenorientierte Agenten, bei denen Stimmqualität entscheidend ist
  • Markensensible Anwendungen
  • Anwendungsfälle, die emotionale Intelligenz erfordern
Beliebte Stimmen:
  • Rachel: Warme, professionelle amerikanische Frauenstimme
  • Adam: Selbstbewusste, klare amerikanische Männerstimme
  • Susi: Natürliche, professionelle deutsche Frauenstimme (empfohlen für deutsche Agenten)
  • Antoni: Ruhige, beruhigende Männerstimme
ElevenLabs-Stimmen unterstützen erweiterte Einstellungen wie Stabilität und Similarity Boost – konfigurierbar in Stimmeneinstellungen.
Enterprise-Grade-Stimmen mit massiver Sprachabdeckung.Warum es funktioniert:
  • 100+ Sprachen und Lokalitäten
  • EU-Hosting für GDPR-Compliance verfügbar
  • Konsistente, professionelle Qualität
  • Vorhersehbare Enterprise-Preise
Am besten für:
  • Mehrsprachige Agenten (ein Anbieter für alle Sprachen)
  • Enterprise-Compliance-Anforderungen
  • Hochvolumen-Anwendungen mit Kostenbeschränkungen
  • Globale Bereitstellungen
Beliebte Stimmen:
  • en-US-JennyNeural: Natürliche amerikanische Frauenstimme
  • en-GB-SoniaNeural: Britische Frauenstimme, professionell
  • de-DE-KatjaNeural: Deutsche Frauenstimme, autoritativ
Stimmenstufen:
  • Standard Neural: Hochwertig, kosteneffizient
  • Neural HD: Verbesserte Qualität
  • Custom Neural: Trainiere deine eigene Stimme (nur Enterprise)
Kompromisse:
  • Etwas weniger emotionale Nuancen als ElevenLabs
  • Am besten für sachliche, professionelle Gespräche
Ultra-niedrige Latenzstimmen, optimiert für konversationelle KI.Warum es funktioniert:
  • Optimiert für Gesprächswechsel unter einer Sekunde
  • Ausdrucksstarke, energetische Darbietungen
  • Moderner Sound, abgestimmt auf interaktive Agenten
Am besten für:
  • Geschwindigkeitskritische Web-Erlebnisse
  • A/B-Tests neben ElevenLabs
  • Latenzempfindliche Anwendungen
Kompromisse:
  • Kleinerer Katalog (hauptsächlich Englisch)
  • Weniger Anpassungsoptionen
Benötigst du einen anderen TTS-Anbieter (Google Cloud, Amazon Polly)? Kontaktiere deinen Success Manager – wir fügen ihn dem Katalog hinzu.

Auswahl der richtigen Stimme

Auswahlrahmen

Wähle basierend auf deinen Anforderungen:Qualität zuerst? → ElevenLabs (am natürlichsten, emotionale Bandbreite)Bestimmte Sprache benötigt? → Azure Speech (starke Sprachabdeckung, 100+ Sprachen)Geschwindigkeitskritisch? → Cartesia (ultra-niedrige Latenz)EU-Compliance? → Azure (EU-gehostete Optionen)
Branchenkontext:
  • Gesundheitswesen: Einfühlsam, professionell, beruhigend
  • Vertrieb: Selbstbewusst, enthusiastisch, überzeugend
  • Technischer Support: Geduldig, klar, kenntnisreich
  • Gastgewerbe: Warm, einladend, freundlich
Akzent-Überlegungen:
  • Lokale Akzente bauen Rapport mit lokalen Kunden auf
  • Neutrale Akzente funktionieren für globales Publikum
  • Nach Region/Locale in der Stimmenbibliothek filtern
Testprozess:
  1. Vorschau von ElevenLabs-Stimmen mit der Play-Taste
  2. Shortlist von 3-5 Stimmen, die deinen Kriterien entsprechen
  3. Bereitstellung jeder auf einem Test-Agenten
  4. Rufe an und teste mit realistischen Szenarien
  5. Lass Team-Mitglieder bewerten
Bewertungskriterien:
  • Markenpassung und Persönlichkeitsübereinstimmung
  • Klarheit und Natürlichkeit
  • Leistung mit Branchenterminologie
  • Angenehm zuzuhören in 5+ Minuten Gesprächen

Funktionen der Stimmenbibliothek

Die Stimmenbibliothek bietet Such- und Filterfunktionen, um die richtige Stimme schnell zu finden: Suchen nach:
  • Stimmenname (z.B. “Sarah”, “Professional Male”)
  • Anbieter (ElevenLabs, Azure, Cartesia)
  • Geschlecht (männlich, weiblich, neutral)
  • Sprache oder Locale-Code (en-US, es-ES, de-DE)
  • Akzent oder Region (Britisch, Australisch, Amerikanisch)
Filtern nach:
  • Anbieter: Nur bestimmte Anbieter anzeigen
  • Sprache: Auf Sprachanforderungen eingrenzen
  • Geschlecht: Männlich, weiblich oder geschlechtsneutral
Vorschau:
  • Klicke auf die Play-Taste bei ElevenLabs-Stimmen, um Samples zu hören
  • Auf Test-Agent bereitstellen für erweiterte Vorschauen mit realen Szenarien
Angezeigte Metadaten:
  • Anbieter und Stimmgenerierungstechnologie
  • Sprachunterstützung und mehrsprachige Fähigkeiten
  • EU-Hosting-Badge
  • Geschlecht, Akzent und Ton-Merkmale

Nächste Schritte