Übersicht
Die Stimme deines Agenten ist ein entscheidender Teil der Kundenerfahrung. Die richtige Stimme kann Vertrauen aufbauen, Professionalität vermitteln und mit deiner Markenidentität übereinstimmen. itellicoAI streamt Live-Kataloge von ElevenLabs, Microsoft Azure Neural Voices und Cartesia, damit du qualitativ hochwertige Audio-Optionen ohne manuelle Uploads auswählen kannst.Die Stimmenauswahl erfolgt unter dem Stimme-Tab in deiner Agentenkonfiguration. Änderungen werden sofort wirksam.
Stimmenanbieter
ElevenLabs
ElevenLabs
Premium-KI-Stimmen mit außergewöhnlicher Natürlichkeit und emotionaler Bandbreite.Warum es funktioniert:
- Ultra-realistisch, nahezu nicht von menschlicher Sprache zu unterscheiden
- Starke emotionale Bandbreite für Kundenservice
- Konsistente Qualität über alle Inhalte hinweg
- Niedrige Latenz für Echtzeit-Gespräche
- Kundenorientierte Agenten, bei denen Stimmqualität entscheidend ist
- Markensensible Anwendungen
- Anwendungsfälle, die emotionale Intelligenz erfordern
- Rachel: Warme, professionelle amerikanische Frauenstimme
- Adam: Selbstbewusste, klare amerikanische Männerstimme
- Susi: Natürliche, professionelle deutsche Frauenstimme (empfohlen für deutsche Agenten)
- Antoni: Ruhige, beruhigende Männerstimme
ElevenLabs-Stimmen unterstützen erweiterte Einstellungen wie Stabilität und Similarity Boost – konfigurierbar in Stimmeneinstellungen.
Azure Speech (Neural Voices)
Azure Speech (Neural Voices)
Enterprise-Grade-Stimmen mit massiver Sprachabdeckung.Warum es funktioniert:
- 100+ Sprachen und Lokalitäten
- EU-Hosting für GDPR-Compliance verfügbar
- Konsistente, professionelle Qualität
- Vorhersehbare Enterprise-Preise
- Mehrsprachige Agenten (ein Anbieter für alle Sprachen)
- Enterprise-Compliance-Anforderungen
- Hochvolumen-Anwendungen mit Kostenbeschränkungen
- Globale Bereitstellungen
- en-US-JennyNeural: Natürliche amerikanische Frauenstimme
- en-GB-SoniaNeural: Britische Frauenstimme, professionell
- de-DE-KatjaNeural: Deutsche Frauenstimme, autoritativ
- Standard Neural: Hochwertig, kosteneffizient
- Neural HD: Verbesserte Qualität
- Custom Neural: Trainiere deine eigene Stimme (nur Enterprise)
- Etwas weniger emotionale Nuancen als ElevenLabs
- Am besten für sachliche, professionelle Gespräche
Cartesia
Cartesia
Ultra-niedrige Latenzstimmen, optimiert für konversationelle KI.Warum es funktioniert:
- Optimiert für Gesprächswechsel unter einer Sekunde
- Ausdrucksstarke, energetische Darbietungen
- Moderner Sound, abgestimmt auf interaktive Agenten
- Geschwindigkeitskritische Web-Erlebnisse
- A/B-Tests neben ElevenLabs
- Latenzempfindliche Anwendungen
- Kleinerer Katalog (hauptsächlich Englisch)
- Weniger Anpassungsoptionen
Auswahl der richtigen Stimme
Auswahlrahmen
1. Anbieter an deine Bedürfnisse anpassen
1. Anbieter an deine Bedürfnisse anpassen
Wähle basierend auf deinen Anforderungen:Qualität zuerst? → ElevenLabs (am natürlichsten, emotionale Bandbreite)Bestimmte Sprache benötigt? → Azure Speech (starke Sprachabdeckung, 100+ Sprachen)Geschwindigkeitskritisch? → Cartesia (ultra-niedrige Latenz)EU-Compliance? → Azure (EU-gehostete Optionen)
2. Marke & Publikum berücksichtigen
2. Marke & Publikum berücksichtigen
Branchenkontext:
- Gesundheitswesen: Einfühlsam, professionell, beruhigend
- Vertrieb: Selbstbewusst, enthusiastisch, überzeugend
- Technischer Support: Geduldig, klar, kenntnisreich
- Gastgewerbe: Warm, einladend, freundlich
- Lokale Akzente bauen Rapport mit lokalen Kunden auf
- Neutrale Akzente funktionieren für globales Publikum
- Nach Region/Locale in der Stimmenbibliothek filtern
3. Vor der Verpflichtung testen
3. Vor der Verpflichtung testen
Testprozess:
- Vorschau von ElevenLabs-Stimmen mit der Play-Taste
- Shortlist von 3-5 Stimmen, die deinen Kriterien entsprechen
- Bereitstellung jeder auf einem Test-Agenten
- Rufe an und teste mit realistischen Szenarien
- Lass Team-Mitglieder bewerten
- Markenpassung und Persönlichkeitsübereinstimmung
- Klarheit und Natürlichkeit
- Leistung mit Branchenterminologie
- Angenehm zuzuhören in 5+ Minuten Gesprächen
Funktionen der Stimmenbibliothek
Die Stimmenbibliothek bietet Such- und Filterfunktionen, um die richtige Stimme schnell zu finden: Suchen nach:- Stimmenname (z.B. “Sarah”, “Professional Male”)
- Anbieter (ElevenLabs, Azure, Cartesia)
- Geschlecht (männlich, weiblich, neutral)
- Sprache oder Locale-Code (en-US, es-ES, de-DE)
- Akzent oder Region (Britisch, Australisch, Amerikanisch)
- Anbieter: Nur bestimmte Anbieter anzeigen
- Sprache: Auf Sprachanforderungen eingrenzen
- Geschlecht: Männlich, weiblich oder geschlechtsneutral
- Klicke auf die Play-Taste bei ElevenLabs-Stimmen, um Samples zu hören
- Auf Test-Agent bereitstellen für erweiterte Vorschauen mit realen Szenarien
- Anbieter und Stimmgenerierungstechnologie
- Sprachunterstützung und mehrsprachige Fähigkeiten
- EU-Hosting-Badge
- Geschlecht, Akzent und Ton-Merkmale