Geklonte Stimmen erscheinen neben Standardstimmen in der Stimmauswahl und können über die Seitenleiste für geklonte Stimmen ausgewählt werden.
Eine geklonte Stimme erstellen
Formular zum Stimmenklonen öffnen
Gehe im Agent-Editor zu Allgemein → Sprechen und klicke auf Stimme klonen. Du kannst das Formular auch über die Seitenleiste für geklonte Stimmen in der Stimmauswahl öffnen.
Anbieter wählen
Wähle einen Anbieter zum Stimmenklonen basierend auf deinem Audio-Sample:
Wähle ElevenLabs, wenn du eine längere saubere Aufnahme hast und willst, dass das Modell mehr Tonvariation lernt. Wähle Cartesia, wenn du schnell eine geklonte Stimme aus einem kurzen sauberen Clip erstellen willst. Wenn du unsicher bist, erstelle beide und vergleiche sie.Unterstützte Formate: MP3, WAV, OGG, WebM - ElevenLabs akzeptiert auch M4A.
| Anbieter | Am besten für | Dauer | Dateigröße |
|---|---|---|---|
| ElevenLabs | Längere Samples, natürlichere Variation | Min. 5s, empfohlen 1-2 min, max. 180s | Bis zu 10 MB |
| Cartesia | Kurze, saubere Clips, schnelles Stimmenklonen | Min. 3s, empfohlen 5-10s, max. 10s | Bis zu 5 MB |
Audio bereitstellen
Wechsle zwischen zwei Eingabemodi mit den Tabs Hochladen und Aufnehmen:Hochladen - Ziehe eine Audiodatei per Drag-and-drop hinein oder klicke, um sie auszuwählen. Akzeptierte Formate und Größenlimits werden abhängig vom gewählten Anbieter angezeigt.Aufnehmen - Klicke auf den Aufnahme-Button, um Audio direkt über dein Mikrofon aufzunehmen. Während der Aufnahme werden eine Live-Wellenform und ein Dauerzähler angezeigt. Die Aufnahme stoppt automatisch, wenn die maximale Dauer des Anbieters erreicht ist.Das Formular verfolgt die Gesamtdauer deines Audios und zeigt an, ob die Anforderungen des Anbieters erfüllt sind.
Stimm-Details ausfüllen
- Stimmenname (erforderlich) - Ein beschreibender Name, der in der Stimmauswahl angezeigt wird
- Sprache (erforderlich) - Die Sprache des Audio-Samples (Englisch, Spanisch, Französisch, Deutsch, Italienisch, Portugiesisch, Niederländisch, Japanisch, Koreanisch oder Chinesisch)
- Beschreibung (optional) - Interne Notizen zu dieser Stimme
- Hintergrundgeräusche entfernen (optional) - Nur für ElevenLabs verfügbar - bereinigt Rauschen im Sample vor dem Stimmenklonen
Stimme klonen
Klicke auf Stimme klonen, um die Verarbeitung zu starten. Der Status der Stimme durchläuft diese Zustände:
- Wird verarbeitet - Der Anbieter generiert das Stimm-Modell
- Bereit - Die Stimme ist verfügbar und kann Agenten zugewiesen werden
- Fehlgeschlagen - Etwas ist schiefgelaufen - prüfe die Fehlermeldung und versuche es erneut
Geklonte Stimmen verwalten
Geklonte Stimmen werden accountweit geteilt. Alle Teammitglieder mit den passenden Berechtigungen können geklonte Stimmen ansehen und ihren Agenten zuweisen.Geklonte Stimmen ansehen
Deine geklonten Stimmen erscheinen in der Seitenleiste für geklonte Stimmen in der Stimmauswahl. Jede Stimme zeigt Name, Anbieter, Sprache und einen aktuellen Status-Badge. Du kannst außerdem alle geklonten Stimmen in einer Tabelle ansehen, die zeigt:- Name und Anbieter
- Sprache
- Status (mit farbcodierten Badges)
- Aktionen wie Auswählen oder Löschen der Stimme
Eine geklonte Stimme löschen
- Finde die geklonte Stimme in der Seitenleiste oder Tabelle
- Klicke auf den Lösch-Button oder wähle Löschen aus dem Aktionsmenü
- Bestätige das Löschen
Geklonte Stimmen mit Agenten verwenden
Sobald eine geklonte Stimme den Status Bereit hat, kannst du sie einem beliebigen Agenten zuweisen:Geklonte Stimme finden
Schau in der Seitenleiste für geklonte Stimmen auf der rechten Seite der Stimmauswahl nach. Nur Stimmen mit dem Status Bereit können ausgewählt werden.
Stimme auswählen
Klicke auf die geklonte Stimme, um sie zuzuweisen. Der Agent verwendet diese Stimme für alle folgenden Gespräche. Du kannst die Ausgabe zusätzlich mit Spracheinstellungen anpassen.
Best Practices für Audio-Samples
Aufnahmequalität
Aufnahmequalität
- Nutze ein Mikrofon guter Qualität (USB-Kondensator oder besser)
- Nimm in einer ruhigen Umgebung mit Schallschutz auf
- Halte einen konstanten Abstand zum Mikrofon ein (6-12 Zoll)
- Vermeide Räume mit Echo oder Hall
- Verwende eine Abtastrate von 44.1 kHz oder höher
Inhaltliche Vielfalt
Inhaltliche Vielfalt
- Enthält kurze und lange Sätze
- Deckt unterschiedliche Tonlagen ab: Fragen, Aussagen, Erklärungen
- Lies natürlich und in Gesprächstempo
- Vermeide zu schnelles oder zu langsames Lesen
- Füge Pausen zwischen Sätzen ein
Was du vermeiden solltest
Was du vermeiden solltest
- Hintergrundmusik oder Umgebungsgeräusche
- Mehrere Sprecher in einem Sample
- Starke Audiobearbeitung, Kompression oder Filter
- Flüstern oder Schreien
- Samples, die kürzer sind als die Mindestdauer des Anbieters
- Minderwertige Telefonaufnahmen
Sample-Strategie
Nutze den gewählten Anbieter, um zu entscheiden, wie viel Audio du sammelst.Für ElevenLabs
- Ziel sind möglichst 1-2 Minuten
- Enthält variierende Formulierungen statt denselben Satz zu wiederholen
- Nutze Hintergrundgeräusche entfernen, wenn die Aufnahme sonst gut ist
- Bevorzuge eine Sprecherin oder einen Sprecher, ein Mikrofon, einen Raum
Für Cartesia
- Ziel ist ein kurzer, sauberer 5-10-Sekunden-Clip
- Nicht künstlich verlängern, nur um mehr Material zu haben
- Entferne Raumgeräusche vor der Aufnahme, weil der Clone sie stark übernimmt
- Wähle einen Clip mit stabiler Lautstärke und ohne Unterbrechungen
Gutes Sample-Skript
Lies 4-6 natürliche Sätze so vor, wie der Agent klingen soll:- eine Begrüßung
- ein kurzer Faktensatz
- eine Frage
- ein längerer Erklärungssatz
- ein Abschlusssatz
Rechtliche Hinweise
Bevor du clonst, stelle sicher, dass du hast:- schriftliche Einwilligung der Person, deren Stimme geklont wird
- das Recht, die Stimme kommerziell zu nutzen
- eine klare Vereinbarung darüber, wie die Stimme verwendet wird
- eine Dokumentation der Einwilligung für deine Unterlagen
- Stimmen ohne Einwilligung
- Stimmen von öffentlichen Personen ohne Lizenz
- Stimmen zum Zweck der Nachahmung oder Identitätstäuschung
Fehlerbehebung
Mein Sample wird abgelehnt
Mein Sample wird abgelehnt
Prüfe die vom gewählten Anbieter vorgegebenen Limits für Dauer, Dateigröße und Dateiformat. Die meisten fehlgeschlagenen Uploads entstehen durch Clips, die zu kurz, zu lang oder zu verrauscht sind.
Die geklonte Stimme klingt verrauscht
Die geklonte Stimme klingt verrauscht
Nimm mit weniger Hintergrundgeräuschen neu auf. Bei ElevenLabs kannst du Hintergrundgeräusche entfernen aktivieren. Bei Cartesia solltest du mit einem saubereren Clip starten statt mit einem längeren.
Die Stimme klingt nicht ausdrucksstark genug
Die Stimme klingt nicht ausdrucksstark genug
Nutze ein besseres Quellsample, nicht nur eine andere Geschwindigkeits- oder Tonhöhen-Einstellung. Füge klarere Variationen und natürlichere Intonation hinzu und erstelle dann eine neue geklonte Stimme.
Ich bin unsicher, welchen Anbieter ich wählen soll
Ich bin unsicher, welchen Anbieter ich wählen soll
Klone zuerst dasselbe Sample mit beiden Anbietern. Vergleiche sie dann in der Stimmauswahl mit demselben Testskript.
Nächste Schritte
Stimme auswählen
Alle verfügbaren Stimmen durchsuchen und vergleichen
Spracheinstellungen
Geschwindigkeit, Tonhöhe und Stabilität feinjustieren
Aussprache
Die Aussprache für deine geklonte Stimme korrigieren
Agent testen
Deine geklonte Stimme in Gesprächen testen