Zum Hauptinhalt springen
Profi Stimmen klonen erlaubt dir, aus Audio eine eigene synthetische Stimme zu erzeugen und sie mit deinen KI-Agenten zu nutzen. Du kannst entweder eine Aufnahme hochladen oder direkt im Browser aufnehmen. Die Plattform generiert über den gewählten Anbieter ein Stimm-Modell, speichert es in deiner Account-Bibliothek und macht es für jeden Agenten in deinem Account verfügbar.
Geklonte Stimmen erscheinen neben Standardstimmen in der Stimmauswahl und können über die Seitenleiste für geklonte Stimmen ausgewählt werden.
Klon nur Stimmen, für deren Verwendung du eine ausdrückliche schriftliche Einwilligung hast. Du bist dafür verantwortlich sicherzustellen, dass du das rechtliche Recht hast, eine Stimme zu klonen und einzusetzen.

Eine geklonte Stimme erstellen

1

Formular zum Stimmenklonen öffnen

Gehe im Agent-Editor zu AllgemeinSprechen und klicke auf Stimme klonen. Du kannst das Formular auch über die Seitenleiste für geklonte Stimmen in der Stimmauswahl öffnen.
2

Anbieter wählen

Wähle einen Anbieter zum Stimmenklonen basierend auf deinem Audio-Sample:
AnbieterAm besten fürDauerDateigröße
ElevenLabsLängere Samples, natürlichere VariationMin. 5s, empfohlen 1-2 min, max. 180sBis zu 10 MB
CartesiaKurze, saubere Clips, schnelles StimmenklonenMin. 3s, empfohlen 5-10s, max. 10sBis zu 5 MB
Wähle ElevenLabs, wenn du eine längere saubere Aufnahme hast und willst, dass das Modell mehr Tonvariation lernt. Wähle Cartesia, wenn du schnell eine geklonte Stimme aus einem kurzen sauberen Clip erstellen willst. Wenn du unsicher bist, erstelle beide und vergleiche sie.Unterstützte Formate: MP3, WAV, OGG, WebM - ElevenLabs akzeptiert auch M4A.
3

Audio bereitstellen

Wechsle zwischen zwei Eingabemodi mit den Tabs Hochladen und Aufnehmen:Hochladen - Ziehe eine Audiodatei per Drag-and-drop hinein oder klicke, um sie auszuwählen. Akzeptierte Formate und Größenlimits werden abhängig vom gewählten Anbieter angezeigt.Aufnehmen - Klicke auf den Aufnahme-Button, um Audio direkt über dein Mikrofon aufzunehmen. Während der Aufnahme werden eine Live-Wellenform und ein Dauerzähler angezeigt. Die Aufnahme stoppt automatisch, wenn die maximale Dauer des Anbieters erreicht ist.Das Formular verfolgt die Gesamtdauer deines Audios und zeigt an, ob die Anforderungen des Anbieters erfüllt sind.
4

Stimm-Details ausfüllen

  • Stimmenname (erforderlich) - Ein beschreibender Name, der in der Stimmauswahl angezeigt wird
  • Sprache (erforderlich) - Die Sprache des Audio-Samples (Englisch, Spanisch, Französisch, Deutsch, Italienisch, Portugiesisch, Niederländisch, Japanisch, Koreanisch oder Chinesisch)
  • Beschreibung (optional) - Interne Notizen zu dieser Stimme
  • Hintergrundgeräusche entfernen (optional) - Nur für ElevenLabs verfügbar - bereinigt Rauschen im Sample vor dem Stimmenklonen
5

Stimme klonen

Klicke auf Stimme klonen, um die Verarbeitung zu starten. Der Status der Stimme durchläuft diese Zustände:
  • Wird verarbeitet - Der Anbieter generiert das Stimm-Modell
  • Bereit - Die Stimme ist verfügbar und kann Agenten zugewiesen werden
  • Fehlgeschlagen - Etwas ist schiefgelaufen - prüfe die Fehlermeldung und versuche es erneut

Geklonte Stimmen verwalten

Geklonte Stimmen werden accountweit geteilt. Alle Teammitglieder mit den passenden Berechtigungen können geklonte Stimmen ansehen und ihren Agenten zuweisen.

Geklonte Stimmen ansehen

Deine geklonten Stimmen erscheinen in der Seitenleiste für geklonte Stimmen in der Stimmauswahl. Jede Stimme zeigt Name, Anbieter, Sprache und einen aktuellen Status-Badge. Du kannst außerdem alle geklonten Stimmen in einer Tabelle ansehen, die zeigt:
  • Name und Anbieter
  • Sprache
  • Status (mit farbcodierten Badges)
  • Aktionen wie Auswählen oder Löschen der Stimme

Eine geklonte Stimme löschen

  1. Finde die geklonte Stimme in der Seitenleiste oder Tabelle
  2. Klicke auf den Lösch-Button oder wähle Löschen aus dem Aktionsmenü
  3. Bestätige das Löschen
Das Löschen einer geklonten Stimme ist dauerhaft und kann nicht rückgängig gemacht werden. Alle Agenten, die diese Stimme derzeit verwenden, brauchen eine neue Stimme.

Geklonte Stimmen mit Agenten verwenden

Sobald eine geklonte Stimme den Status Bereit hat, kannst du sie einem beliebigen Agenten zuweisen:
1

Stimmauswahl öffnen

Gehe im Agent-Editor zu AllgemeinSprechen.
2

Geklonte Stimme finden

Schau in der Seitenleiste für geklonte Stimmen auf der rechten Seite der Stimmauswahl nach. Nur Stimmen mit dem Status Bereit können ausgewählt werden.
3

Stimme auswählen

Klicke auf die geklonte Stimme, um sie zuzuweisen. Der Agent verwendet diese Stimme für alle folgenden Gespräche. Du kannst die Ausgabe zusätzlich mit Spracheinstellungen anpassen.

Best Practices für Audio-Samples

  • Nutze ein Mikrofon guter Qualität (USB-Kondensator oder besser)
  • Nimm in einer ruhigen Umgebung mit Schallschutz auf
  • Halte einen konstanten Abstand zum Mikrofon ein (6-12 Zoll)
  • Vermeide Räume mit Echo oder Hall
  • Verwende eine Abtastrate von 44.1 kHz oder höher
  • Enthält kurze und lange Sätze
  • Deckt unterschiedliche Tonlagen ab: Fragen, Aussagen, Erklärungen
  • Lies natürlich und in Gesprächstempo
  • Vermeide zu schnelles oder zu langsames Lesen
  • Füge Pausen zwischen Sätzen ein
  • Hintergrundmusik oder Umgebungsgeräusche
  • Mehrere Sprecher in einem Sample
  • Starke Audiobearbeitung, Kompression oder Filter
  • Flüstern oder Schreien
  • Samples, die kürzer sind als die Mindestdauer des Anbieters
  • Minderwertige Telefonaufnahmen

Sample-Strategie

Nutze den gewählten Anbieter, um zu entscheiden, wie viel Audio du sammelst.

Für ElevenLabs

  • Ziel sind möglichst 1-2 Minuten
  • Enthält variierende Formulierungen statt denselben Satz zu wiederholen
  • Nutze Hintergrundgeräusche entfernen, wenn die Aufnahme sonst gut ist
  • Bevorzuge eine Sprecherin oder einen Sprecher, ein Mikrofon, einen Raum

Für Cartesia

  • Ziel ist ein kurzer, sauberer 5-10-Sekunden-Clip
  • Nicht künstlich verlängern, nur um mehr Material zu haben
  • Entferne Raumgeräusche vor der Aufnahme, weil der Clone sie stark übernimmt
  • Wähle einen Clip mit stabiler Lautstärke und ohne Unterbrechungen

Gutes Sample-Skript

Lies 4-6 natürliche Sätze so vor, wie der Agent klingen soll:
  • eine Begrüßung
  • ein kurzer Faktensatz
  • eine Frage
  • ein längerer Erklärungssatz
  • ein Abschlusssatz
Das gibt dem Modell genug Form, um Tempo und Tonfall zu lernen, ohne gekünstelt zu klingen.

Rechtliche Hinweise

Du brauchst die ausdrückliche schriftliche Einwilligung jeder Person, deren Stimme du klonst. Unautorisierte Voice-Clones können gegen Datenschutz- und geistige Eigentumsrechte verstoßen.
Bevor du clonst, stelle sicher, dass du hast:
  • schriftliche Einwilligung der Person, deren Stimme geklont wird
  • das Recht, die Stimme kommerziell zu nutzen
  • eine klare Vereinbarung darüber, wie die Stimme verwendet wird
  • eine Dokumentation der Einwilligung für deine Unterlagen
Niemals klonen:
  • Stimmen ohne Einwilligung
  • Stimmen von öffentlichen Personen ohne Lizenz
  • Stimmen zum Zweck der Nachahmung oder Identitätstäuschung

Fehlerbehebung

Prüfe die vom gewählten Anbieter vorgegebenen Limits für Dauer, Dateigröße und Dateiformat. Die meisten fehlgeschlagenen Uploads entstehen durch Clips, die zu kurz, zu lang oder zu verrauscht sind.
Nimm mit weniger Hintergrundgeräuschen neu auf. Bei ElevenLabs kannst du Hintergrundgeräusche entfernen aktivieren. Bei Cartesia solltest du mit einem saubereren Clip starten statt mit einem längeren.
Nutze ein besseres Quellsample, nicht nur eine andere Geschwindigkeits- oder Tonhöhen-Einstellung. Füge klarere Variationen und natürlichere Intonation hinzu und erstelle dann eine neue geklonte Stimme.
Klone zuerst dasselbe Sample mit beiden Anbietern. Vergleiche sie dann in der Stimmauswahl mit demselben Testskript.

Nächste Schritte

Stimme auswählen

Alle verfügbaren Stimmen durchsuchen und vergleichen

Spracheinstellungen

Geschwindigkeit, Tonhöhe und Stabilität feinjustieren

Aussprache

Die Aussprache für deine geklonte Stimme korrigieren

Agent testen

Deine geklonte Stimme in Gesprächen testen