Das KI-Modell liest das Gesprächstranscript und entscheidet, was als Nächstes gesagt wird. Es folgt deinem Prompt, greift auf Wissensdatenbanken zu und löst Tools wie Weiterleitungen und Buchungen aus. Das richtige Modell zu wählen bedeutet, Qualität, Latenz und Kosten auszubalancieren.
Einige Modelle verursachen zusätzliche Kosten pro Minute zusätzlich zum Basistarif. Prüfe den Kostenindikator neben jedem Modell im Katalog oder sieh dir Premium-Funktionen an.
Einfach
Profi
Preset
Was es macht
Intelligent
Höhere Antwortqualität mit mehr Latenz. Nutze das für komplexes Denken, mehrstufige Gespräche oder markensensible Interaktionen.
Ausgewogen
Gute Qualität und Geschwindigkeit für die meisten Anwendungsfälle. Empfohlen für die meisten Agenten.
Fast
Niedrigste Latenz. Nutze das für hohes Volumen oder einfache Routing- und Qualifizierungs-Workflows.
Wechsle nur dann, wenn Tests zeigen, dass du mehr Qualität oder mehr Geschwindigkeit brauchst.
Der Profi öffnet den vollständigen Anbieter-Katalog unter Allgemein → Denken. Nutze ihn, wenn du ein bestimmtes Modell brauchst, EU-gehostete Verarbeitung möchtest oder Anbieter direkt vergleichen willst.
ProfiWähle Custom, wenn du einen OpenAI-kompatiblen Endpunkt anbinden musst, der nicht Teil des integrierten Katalogs ist.Das Formular für das Custom-Modell fragt nach:
Basis-URL - die API-Basis-URL deines Modellanbieters
Modellname - die Modellkennung, die bei Requests gesendet wird
API-Schlüssel-Secret - ein gespeichertes Team-Secret zur Authentifizierung von Requests
Die Custom-LLM-Konfiguration ist nur im Profi verfügbar. Wenn ein Agent bereits ein Custom-Modell nutzt und du wieder in den Einfach wechselst, bleibt das Modell konfiguriert, erscheint aber als Einstellung des Profi.
Der Schieberegler Antwortstil erscheint unter Allgemein → Denken, wenn das gewählte Modell eine anpassbare Temperatur unterstützt.Die Temperatur steuert, wie konsistent oder variierend die Antworten des Agenten sind:
Bereich
Verhalten
Geeignet für
0.0
Voll deterministisch
Die meisten Agenten - maximiert Zuverlässigkeit beim Tool-Calling
0.1-0.3
Leichte Variation
Agenten, die natürliche Formulierungsvarianten brauchen
0.4-0.7
Kreativer
Persönlichkeitsgetriebene Agenten, bei denen Konsistenz weniger wichtig ist
0.8+
Unvorhersehbar
In Produktion vermeiden
Nutze 0.0 für Agenten, die Calls weiterleiten, Termine buchen oder APIs aufrufen. Höhere Temperatur reduziert die Zuverlässigkeit der Tool-Ausführung.