Audio LLM

⚠️⚠️⚠️ Wichtiger Hinweis: Dieser Node wird nicht mehr aktualisiert oder gewartet und ist zur Ausmusterung vorgesehen. Die weitere Nutzung wird daher nicht empfohlen. Wenn Sie ein Audio-LLM verwenden möchten, nutzen Sie bitte die Komponente „LLM“.

Im Gegensatz zu den Large Model (LLM)-Nodes in GPTBots unterstützt der Audio LLM sowohl Audioeingaben und -ausgaben. Zusätzlich können Nutzer:innen den gewünschten Tonfall der Sprachausgabe festlegen.

Node-Konfiguration

Large Language Model (LLM): Entspricht der Konfiguration im Large Model (LLM)-Node, jedoch kann hier ausschließlich ein Audio-LLM ausgewählt werden.
Audioeingabe: Nur Variablen des Typs „file-audio“ werden unterstützt.
Stimmton: Legt den Tonfall der Sprachausgabe fest.
Für Erläuterungen zu den weiteren Konfigurationsoptionen (KI-Kreativität, Maximale Antwort, Identitäts-Prompt, Benutzer:innen-Prompt, Speicher, Tool und Datentabelle) siehe bitte Large Model.

Node-Ausgabe

Die Ausgaben dieses Nodes umfassen ausschließlich die folgenden drei Felder:

text: Textinhalt, der vom LLM generiert wurde.
audio: Audiodatei, die vom LLM erstellt und als URL bereitgestellt wird.
transcript: Transkription des Audios als Text.