logo
Entwicklung
Suchen
Audio LLM

Audio LLM

⚠️⚠️⚠️ Wichtiger Hinweis: Dieser Node wird nicht mehr aktualisiert oder gewartet und ist zur Ausmusterung vorgesehen. Die weitere Nutzung wird daher nicht empfohlen. Wenn Sie ein Audio-LLM verwenden möchten, nutzen Sie bitte die Komponente „LLM“.

Im Gegensatz zu den Large Model (LLM)-Nodes in GPTBots unterstützt der Audio LLM sowohl Audioeingaben und -ausgaben. Zusätzlich können Nutzer:innen den gewünschten Tonfall der Sprachausgabe festlegen.

Node-Konfiguration

image.png

  • Large Language Model (LLM): Entspricht der Konfiguration im Large Model (LLM)-Node, jedoch kann hier ausschließlich ein Audio-LLM ausgewählt werden.

  • Audioeingabe: Nur Variablen des Typs „file-audio“ werden unterstützt.

  • Stimmton: Legt den Tonfall der Sprachausgabe fest.

  • Für Erläuterungen zu den weiteren Konfigurationsoptionen (KI-Kreativität, Maximale Antwort, Identitäts-Prompt, Benutzer:innen-Prompt, Speicher, Tool und Datentabelle) siehe bitte Large Model.

Node-Ausgabe

image.png

Die Ausgaben dieses Nodes umfassen ausschließlich die folgenden drei Felder:

  • text: Textinhalt, der vom LLM generiert wurde.

  • audio: Audiodatei, die vom LLM erstellt und als URL bereitgestellt wird.

  • transcript: Transkription des Audios als Text.