logo
Development
検索
オーディオLLM

オーディオLLM

GPTBotsのLarge Model(LLM)ノードとは異なり、オーディオLLMは音声入力と音声出力の両方に対応しています。さらに、適用する音声のトーンを指定することができます。

ノードの設定

image.png

  • 大規模言語モデル(LLM): LLMノードの設定と同様ですが、選択可能なのはオーディオLLMのみです。

  • 音声入力: "file-audio"タイプの変数のみが対応しています。

  • 音声トーンe: 出力音声のトーンを定義します。

  • その他の設定項目(AIの創造性最大レスポンス数アイデンティティプロンプトユーザープロンプトメモリツールデータテーブル)の詳細については、Large Modelをご参照ください。

ノードの出力

image.png

このノードの出力は以下の3つのフィールドから成り立っています。

  • text: LLMが生成したテキスト内容。

  • audio: LLMが生成した音声ファイルで、URL形式で提供されます。

  • transcript: 音声ファイルの書き起こしテキスト。