オーディオLLM
オーディオLLM
GPTBotsのLarge Model(LLM)ノードとは異なり、オーディオLLMは音声入力と音声出力の両方に対応しています。さらに、適用する音声のトーンを指定することができます。
ノードの設定
大規模言語モデル(LLM): LLMノードの設定と同様ですが、選択可能なのはオーディオLLMのみです。
音声入力: "file-audio"タイプの変数のみが対応しています。
音声トーンe: 出力音声のトーンを定義します。
その他の設定項目(AIの創造性、最大レスポンス数、アイデンティティプロンプト、ユーザープロンプト、メモリ、ツール、データテーブル)の詳細については、Large Modelをご参照ください。
ノードの出力
このノードの出力は以下の3つのフィールドから成り立っています。
text: LLMが生成したテキスト内容。
audio: LLMが生成した音声ファイルで、URL形式で提供されます。
transcript: 音声ファイルの書き起こしテキスト。