開発スペース / ワークフロー / ノード / オーディオLLM

オーディオLLM

最終更新日：2025年4月7日

オーディオLLM

⚠️⚠️⚠️ 重要なお知らせ: このノードは今後更新・保守されず、廃止予定です。そのため、継続しての使用はお勧めしません。オーディオLLMを使用する必要がある場合は、「LLM」コンポーネントをご利用ください。

GPTBotsのLarge Model（LLM）ノードとは異なり、オーディオLLMは音声入力と音声出力の両方に対応しています。さらに、適用する音声のトーンを指定することができます。

ノードの設定

大規模言語モデル（LLM）: LLMノードの設定と同様ですが、選択可能なのはオーディオLLMのみです。
音声入力: "file-audio"タイプの変数のみが対応しています。
音声トーンe: 出力音声のトーンを定義します。
その他の設定項目（AIの創造性、最大レスポンス数、アイデンティティプロンプト、ユーザープロンプト、メモリ、ツール、データテーブル）の詳細については、Large Modelをご参照ください。

ノードの出力

このノードの出力は以下の3つのフィールドから成り立っています。

text: LLMが生成したテキスト内容。
audio: LLMが生成した音声ファイルで、URL形式で提供されます。
transcript: 音声ファイルの書き起こしテキスト。