logo
Development
検索
オーディオLLM

オーディオLLM

⚠️⚠️⚠️ 重要なお知らせ: このノードは今後更新・保守されず、廃止予定です。そのため、継続しての使用はお勧めしません。オーディオLLMを使用する必要がある場合は、「LLM」コンポーネントをご利用ください。

GPTBotsのLarge Model(LLM)ノードとは異なり、オーディオLLMは音声入力と音声出力の両方に対応しています。さらに、適用する音声のトーンを指定することができます。

ノードの設定

image.png

  • 大規模言語モデル(LLM): LLMノードの設定と同様ですが、選択可能なのはオーディオLLMのみです。

  • 音声入力: "file-audio"タイプの変数のみが対応しています。

  • 音声トーンe: 出力音声のトーンを定義します。

  • その他の設定項目(AIの創造性最大レスポンス数アイデンティティプロンプトユーザープロンプトメモリツールデータテーブル)の詳細については、Large Modelをご参照ください。

ノードの出力

image.png

このノードの出力は以下の3つのフィールドから成り立っています。

  • text: LLMが生成したテキスト内容。

  • audio: LLMが生成した音声ファイルで、URL形式で提供されます。

  • transcript: 音声ファイルの書き起こしテキスト。