Audio LLM

Audio LLM

⚠️⚠️⚠️ ประกาศสำคัญ: โหนดนี้จะไม่มีการอัปเดตหรือดูแลรักษาอีกต่อไป และมีกำหนดการเลิกใช้งานในอนาคต ดังนั้นไม่แนะนำให้ใช้งานต่อ หากต้องการใช้งาน audio LLM กรุณาใช้คอมโพเนนต์ "LLM" แทน

แตกต่างจากโหนด Large Model (LLM) ใน GPTBots ตรงที่ Audio LLM รองรับทั้งอินพุตเสียงและเอาต์พุตเสียง และยังสามารถกำหนดโทนเสียงของเอาต์พุตได้

การตั้งค่าโหนด

image.png

  • Large Language Model (LLM): ตั้งค่าเหมือนกับโหนด Large Model (LLM) แต่จะเลือกได้เฉพาะ audio LLM เท่านั้น

  • Audio Input: รองรับเฉพาะตัวแปรประเภท "file-audio"

  • Voice Tone: กำหนดโทนเสียงของเอาต์พุตเสียง

  • สำหรับคำอธิบายของรายการตั้งค่าอื่น ๆ (AI Creativity, Maximum Response, Identity Prompt, User Prompt, Memory, Tool และ Data Table) กรุณาดูรายละเอียดที่ Large Model

เอาต์พุตของโหนด

image.png

เอาต์พุตของโหนดนี้จะมี 3 ฟิลด์ดังนี้:

  • text: ข้อความที่สร้างโดย LLM

  • audio: ไฟล์เสียงที่สร้างโดย LLM ในรูปแบบ URL

  • transcript: ข้อความถอดเสียงจากไฟล์เสียง