อัปเดตเอกสารข้อความ

อัปเดตเอกสารประเภท ข้อความ แบบกลุ่ม ระบบจะดำเนินการแบ่งเนื้อหา (chunking หรือ slicing), ฝังข้อมูล/แปลงเป็นเวกเตอร์ (embedding/vectorization) และสุดท้ายจะแทนที่เนื้อหาเอกสารเดิมด้วยเนื้อหาใหม่ โดยยังคงใช้รหัสเอกสารเดิม (document ID)

หมายเหตุ:
แบบจำลอง embedding จะใช้แบบเริ่มต้น ไม่สามารถกำหนดเองผ่าน API ได้
ผลลัพธ์ที่ได้จะเป็นเพียงผลการอัปโหลด ไม่ใช่ผล embedding สุดท้าย คุณสามารถตรวจสอบผลลัพธ์สุดท้ายได้ผ่าน API "Query Document Status"

วิธีการเรียกใช้งาน

PUT

URL สำหรับเรียกใช้งาน

https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update

การตรวจสอบสิทธิ์

ดูรายละเอียดการตรวจสอบสิทธิ์ใน Overview

คำขอ (Request)

ตัวอย่างการเรียกใช้งาน

curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update' \ -H 'Authorization: Bearer ${API Key}' \ -H 'Content-Type: application/json' \ -d '{ "knowledge_base_id": "67457fea6f658672d6482542", "chunk_token": 600, "splitter": "\n", "files": [ { "doc_id": "675158a5af12af632a4f63f6", "file_url": "https://www.gptbots.ai/doc/article_1.pdf", "source_url": "https://www.gptbots.ai/doc/article_1.pdf", "file_name": "article_1.pdf" } ] }'

                      
                      curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
    "knowledge_base_id": "67457fea6f658672d6482542",
    "chunk_token": 600,
    "splitter": "\n",
    "files": [
        {
            "doc_id": "675158a5af12af632a4f63f6",
            "file_url": "https://www.gptbots.ai/doc/article_1.pdf",
            "source_url": "https://www.gptbots.ai/doc/article_1.pdf",
            "file_name": "article_1.pdf"
        }
    ]
}'

บล็อกโค้ดนี้ในหน้าต่างลอย

ฟิลด์	ประเภท	คำอธิบาย
Authorization	Bearer ${API Key}	ใช้ Authorization: Bearer ${API Key} สำหรับการตรวจสอบสิทธิ์ รับ API Key ได้จากหน้า API Key
Content-Type	application/json	ประเภทข้อมูล ให้ตั้งค่าเป็น `application/json`

พารามิเตอร์ของคำขอ

ฟิลด์	ประเภท	จำเป็น	คำอธิบาย
files	Array<Object>	ใช่	รายการเอกสารที่ต้องการอัปเดต รองรับการอัปเดตสูงสุด 200 เอกสารในครั้งเดียว
doc_id	String	ใช่	รหัสของเอกสารที่ต้องการอัปเดต
file_url	String	ไม่ใช่	URL ของเอกสารที่ต้องการอัปเดต รองรับไฟล์ pdf/txt/md/doc/docx ขนาดสูงสุดสำหรับ PDF คือ 30MB และไฟล์อื่น ๆ 10MB หมายเหตุ: ต้องระบุ URL หรือ base64 อย่างใดอย่างหนึ่ง หากระบุทั้งคู่ ระบบจะใช้ base64 เป็นหลัก
file_base64	String	ไม่ใช่	base64 ของเอกสารที่ต้องการอัปเดต รองรับไฟล์ pdf/txt/md/doc/docx ขนาดสูงสุดสำหรับ PDF คือ 30MB และไฟล์อื่น ๆ 10MB หมายเหตุ: ต้องระบุ URL หรือ base64 อย่างใดอย่างหนึ่ง หากระบุทั้งคู่ ระบบจะใช้ base64 เป็นหลัก
source_url	String	ไม่ใช่	URL ต้นทางของเอกสารที่ต้องการอัปเดต ต้องเป็นไปตามรูปแบบ URL หากปล่อยว่าง ระบบจะไม่อัปเดตค่านี้ หากต้องการตั้งค่าให้ว่าง ให้กรอก `NULL`
chunk_token	Integer	ไม่ใช่	จำนวนโทเคนสูงสุดต่อ 1 ชิ้นความรู้ขณะแบ่งเนื้อหา ค่าเริ่มต้นคือ 600 ช่วงที่รองรับ: 1-1000 หมายเหตุ: ต้องระบุจำนวนโทเคนสูงสุดหรือ splitter อย่างใดอย่างหนึ่ง หากระบุทั้งคู่ ระบบจะใช้ splitter เป็นหลัก
splitter	String	ไม่ใช่	ตัวแบ่งเนื้อหาในการแบ่งชิ้นความรู้ ค่าเริ่มต้นคือว่าง สามารถใช้ “\n” เพื่อแบ่งบรรทัด หมายเหตุ: ต้องระบุจำนวนโทเคนสูงสุดหรือ splitter อย่างใดอย่างหนึ่ง หากระบุทั้งคู่ ระบบจะใช้ splitter เป็นหลัก

การตอบกลับ (Response)

ตัวอย่างการตอบกลับ

{ "doc": [ { "doc_id": "xxxxxx", "doc_name": "test_1.txt" }, { "doc_id": "xxxxxx", "doc_name": "test_2.pdf" } ], "failed": [ "xxxxxx", "xxxxxx" ] }

                      
                      {
    "doc": [
        {
            "doc_id": "xxxxxx",
            "doc_name": "test_1.txt"
        },
        {
            "doc_id": "xxxxxx",
            "doc_name": "test_2.pdf"
        }
    ],
    "failed": [
        "xxxxxx",
        "xxxxxx"
    ]
}