อัปเดตเอกสารข้อความ
อัปเดตเอกสารข้อความ
อัปเดตเอกสารประเภท ข้อความ แบบกลุ่ม ระบบจะดำเนินการแบ่งเนื้อหา (chunking หรือ slicing), ฝังข้อมูล/แปลงเป็นเวกเตอร์ (embedding/vectorization) และสุดท้ายจะแทนที่เนื้อหาเอกสารเดิมด้วยเนื้อหาใหม่ โดยยังคงใช้รหัสเอกสารเดิม (document ID)
หมายเหตุ:
แบบจำลอง embedding จะใช้แบบเริ่มต้น ไม่สามารถกำหนดเองผ่าน API ได้
ผลลัพธ์ที่ได้จะเป็นเพียงผลการอัปโหลด ไม่ใช่ผล embedding สุดท้าย คุณสามารถตรวจสอบผลลัพธ์สุดท้ายได้ผ่าน API "Query Document Status"
วิธีการเรียกใช้งาน
PUT
URL สำหรับเรียกใช้งาน
https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update
การตรวจสอบสิทธิ์
ดูรายละเอียดการตรวจสอบสิทธิ์ใน Overview
คำขอ (Request)
ตัวอย่างการเรียกใช้งาน
curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
"knowledge_base_id": "67457fea6f658672d6482542",
"chunk_token": 600,
"splitter": "\n",
"files": [
{
"doc_id": "675158a5af12af632a4f63f6",
"file_url": "https://www.gptbots.ai/doc/article_1.pdf",
"source_url": "https://www.gptbots.ai/doc/article_1.pdf",
"file_name": "article_1.pdf"
}
]
}'
curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
"knowledge_base_id": "67457fea6f658672d6482542",
"chunk_token": 600,
"splitter": "\n",
"files": [
{
"doc_id": "675158a5af12af632a4f63f6",
"file_url": "https://www.gptbots.ai/doc/article_1.pdf",
"source_url": "https://www.gptbots.ai/doc/article_1.pdf",
"file_name": "article_1.pdf"
}
]
}'
บล็อกโค้ดนี้ในหน้าต่างลอย
Header ของคำขอ
| ฟิลด์ | ประเภท | คำอธิบาย |
|---|---|---|
| Authorization | Bearer ${API Key} | ใช้ Authorization: Bearer ${API Key} สำหรับการตรวจสอบสิทธิ์ รับ API Key ได้จากหน้า API Key |
| Content-Type | application/json | ประเภทข้อมูล ให้ตั้งค่าเป็น application/json |
พารามิเตอร์ของคำขอ
| ฟิลด์ | ประเภท | จำเป็น | คำอธิบาย |
|---|---|---|---|
| files | Array<Object> | ใช่ | รายการเอกสารที่ต้องการอัปเดต รองรับการอัปเดตสูงสุด 200 เอกสารในครั้งเดียว |
| doc_id | String | ใช่ | รหัสของเอกสารที่ต้องการอัปเดต |
| file_url | String | ไม่ใช่ | URL ของเอกสารที่ต้องการอัปเดต รองรับไฟล์ pdf/txt/md/doc/docx ขนาดสูงสุดสำหรับ PDF คือ 30MB และไฟล์อื่น ๆ 10MB หมายเหตุ: ต้องระบุ URL หรือ base64 อย่างใดอย่างหนึ่ง หากระบุทั้งคู่ ระบบจะใช้ base64 เป็นหลัก |
| file_base64 | String | ไม่ใช่ | base64 ของเอกสารที่ต้องการอัปเดต รองรับไฟล์ pdf/txt/md/doc/docx ขนาดสูงสุดสำหรับ PDF คือ 30MB และไฟล์อื่น ๆ 10MB หมายเหตุ: ต้องระบุ URL หรือ base64 อย่างใดอย่างหนึ่ง หากระบุทั้งคู่ ระบบจะใช้ base64 เป็นหลัก |
| source_url | String | ไม่ใช่ | URL ต้นทางของเอกสารที่ต้องการอัปเดต ต้องเป็นไปตามรูปแบบ URL หากปล่อยว่าง ระบบจะไม่อัปเดตค่านี้ หากต้องการตั้งค่าให้ว่าง ให้กรอก NULL |
| chunk_token | Integer | ไม่ใช่ | จำนวนโทเคนสูงสุดต่อ 1 ชิ้นความรู้ขณะแบ่งเนื้อหา ค่าเริ่มต้นคือ 600 ช่วงที่รองรับ: 1-1000 หมายเหตุ: ต้องระบุจำนวนโทเคนสูงสุดหรือ splitter อย่างใดอย่างหนึ่ง หากระบุทั้งคู่ ระบบจะใช้ splitter เป็นหลัก |
| splitter | String | ไม่ใช่ | ตัวแบ่งเนื้อหาในการแบ่งชิ้นความรู้ ค่าเริ่มต้นคือว่าง สามารถใช้ “\n” เพื่อแบ่งบรรทัด หมายเหตุ: ต้องระบุจำนวนโทเคนสูงสุดหรือ splitter อย่างใดอย่างหนึ่ง หากระบุทั้งคู่ ระบบจะใช้ splitter เป็นหลัก |
การตอบกลับ (Response)
ตัวอย่างการตอบกลับ
{
"doc": [
{
"doc_id": "xxxxxx",
"doc_name": "test_1.txt"
},
{
"doc_id": "xxxxxx",
"doc_name": "test_2.pdf"
}
],
"failed": [
"xxxxxx",
"xxxxxx"
]
}
{
"doc": [
{
"doc_id": "xxxxxx",
"doc_name": "test_1.txt"
},
{
"doc_id": "xxxxxx",
"doc_name": "test_2.pdf"
}
],
"failed": [
"xxxxxx",
"xxxxxx"
]
}
บล็อกโค้ดนี้ในหน้าต่างลอย
การตอบกลับเมื่อสำเร็จ
| ฟิลด์ | ประเภท | คำอธิบาย |
|---|---|---|
| doc | Array<Object> | รายการเอกสารที่อัปเดตสำเร็จ |
| doc_id | String | รหัสของเอกสารที่อัปเดตสำเร็จ |
| doc_name | String | ชื่อของเอกสารที่อัปเดตสำเร็จ |
| failed | Array<Object> | รายการรหัสเอกสารที่อัปเดตไม่สำเร็จ |
การตอบกลับเมื่อไม่สำเร็จ
| ฟิลด์ | ประเภท | คำอธิบาย |
|---|---|---|
| code | Int | รหัสข้อผิดพลาด |
| message | String | รายละเอียดข้อผิดพลาด |
