การทำข้อมูลให้ไม่ระบุตัวตน

การทำข้อมูลให้ไม่ระบุตัวตน

การทำข้อมูลให้ไม่ระบุตัวตน (Data Anonymization) คือกระบวนการปกปิดหรือเปลี่ยนแปลงข้อมูลที่สามารถระบุตัวบุคคล (PII) ที่ผู้ใช้กรอกเข้ามา เพื่อไม่ให้สามารถระบุตัวตนได้ ช่วยให้มั่นใจว่าข้อมูลส่วนบุคคลที่มีความละเอียดอ่อนจะไม่ถูกเข้าถึงโดยบริการ LLM และช่วยปกป้องความเป็นส่วนตัวของผู้ใช้

กระบวนการ

loading...
graph LR
    Input --> Anonymization --> LLM --> Deanonymization --> Output

การตั้งค่า

ขณะนี้รองรับเฉพาะบริการทำข้อมูลไม่ระบุตัวตนของ Microsoft Presidio เท่านั้น

กลุ่ม

สามารถจัดกลุ่มเอนทิตี (Entity) ที่แตกต่างกันไว้ในหมวดหมู่แยกกัน เพื่อให้ง่ายต่อการเลือกใช้งานกับ AI Agent

เอนทิตี

เอนทิตี (Entity) หมายถึงวัตถุประสงค์ของการทำข้อมูลไม่ระบุตัวตน GPTBots มีเอนทิตีที่ใช้บ่อยในระบบให้เลือกใช้งาน และยังเปิดให้ผู้ใช้สามารถกำหนดเอนทิตีเองเพิ่มเติมได้ เพื่อรองรับความต้องการที่หลากหลาย

สร้างเอนทิตีใหม่

  • ชื่อ (Name): ชื่อของเอนทิตี ต้องเป็นตัวอักษรภาษาอังกฤษตัวพิมพ์ใหญ่และขีดล่างเท่านั้น
  • ภาษา (Language): ภาษาที่เอนทิตีรองรับ โดย 1 เอนทิตีสามารถรองรับได้หลายภาษา
  • คำอธิบาย (Description): คำอธิบายหรือแนะนำเกี่ยวกับเอนทิตีโดยสังเขป
  • รูปแบบ Regex (Regex Pattern): รูปแบบ Regular Expression สำหรับใช้ตรวจจับเอนทิตี
  • คะแนนความมั่นใจ (Score/Confidence): ระดับความมั่นใจในการตรวจจับ มีค่าตั้งแต่ 0.0 ถึง 1.0
  • คำที่มีความอ่อนไหว (Sensitive Words): รายการคำหรือวลีที่หากพบในข้อความจะถือเป็นเอนทิตีนั้นทันที
  • บริบท (Context): รายการคีย์เวิร์ดบริบทที่ช่วยเพิ่มคะแนนความมั่นใจในการตรวจจับ หากพบคำเหล่านี้ใกล้กับข้อความที่อาจเป็นเอนทิตี Presidio จะให้คะแนนความมั่นใจสูงขึ้น