Datenanonymisierung
Datenanonymisierung
Datenanonymisierung bezeichnet den Prozess, personenbezogene Daten (PII), die Nutzer:innen eingeben, zu anonymisieren. So sind sensible Nutzerdaten für LLM-Dienste nicht zugänglich, wodurch der Datenschutz gewährleistet wird.
Prozess
graph LR
Input --> Anonymisierung --> LLM --> Deanonymisierung --> OutputKonfiguration
Derzeit ist nur der Microsoft Presidio Anonymisierungsdienst verfügbar.
Gruppe

Verschiedene Entitäten lassen sich in Kategorien gruppieren, um die Auswahl und Nutzung in Agenten zu vereinfachen.
Entität
Eine Entität ist das Objekt, das anonymisiert wird. GPTBots bietet eine integrierte Unterstützung für eine Reihe häufig genutzter Entitäten und ermöglicht auch die Erstellung benutzerdefinierter Entitäten für verschiedene Anonymisierungsanforderungen.
Neue Entität

- Name: Der Name der Entität; darf nur Großbuchstaben und Unterstriche enthalten.
- Sprache: Die von der Entität unterstützten Sprache(n). Eine einzelne Entität kann mehrere Sprachen unterstützen.
- Beschreibung: Eine kurze Einführung oder Erläuterung zur Entität.
- Regex-Muster: Ein regulärer Ausdruck, der zum Erkennen der Entität verwendet wird.
- Score (Vertrauensniveau): Gibt das Vertrauensniveau des Treffers an, im Bereich von 0,0 bis 1,0.
- Sensitive Wörter: Liste exakter Wörter oder Phrasen, die bei Vorkommen im Text als diese Entität erkannt werden.
- Kontext: Liste von Schlüsselwörtern, die die Wahrscheinlichkeit eines Treffers erhöhen. Wenn diese Wörter in der Nähe eines potenziellen Treffers im Text erscheinen, weist Presidio dem Treffer einen höheren Vertrauenswert zu.
