Identifizieren, Entfernen, und Ersetzen von personenbezogenen Daten in unstrukturiertem Text

Ihre Daten, auf Ihre Art

Wir setzen die neuesten Entwicklungen in Transformer-Architekturen ein, um personenbezogene Daten ausschließlich auf Grundlage des Kontexts zu erkennen, was uns insbesondere bei halbstrukturierten und unstrukturierten Daten äußerst effektiv macht.

Mit Private AI können Daten-, Sicherheits- und Machine-Learning-Teams:

Schwärzen Sie Daten wie ASR-Transkripte, Chat-Protokolle und elektronische Gesundheitsakten genau.
Die vollständige Kontrolle über ihre Daten behalten; diese werden niemals mit uns geteilt und verlassen niemals Ihre Obhut (im Gegensatz zu großen Cloud-Providern, unsere AGB unterstützen dies).
Text in 52 Sprachen (und bald noch weiteren) erkennen und entfernen.
Die Ausgabe umfangreich konfigurieren, einschließlich des Ein- und Ausschaltens von Entitäten, des Hinzufügen von Sperr- oder Erlaubnislisten, und der Einhaltung von Datenschutzbestimmungen wie DSGVO, LGPD, HIPAA und mehr.
Benutzerdefinierte Entitätstypen, die mit den Few-Shot-Learning-Techniken entwickelt wurden, die Private AI verwendet.

Entwickelt von Experten aus:

Built by experts from:

So funktioniert es:

Private AI wird über einen einzigen Container vor Ort bereitgestellt, so dass Sie unsere leistungsstarken Datenentfernungsfunktionen einfach in jeden Daten-Arbeitsablauf integrieren können. Der Container wird über eine REST-API aufgerufen und kann je nach Bedarf Ihres Teams einfach angepasst werden.

IDENTIFIZIERUNG PERSONENBEZOGENER DATEN

Privatsphäre ist mehr als ein ML-Modell

Private AI erkennt über 50 verschiedene Entitätstypen personenbezogener Daten in 52 Sprachen.

Mit Hilfe unserer kontextbewussten ML-Modelle gehen wir über die herkömmliche Entitätserkennung hinaus und können viele verschiedene Arten von direkten und Quasi-Identifikatoren auffinden.

Was personenbezogene Daten sind und was nicht, ist kompliziert, und das Team von Datenschutzexperten von Private AI stellt sicher, dass unser System in Übereinstimmung mit wichtigen Gesetzen wie der DSGVO, dem CPRA und HIPAA arbeitet.

Private AI kann leicht als Filter implementiert werden, um jeden Datenfluss und jede Datenbank auf personenbezogene Daten hin zu überprüfen.

				
					
{
  "result": "Hi [NAME_1], [NAME_2] this side. It's been a while since we last met in [LOCATION_CITY_1].",
  "result_fake": null,
  "pii": [
    {
      "marker": "NAME_1",
      "text": "John",
      "best_label": "NAME",
      "stt_idx": 3,
      "end_idx": 7,
      "labels": {
        "NAME": 0.8446
      }
    },
    {
      "marker": "NAME_2",
      "text": "Grace",
      "best_label": "NAME",
      "stt_idx": 9,
      "end_idx": 14,
      "labels": {
        "NAME": 0.8399
      }
    },
    {
      "marker": "LOCATION_CITY_1",
      "text": "Berlin",
      "best_label": "LOCATION_CITY",
      "stt_idx": 63,
      "end_idx": 69,
      "labels": {
        "LOCATION_CITY": 0.8778,
        "LOCATION": 0.8512
      }
    }
  ],
  "api_calls_used": 1,
  "output_checks_passed": true
}

ENT-IDENTIFIKATION VON TEXT

Entfernen Sie Daten mit höherer Genauigkeit als menschenmöglich

Private AI kann alle erkannten personenbezogenen Daten durch eindeutige Identifikatoren (z. B. NAME_1, CVV_3, KREDITKARTE_2) ersetzen, um geschwärzte Transkripte oder ent-identifizierte Daten zu erzeugen. Alternativ können personenbezogene Daten durch ein Maskenzeichen ersetzt werden. Erfahren Sie mehr in unseren Dokumenten.

Unübertroffene Genauigkeit

SYNTHETISCHE GENERIERUNG PERSONENBEZOGENER DATEN

Verwenden Sie niemals Transformer ohne Datenschutzmaßnahmen

Nachdem personenbezogene Daten entfernt wurden, kann Private AI synthetische Daten generieren, um alle erkannten personenbezogenen Daten mit künstlichen Daten zu ersetzen, die zum umgebenden Kontext passen.

Der synthetische Daten-Generator sieht niemals die Originaldaten und vermeidet so das Risiko von Datenpannen. Der resultierende Text reduziert das Risiko der Re-Identifizierung, da ein Angreifer zuerst herausfinden muss, welche personenbezogenen Daten echt sind. Viel Glück bei der Suche nach der Nadel im Heuhaufen!

Die Ersetzung aller personenbezogener Daten in den Produktionsdaten durch synthetische Daten minimiert auch die Datenverschiebung, was besonders vorteilhaft ist, wenn ML-Modelle erstellt werden.

TOKENISIERUNG UND PSEUDONYMISIERUNG

Rückgängigmachung der Entfernung personenbezogener Daten bei Bedarf

Ersetzen Sie personenbezogene Daten durch verschlüsselte Tokens mit Private AIs Tokenisierungs-Funktion. Tokenisierung, manchmal auch Pseudonymisierung genannt, bewahrt die Nutzbarkeit der Daten und schützt zugleich die Privatsphäre.

Tokenisierung ist umkehrbar, so dass Sie die Originaldaten leicht wiederherstellen können. Kontaktieren Sie uns für Dokumentation und Zugang.

PrivateGPT

Text

Dateien

Schnellzugriffe

ASR-Transkripte

Maschinelles Lernen

Gesundheitswesen

Prüfungen & Beurteilungen

Datenentdeckung

Compliance & sichere Speicherung

Eigennamenerkennung

Ressourcen

Feature-Post

Unternehmen

Aktuelle Nachrichten

Identifizieren, Entfernen, und Ersetzen von personenbezogenen Daten in unstrukturiertem Text

Ihre Daten, auf Ihre Art