Bereinigen der Patienten-Daten im Spital

Aufgabe

Hier beschreiben wir das Bereinigen der Patienten-Daten im Spital und zwar anhand eines konkreten Projekts.

Die Spitäler des Kantons Baselland haben drei Administrationssysteme zu einem zusammengeführt. Dazu mussten sie die Patienten-Daten der drei Systeme bereinigen und vereinheitlichen. Da viele Patienten in mehr als einem Spital behandelt wurden, waren sehr viele Dubletten zu erwarten.

Die Aufgabe bestand nun darin, die Dubletten zu eliminieren und wo nötig, Daten zusammenzuführen – und zwar mit einer Null-Fehler Toleranz.

Lösung

  1. In einem ersten Schritt haben wir die Patienten-Daten analysiert:
    Wie sind sie strukturiert?
    Wie sind sie miteinander verbunden?
  2. In Zusammenarbeit mit dem Kunden haben wir dann festgelegt, wie das Ergebnis nach dem Zusammenführen der Daten aussehen soll. Die Frage lautete: Wie müssen die Daten strukturiert sein, damit sie weiterverwendet werden können.
  3. Dann haben wir unser Data AppKit Modul für die automatische Erkennung der Dubletten für die Daten optimiert. Wir haben die Parameter zur Gewichtung der einzelnen verwendeten Algorithmen an die spezifische Situation angepasst. Das Data AppKit hat dann die Patienten-Daten analysiert und die sicheren Dubletten erkannt und ausgewiesen.
  4. Übrig blieben die möglichen oder unsicheren Dubletten. Diese sind in jedem Fall manuell zu überprüfen. Ein weiteres Modul des Data AppKits unterstützt diese Aufgabe. Wir haben es ebenfalls für die spezielle Situation des Kunden konfiguriert. Das Data AppKit Modul zur Bearbeitung der möglichen Dubletten haben wir dann dem Kunden für vier Monate in Lizenz zur Verfügung gestellt. Drei Mitarbeiter haben in dieser Zeit die rund 50‘000 unsicheren Fälle effizient bearbeitet. Die Benutzeroberfläche des Data AppKit Moduls ist unten abgebildet. Die Patientendaten sind selbstverständlich nur Dummy-Daten.

 

bereinigen von Patientendaten
Abb. 1: Benutzeroberfläche zur Bereinigung von Patientendaten

 

Das Bereinigen der Patienten-Daten für das Kantonsspital Baselland umfasste insgesamt rund 600’000 Datensätze. Davon waren rund ein Drittel Dubletten. Wiederum ein Viertel davon, als rund 50’000 Datensätze mussten von Hand mit dem oben dargestellten Modul bearbeitet werden.