Dubletten in Patientendaten

Zusammenfassung

Wann müssen wir die Dubletten in Patientendaten finden? Immer dann, wenn wir eine der folgenden Situationen antreffen:

  • Wir führen Datenbanken mit Patientendaten zusammen. Beispielsweise soll die Administration vereinfacht werden, indem zwei Systeme vereint werden.
  • Wir führen einen Master Patient Index (MPI) ein. Dann müssen wir wissen, welche Datensätze zu demselben Patienten gehören, identifizieren. Und dies über eine ganze Anzahl von Systemen.
  • Wir führen alle medizinischen Daten eines Patienten zusammen. Hier sind Dubletten besonders kritisch. Denn bei einer Abfrage der Daten zu einem Patienten werden nicht alle Informationen angezeigt. Nur die Informationen der meist zufällig ausgewählten Dublette sind sichtbar. Die Informationen der anderen Dublette bleiben verborgen.

Die Aufgabe Dubletten zu finden ist anspruchsvoll. So müssen wir bei der Suche der Dubletten wir beispielsweise folgendes berücksichtigen:

  • Fehler in Namen und Vornamen
  • Verwechslungen
  • Tippfehler
  • Änderungen des Familiennamens
  • Änderungen der  Adresse

Bei dieser Suche dürfen wir keine Fehler machen. Sonst werden bei der Bereinigung der Dubletten Informationen zusammengeführt, die nicht zusammengehören. Bei Patientendaten ist dies besonders gravierend. Denn die medizinischen Informationen eines Patienten können dann einem anderen Patienten zugeordnet sein.

CrowTen hat eine Software-Lösung  zur anspruchsvollen Suche von Dubletten entwickelt. Der ausgeklügelte Algorithmus findet Dubletten auch in komplizierten Fällen mit der grösstmöglichen Sicherheit.

Weshalb müssen Dubletten in Patientendaten gefunden werden?

Dubletten in Patientendaten müssen wir suchen und finden, wenn

  1. Patientendatenbanken zusammengelegt werden
  2. ein MPI (master patient index) erstellt wird
  3. medizinische oder administrative Daten zu einem Patienten in mehreren Datenbanken gefunden werden müssen.

Auch wenn die Gründe, Dubletten zu suchen, verschieden sind, die Aufgabenstellung bleibt sich stets dieselbe.

Aufgabenbeschreibung

Wir stehen vor einer Datenbank mit vielleicht hunderttausenden von Datensätzen. Hier müssen wir nun für jeden einzelnen Datensatz feststellen, ob er ein Unikat ist oder zu einer Dublette gehört. Dubletten, d.h. Datensätze, die zu derselben Person gehören, müssen wir nun sicher identifizieren. Dabei müssen wir sicher sein, dass wir keine falschen Dubletten ausweisen. Sonst werden wir später evtl. medizinische Informationen einem falschen Patienten zuordnen.

Spezielle Herausforderung der Dublettensuche

Wenn alle Eingaben in den Datenbanken korrekt, ohne Schreibfehler und ohne Verwechslungen wären, wenn es keine Änderungen der Familiennamen und keine Kurznamen der Vornamen gäbe, wäre die Aufgabe leicht zu lösen. Dann könnten wir in einer Excel-Tabelle mit Excel Standard Funktionen die Dubletten finden. Verwechslungen, Tippfehler, Änderungen der Namen kommen jedoch ziemlich häufig vor. Eine brauchbare Software zur Suche von Dubletten muss aber gerade mit diesen Fällen umgehen können.

Was zeichnet die Software der CrowTen aus?

CrowTen hat eine Software-Lösung entwickelt, welche die folgenden Vorzüge aufweist:

  1. Die Suche der Dubletten ist einfach anzuwenden. Das Verfahren unterteilt sich in die folgenden Schritte
    1. Die Patientendaten werden zur Untersuchung in eine Excel-Tabelle exportiert. Nahezu alle Datenbanken stellen eine Schnittstelle für den Export der Daten in eine Excel-Tabelle zur Verfügung.
    2. Die Daten werden in das Modul Dubletten Erkennung eingelesen.
    3. Die Software analysiert die Daten
    4. Die Resultate sind in drei Dateien abgespeichert: Unikate, Dubletten und mögliche Dubletten
  2. Der Toleranzwert für die Bestimmung der sicheren und möglichen Dubletten ist einstellbar.
  3. Daten können einfach vor- oder nachbearbeitet werden. Dafür stellt CrowTen eine Anleitung zur effizienten Bearbeitung der Daten zur Verfügung.
  4. CrowTen hat ein spezielles Software Tool zur Beurteilung der möglichen Dubletten entwickelt. Damit lassen sich die möglichen Dubletten effizient beurteilen und entweder den Unikaten oder Dubletten zuordnen

Weitergehende Tools und Verfahren

Wenn Sie die Patientendaten bereinigen, so ist die Suche und das Entfernen von Dubletten die anspruchsvollste Aufgabe. Eine ganze Reihe anderer Aufgaben wartet jedoch zusätzlich auf Sie.

CrowTen hat Tools und Verfahren entwickelt, welche die folgenden Aufgaben unterstützen:

  • Zusammenführen von Patientendaten
  • Bereinigen von Patientendaten in Etappen
  • Analyse von mit den Patientendaten verknüpften Daten (Falldaten, medizinische Daten)

Falls Sie Fragen haben, stehen wir Ihnen gerne zur Verfügung.

Jürg Simonett

Dipl. El. Ing. ETH, Dr. sc. techn.

CEO
Senior Consultant bei System- und Datenintegrationsprojekten
bei CrowTen seit 1996

Jürg Simonett