Mehrere Gesetzgebungsvorhaben sollen die Art und Weise, wie medizinische Daten gesammelt, genutzt und verknüpft werden, grundlegend verändern: unter anderem das Forschungsdatengesetz aus dem Bundesforschungsministerium sowie das Gesetz für Daten und Digitale Innovation im Gesundheitswesen (GeDIG) und das Medizinregistergesetz (MRG) aus dem Bundesgesundheitsministerium (BMG). Ziel ist eine bessere Nutzung von Gesundheitsdaten für die Forschung, die Versorgung und die Politik. Eine Forschungskennziffer soll dafür sorgen, dass Daten aus verschiedenen Quellen verknüpfbar gemacht werden. Kürzlich gab es dazu auch eine Anhörung im Gesundheitsausschus s.
Wofür es eine Kennziffer benötigt
„In Deutschland haben wir mehr als in anderen Ländern verteilte Datenbestände. Nicht nur aus Krankenhäusern und Praxen, sondern auch Daten aus Rehakliniken bei den Rentenversicherungsträgern oder von der Unfallversicherung. Mangels durchgängiger standardisierter medizinischer Dokumentation, gerade im ambulanten Bereich, erhalten wir bestimmte Informationen eben zum Beispiel nur aus den Daten der Krankenkassen. Wer forschen will, kämpft gegen eine strukturelle Zersplitterung, die historisch gewachsen und politisch kaum aufzubrechen ist“, so Sebastian C. Semler, Arzt und seit 2004 Geschäftsführer der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e. V. (TMF).
Daher ist eine seit Jahren diskutierte Lösung eine eindeutige Kennziffer, die Datensätze verschiedener Herkunft einem gemeinsamen Fall zuordnet . Nicht um den Menschen dahinter zu identifizieren, sondern um zu wissen, dass dieser Datensatz aus dem Krankenhaus und jener aus der Rehaklinik zur selben Person gehören, betont Semler: „Es ist gar nicht wichtig, dass ich den Bürger dahinter erkenne. Es ist wichtig, dass ich weiß: Der Datensatz von Bürger X beim Niedergelassenen gehört zum gleichen Bürger wie der entsprechende Datensatz im Krankenhaus oder eben in der Rehaklinik. Dabei ist im Kern völlig unerheblich, ob das jetzt der Bürger Müller, Meier oder Schulze ist – es ist dabei entscheidend, dass ich die richtigen Daten zusammenführe.“
Uneinigkeit bei KVNR
Mittels Record-Linkage werden Datensätze über Kombinationen von Wohnort, Alter, Geschlecht und ähnlichen Merkmalen verknüpft , was bis zu einem gewissen Grad gut funktioniert. Auf Basis anonymisierter Daten lassen sich durchaus Daten zusammenführen. Laut Semler sei Record-Linkage mit manuellen Prüfungen sehr aufwendig und skaliere nicht. Massendaten ließen sich in dieser Form nicht analysieren. Mit 30 Patienten ginge das noch, aber bei 300.000 Datensätzen nicht.
Nur relativ wenige Identifikatoren sind Semler zufolge in der Fläche verfügbar und geeignet. Dazu gehören die Krankenversichertennummer (KVNR), die Steuer-ID und die Sozialversicherungsnummer. Zwar sei die KVNR in vielen Bereichen des Gesundheitswesens geeignet, aber nicht überall. Die Kassenärztliche Bundesvereinigung begrüßt in ihrer Stellungnahme den Einsatz der KVNR. Anders sieht es jedoch der IT-Sicherheitsrechtler Prof. Dennis-Kenji Kipker, der die Einführung einer Forschungskennziffer grundsätzlich begrüßenswert findet: Das greife aus seiner Sicht allerdings zu kurz, „solange sie nicht wirklich sektorübergreifend angelegt ist und Datenverknüpfungen etwa für Präventions- oder Pandemieforschung ermöglicht“. Zukünftig wird es immer relevanter, wie sich die Arbeitsfähigkeit der Bevölkerung entwickelt, ob Reha-Maßnahmen und Präventionsmaßnahmen wirken. „Dann sind Sie ganz schnell bei Datenbeständen, die Sie dringend brauchen, die aber keine KVNR halten“, so Semler.
Technische Umsetzung
Wie eine Forschungskennziffer technisch umgesetzt werden könnte, ist nicht trivial zu beantworten. Im Medizinregistergesetz (§ 20 Abs. 1 MRG) dürfen qualifizierte Register „den unveränderbaren Teil der Krankenversicherungsnummer nach § 290 Absatz 1 Satz 2 des Fünften Buches Sozialgesetzbuch zur Erzeugung eines Pseudonyms für die Verknüpfung mit anderen Datenquellen verarbeiten“. Das GeDIG regelt in § 3 GDNG die Forschungskennziffer ebenfalls auf Basis der KVNR. Das Forschungsdatengesetz des BMFTR hingegen setzt auf die Steuer-ID.
Alle datenführenden Stellen erhalten einen Algorithmus, der aus einem vorhandenen „Primäridentifikator“, etwa der KV-Nummer, ein Pseudonym generiert. Semler beschreibt das Modell als technisch grundsätzlich gangbar – mit Schwächen vor allem bei Skalierbarkeit und Updatefähigkeit. „Es ist durchaus denkbar, das so zu machen, wie es im GeDIG steht: Dass ich einen Identifikator habe, aus dem heraus ich eine solche ID generiere.“ Dann werde die ID an alle datenhaltenden Stellen verteilt. Dabei sei jedoch problematisch, dass das Verfahren überholt werden könne und dann nicht mehr sicher sei und dann in Abstimmung aller datenhaltenden Stellen ein neues Verfahren eingeführt werden müsse.
Bei einer weiteren Möglichkeit empfange eine Einrichtung auf Anfrage verschiedene Identifikatoren, generiere daraus ein anlassbezogenes Pseudon…
Read the full article at heise online →