Sind Daten der Krebsregister für wissenschaftliche Projekte in der Onkologie sinnvoll nutzbar und werden Krebsregisterdaten in Deutschland für Forschung genutzt? Welche prinzipiellen Nutzungsmöglichkeiten gibt es? Und welche Rahmenbedingungen sollten nachgebessert werden, um Krebsregisterdaten wissenschaftlich besser nutzen zu können? Diese Fragen werden im Folgenden beantwortet und diskutiert.
Aufgaben der Register
Landeskrebsregister haben originäre, gesetzliche Aufgaben im Bereich der öffentlichen Gesundheit, wie die Ermittlung der Krankheitslast an Krebs, Trends, Untersuchung verdächtiger Häufungen, Bewertung von Primärprävention und Früherkennung und in der Qualitätssicherung der onkologischen Versorgung von Patientinnen und Patienten [
1‐
3]. Diese Aufgaben erfüllen die Register in einigen Bereichen schon seit vielen Jahren, z. T. seit Jahrzehnten, zuverlässig und in hoher Qualität. Damit ist Potenzial der Registerdaten aber noch nicht ausgeschöpft [
4]. Die Forschung mit den Daten durch die Krebsregister selbst und die Bereitstellung der Daten und methodischer Expertise für Forschungsprojekte Dritter sind weitere wesentliche Aufgaben der Register [
5]. Die Bereitstellung der mit großem Aufwand und öffentlichen Mitteln erhobenen Daten für eine wissenschaftliche Nutzung ist nicht nur in Bundes- und Landesgesetzen gesetzlich verankert, sondern auch ethisch geboten. Viele Forschungsfragen lassen sich entweder ausschließlich mit Krebsregisterdaten beantworten, oder Krebsregisterdaten bieten erhebliche Vorteile.
Da es sich um eine Vollerhebung handelt, entfällt das Problem der Stichprobenrepräsentativität
Da es sich um eine Vollerhebung handelt, entfällt das Problem der Stichprobenrepräsentativität. Die Daten sind bevölkerungsbezogen, repräsentativ und über lange Zeiträume vorhanden. Auch seltene Krebserkrankungen, seltene Patientengruppen oder seltene Ereignisse (z. B. Therapien) lassen sich sinnvoll beforschen. Der – neben der Lebensqualität – wichtigste Endpunkt in der Onkologie, das Versterben, wird systematisch und zeitnah erhoben.
Es muss aber berücksichtigt werden, dass Krebsregister keine forschungsgetriebenen Register sind, sondern für die Erfüllung definierter gesetzlicher Aufgaben eingerichtet wurden und dazu einen zwar klar definierten und konsentierten, aber relativ starren Datensatz nutzen. Das hat Implikationen für die wissenschaftliche Nutzung. Die Tiefe der Daten ist häufig nicht so hoch oder nicht so exakt, wie es in einer eigens geplanten Studie mit spezifischen Instrumenten möglich wäre. Eine weitere Limitation der Krebsregisterdaten ist, dass die Daten der an Krebs erkrankten Personen i. d. R. mit Meldepflicht, meist ohne (komplettes) Widerspruchsrecht und damit unter Einschränkung des Grundrechts auf informationelle Selbstbestimmung erhoben werden, womit die Daten wesentlich strengeren datenschutzrechtlichen Restriktionen unterliegen. Dies ist ein fundamentaler Unterschied zur klinischen Forschung am Menschen, die eine informierte Entscheidung zur Teilnahme und Datennutzung erfordert. Dieser Punkt kann die Nutzung von Registerdaten erschweren oder sogar einschränken.
Sind Daten der Krebsregister unter diesen Prämissen überhaupt für wissenschaftliche Projekte in der Onkologie sinnvoll nutzbar und wurden bzw. werden Krebsregisterdaten in Deutschland für Forschung genutzt? Welche prinzipiellen Nutzungsmöglichkeiten gibt es? Und welche Rahmenbedingungen sollten nachgebessert werden, um Krebsregisterdaten wissenschaftlich besser nutzen zu können? Diese Fragen werden im Folgenden beantwortet und diskutiert.
Diskussion
Zunächst wurde gezeigt, dass Krebsregisterdaten in Deutschland bereits intensiv für die onkologische Forschung genutzt werden. Die Nutzungsfrequenz (etwa 250 Publikationen pro Jahr) hat sich in den letzten Jahren deutlich gesteigert. Die Gründe für die stärkere Nutzung von deutschen Krebsregisterdaten sind vielfältig. Die Flächendeckung mit bevölkerungsbezogenen Krebsregister ist immer weiter angestiegen und deckt seit 2009 alle Bundesländer ab. Mit dem Bundeskrebsregisterdatengesetz [
17] konnten ab 2009 alle epidemiologischen Daten der Krebsregister am Zentrum für Krebsregisterdaten zentralisiert werden, was die Beantragung von Datensätzen für ganz Deutschland deutlich erleichtert hat und gut mit dem Anstieg von Krebsregister-Publikationen in Deutschland übereinstimmt. Durch die Einführung einer bundesweiten zusätzlichen klinischen Krebsregistrierung ab dem Jahr 2013 [
3] wurde die Attraktivität der Krebsregisterdaten für Forschung weiter gesteigert. Ab 2023 ist ein großer Teil der neuen klinischen Daten auch über das Zentrum für Krebsregisterdaten verfügbar.
Insofern ist abzusehen, dass die Nutzung von Krebsregisterdaten sich weiter positiv entwickeln wird. Trotzdem ist aber festzuhalten, dass die Nutzung der deutschen Krebsregisterdaten noch nicht den Grad erreicht hat wie bei den ähnlichen Daten aus dem US-SEER-Programm [
9]. Das hat sicherlich mit der längeren Verfügbarkeit kompletter klinischer Daten und der Bekanntheit des SEER-Programms zu tun.
Weiter ist festzustellen, dass in den verschiedenen Krebsregistergesetzen der Länder Grundlagen für die wissenschaftliche Nutzung von Krebsregisterdaten gelegt wurden. Dazu gehören auch die Möglichkeit, aus dem Registerbestand bestimmte Patientengruppen zu identifizieren (z. B. bestimmte Diagnosen, bestimmtes Alter, mit bestimmten Therapien oder mit einem bestimmten Folgeereignis) und diese direkt zu kontaktieren oder bereits bestehende Forschungskohorten mit dem Krebsregister abzugleichen. Praxisbeispiele zeigen, dass diese Forschungsmöglichkeiten auch genutzt werden. Die deutsche Gesundheitsstudie (NAKO, ehemals Nationale Kohorte, [
18]) mit über 200.000 eingeschlossenen Personen nutzt beispielsweise den Kohortenabgleich zur Identifikation von neuen Krebserkrankungen im Verlauf.
Es ist abzusehen, dass die Nutzung von Krebsregisterdaten sich weiter positiv entwickeln wird
Auch wenn die mit den Krebsregistern geschaffene Datenbasis und die Nutzungsmöglichkeiten bei kaum einem anderen Krankheitsbild vorhanden sind, gibt es weiteres Potenzial für eine effektivere und effizientere Forschungsnutzung. Dazu sind aber einige persistierende Problempunkte zu lösen:
Länderübergreifende Projekte, für welche der ZfKD Datensatz nicht ausreichend ist (das ZfKD erhält nur einen Teildatensatz aus den Landeskrebsregistern), sind äußerst aufwendig. Selbst eine einfache Datenstudie würde 15 separate und unterschiedliche Anträge (15, weil Berlin und Brandenburg ein gemeinsames Register betreiben) an die jeweiligen Landeskrebsregister bedeuten. Im Idealfall erhält man dann 15 verschiedene Bewilligungen (mit unterschiedlicher Bearbeitungsdauer und ggf. Auflagen) und 15 Einzeldatensätze. Bei komplexeren Studien, wie Patientenkontaktierungen oder Kohortenabgleichen, sind neben den Anträgen weitere landesspezifische Prüfungen (ggf. mit 15 Datenschutzbehörden, 15 Ministerien und 15 Ethikkommissionen) erforderlich. Werden die Projekte noch komplexer, z. B. bei einer
Verlinkung von Krebsregisterdaten mit anderen Daten (z. B. von Krankenkassen), ist der organisatorische Aufwand in diesem Setting einem annehmbaren Zeitrahmen kaum leistbar. Für solche Projekte wäre eine zentrale Struktur für die anlassbezogenen Datenzusammenführung wünschenswert, die zum einen ein vereinfachtes Antragswesen mit einem Antrag für alle Register beinhaltet, zum anderen die Einzeldatensätze der Register standardisiert zusammenführt und ggf. die Verlinkung mit anderen Datenbeständen organisiert. Im Gesetz zur Zusammenführung von Krebsregisterdaten (KRDaZuG) vom 18. August 2021 ist die Entwicklung einer solchen zentralisierten Struktur bis Ende 2024 bereits angedacht [
19]. Inzwischen befassen sich verschiedene Projekte mit der Entwicklung entsprechender Strukturen [
20‐
22].
Krebsregisterdaten werden ohne Einwilligung zur Nutzung für Forschung erhoben
Ungelöst, zumindest aber unklar ist die Abwägung von Datenschutz auf der einen Seite und der wissenschaftlichen Nutzbarkeit der Registerdaten auf der anderen Seite. Wie dargelegt, werden Krebsregisterdaten ohne Einwilligung zur Nutzung für Forschung erhoben. Das KRDaZuG sieht daher vor, dass nur anonymisierte Daten an die Forschenden herausgegeben werden. Dabei besteht das Problem, dass die komplexen Daten der Krebsregister auch nach Löschung eindeutiger Identifikatoren, wie Name, Adresse oder Krankenversicherungsnummer nicht als komplett anonym gelten. Durch personenbeziehbare Angaben im Datensatz (Alter, Geschlecht, Wohnort, Diagnose usw.) und Vorwissen besteht die theoretische Möglichkeit, einzelne Personen zu reidentifizieren. Ähnlich verhält es sich mit Studien, bei denen Daten der Krebsregister mit anderen Datenquellen (Krankenkassen, Biobanken usw.) auf Personenebene ohne vorliegende Einwilligung verknüpft werden sollen. Ohne personenidentifizierende Angaben werden solche Projekte kaum möglich sein, und die Problematik des Reidentifikationsrisikos dürfte hier noch präsenter sein. Dieser Zwiespalt zwischen der Notwendigkeit, diverse Datenquellen mit den Krebsregisterdaten zu verbinden, und den Datenschutzbelangen kann nicht allein von den Krebsregistern gelöst werden. Hier ist die Politik gefordert, einen geeigneten rechtlichen Rahmen vorzugeben.
Einige Maßnahmen mit dem Ziel, das Risiko einer Reidentifikation auf ein vertretbares Maß zu senken und gleichzeitig die Analysemöglichkeiten möglichst wenig einzuschränken, sind für Gesundheitsdaten, die ohne Einwilligung erhoben wurden, entweder bereits im Einsatz oder in der Erprobung. Dazu gehören die Beschränkung des Nutzerkreises (hier ist sicher zwischen öffentlich geförderten renommierten Forschungsinstituten, industriellen Einrichtungen oder Versicherungen zu unterscheiden), die Prüfung eines plausiblen wissenschaftlichen Interesses an den Daten, die strikte Prüfung des für eine Auswertung notwendigen Datenumfangs und der notwendigen Detailtiefe, v. a. von Schlüsselvariablen wie Alter und Wohnort, und Sanktionsmaßnahmen bei Bekanntwerden von Missbrauch bzw. fahrlässigem Umgang mit den Daten. Auch Verfahren wie das Verfremden („Verrauschen“) von Daten, die Bereitstellung von berechneten Variablen anstelle von Originaldaten (z. B. Alter statt Geburts- und Diagnosedatum) sowie die Erzeugung synthetischer Daten werden diskutiert. Bei dezentral vorliegenden Daten sind mittlerweile Methoden für „verteiltes Rechnen“ („federated learning“) entwickelt worden, die eine Auswertung ohne physische Zusammenführung der Daten erlauben.
Sollte für ein Forschungsprojekt keine angemessene Anonymisierung möglich sein, sieht schon das KRDaZuG die Bereitstellung von pseudonymisierten Daten in einer sicheren Verarbeitungsumgebung vor. Die kontrollierte Analyseumgebung geht v. a. auf die Bedenken von Datenschützenden bezüglich einer Erzeugung vielfacher Kopien der Originaldaten (bzw. Teildatensätzen) zu Forschungszwecken ein, die das Risiko durch Angriffe von außen oder das irrtümliche und fahrlässige Verbreiten von Daten erhöhen. Solche „sicheren Datenhäfen“ („data safe haven“) sind auch in den Entwürfen für einen Europäischen Gesundheitsdatenraum vorgesehen und werden derzeit im britischen Gesundheitssystem bereits etabliert [
23]. In Deutschland fehlen derzeit noch gesetzliche Vorgaben und die notwendige Infrastruktur für solche Umgebungen. Beim Forschungsdatenzentrum Gesundheit am BfArM [
24] wird seit einiger Zeit eine entsprechende Infrastruktur aufgebaut, die jedoch zunächst nur für die dort vorgehaltenen bundesweiten Abrechnungsdaten nach Datentransparenzverordnung nutzbar sein wird.
Das KRDaZuG verlangt für pseudonymisierte Daten eine kontrollierte Verarbeitungsumgebung
Für die Nutzung der Krebsregisterdaten ergibt sich ein Dilemma. Das KRDaZuG verlangt für pseudonymisierte Daten eine kontrollierte Verarbeitungsumgebung, die es aber nicht gibt und von der nicht absehbar ist, wann sie geschaffen sein wird.
Der Weg, Routinedaten wie die Krebsregisterdaten nur mit immer komplexeren Verfahren und Einschränkungen nutzen zu können, könnte sich leicht als Irrweg herausstellen. Wenn die Hürden aus Antragstellung und Datenzusammenführung so hoch werden, dass sie nicht zu finanzieren sind und Vorlaufzeiten vor der eigentlichen Forschung entstehen, die ein übliches Forschungsprojekt um Jahre übersteigt, ist abzusehen, dass die Daten nicht genutzt werden und aufwendig finanzierte Datenfriedhöfe entstehen. Ob das neue Gesundheitsdatennutzungsgesetz [
25] die Forschungsnutzung der Krebsregister, wie beabsichtigt, verbessern wird, ist offen.
Auch gilt es die Verhältnismäßigkeit der beschriebenen Maßnahmen zu hinterfragen. In über 50 Jahren weltweiter Forschung mit Krebsregisterdaten ist kein Fall bekannt, in dem Daten von Forschenden missbräuchlich verwendet wurden und Personen zu Schaden kamen. Bedenkt man die Fortschritte durch die intensive Forschungsnutzung der Krebsregisterdaten, die unbestreitbar auch Leben gerettet haben, wären mehr pragmatische Lösungen angezeigt, die auch auf Vertrauen und Verantwortung von Wissenschaft und Forschung setzen und dem öffentlichen Interesse an einer möglichst ungehinderten wissenschaftlichen Nutzung der aus öffentlichen Mitteln erhobenen Daten Rechnung tragen.
Hinweis des Verlags
Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.