Projekt »PrivacyUmbrella«

PrivacyUmbrella: Anonymisierung medizinischer Daten

© stock.adobe.com, Rumi X
Für eine Datenauswertung im Sinne der personalisierten Medizin müssen Patientendaten einerseits geschützt werden und gleichzeitig müssen die gemeinsam genutzten Daten informativ genug sein.

Gesundheitsdaten werden immer detaillierter und für mehrere Parteien zugänglich und damit auch anfällig für Angriffe auf die Privatsphäre einzelner Patienten. Anonymisierungsverfahren können die Privatsphäre so schützen, dass es nicht mehr möglich ist, einzelne Personen in Datensätzen zu identifizieren. Die Herausforderung besteht jedoch nicht nur darin, den Datenschutz zu wahren, sondern auch sicherzustellen, dass die gemeinsam genutzten Daten informativ genug sind, um für eine Datenauswertung im Sinne der personalisierten Medizin nützlich zu sein – und auch um maschinelles Lernen im großen Maßstab zu ermöglichen.

In dem Projekt PrivacyUmbrella wollen Forschende am Fraunhofer ITEM in Zusammenarbeit mit den Universitätskliniken Frankfurt und Mainz sowie der MCS Datalabs GmbH durch die Kombination verschiedener etablierter Techniken stärkere Anonymisierungsgarantien ermöglichen und gleichzeitig den Nutzen für die Datenanalyse maximieren. Gefördert wird das Projekt vom BMBF und mit Mitteln des NextGenerationEU-Projekts.

PrivacyUmbrella umfasst die folgenden Komponenten:

Mobile Gesundheit

Das Konzept der »intelligenten Gesundheit« – und damit die kontinuierliche Überwachung der persönlichen Gesundheit – ist für viele Menschen zu einem wesentlichen Bestandteil des modernen Lebens geworden. Die neuen Anonymisierungsverfahren wahren den Nutzen medizinischer Daten für die Analyse und befähigen Patienten, ihre Daten für die medizinische Forschung über mobile Geräte bereitwillig zu teilen.

Standardisierte medizinische Datenformate

Die Forschenden adressieren ebenso den Mangel an Standardisierung bei Anonymisierungsanwendungen, indem sie Verbindungen zu medizinischen Datenintegrationsbemühungen herstellen, die Datenformate wie »Fast Healthcare Interoperability Resources« (FHIR) umfassen, die von Health Level Seven International (HL7) mit einer offenen CC0-Lizenz unterstützt werden.

Datennutzen

Bei der Festlegung des Verallgemeinerungsgrads für identifizierende Informationen muss ein Gleichgewicht zwischen Datenschutz und Datennutzen gefunden werden. Die Suche nach einem geeigneten Generalisierungsgrad für die Identifizierung von Informationen in den Daten ist jedoch von Natur aus schwierig. Diese Komplexität ergibt sich aus der Konstruktion hierarchischer Verallgemeinerungsbäume, was zu einem großen Suchraum führt, der optimale Kombinationen verallgemeinerter Identifikatoren über verschiedene Bäume mit unterschiedlichen Verallgemeinerungsgraden umfasst.

Föderiertes Lernen und Datenschutzmetriken

Formale Datenschutzmetriken spielen eine entscheidende Rolle bei der Beurteilung und Bewertung der Wirksamkeit von Technologien zur Verringerung von Datenschutzrisiken. »Differential Privacy« ist ein mathematischer Rahmen, der es ermöglicht, die Privatsphäre eines Systems zu gewährleisten und zu quantifizieren. Die Forschenden setzen das »Federated-Learning-Framework Flower« (Das, P. P. et al., 2023: DOI 10.1007/978-3-031-49187-0_2) für die Ausführung auf dem Gerät ein und reduzieren dadurch Bandbreite, Energie und Kosten.

Das Konsortium

Das interdisziplinäre Projekt-Konsortium unter Leitung des Fraunhofer ITEM kann auf langjährige Erfahrungen im Bereich der sicheren und datenschutzkonformen Auswertung medizinischer Daten zurückblicken. Hier finden Sie einen Überblick über entsprechende Vorarbeiten sowie die notwendige Infrastruktur zur sicheren Speicherung und Auswertung von personenbezogenen Daten.

Vorarbeiten am Fraunhofer ITEM

  • Lena Wiese, Tim Waage and Michael Brenner. CloudDBGuard: A Framework for encrypted data storage in NoSQL Wide Column Stores. Data and Knowledge Engineering. Elsevier, 2020.
  • Ferdinand Bollwein and Lena Wiese. Keeping Secrets by Separation of Duties while Minimizing the Amount of Cloud Servers. Transactions on Large-scale Data and Knowledge-Centered Systems. Springer, 2018
  • Ferdinand Bollwein and Lena Wiese. On the Hardness of Separation of Duties Problems for Cloud Databases. TrustBus. Springer, 2018.
  • Ferdinand Bollwein, Lena Wiese. Closeness Constraints for Separation of Duties in Cloud Databases as an Optimization Problem. BICOD 2017: 133-145. Springer, 2017. 

Vorarbeiten der Universitätsmedizin Mainz

  • MIRACUM: Das Projekt vereint zehn Universitätskliniken, zwei Hochschulen und einen Industriepartner aus sieben deutschen Bundesländern.
  • Mainzelliste: Web-basierter Dienst zur Pseudonymerstellung, treuhänderischen Speicherung der Identitätsdaten und Record Linkage. 
  • Riegel J, Ben Amor M, Brenner T, Drepper J, Franke M, Grün M, Hamacher K, Hund H, Knopp C, Kussel T, Lemmer M, Parciak M, Rahm E, Rohde F, Sax U, Schepers J, Sehili Z, Suhr M, Panholzer T, Lablans M. Chancen von Open-Source-Software am Beispiel der Pseudonymisierungslösung "Mainzelliste". 2021 doi: 10.3205/20gmds204
  • Lablans, M., Borg, A., Ückert, F. A RESTful interface to pseudonymization services in modern web applications. BMC medical informatics and decision making. 2015; 15(1), 1-10.

Vorarbeiten am Universitätsklinikum Frankfurt

  • Schaaf, J., Sedlmayr, M., Schaefer, J., & Storf, H. (2020). Diagnosis of Rare Diseases: a scoping review of clinical decision support systems. Orphanet journal of rare diseases, 15(1), 1-14.
  • Storf, H., Stausberg, J., Kindle, G., Quadder, B., Schlangen, M., Walter, M. C., ... & Wagner, T. O. (2020). Patient registries for rare diseases in Germany: Concept paper of the NAMSE strategy group. Bundesgesundheitsblatt, Gesundheitsforschung, Gesundheitsschutz, 63(6), 761-770.
  • Storf, H., Schaaf, J., Kadioglu, D., Göbel, J., Wagner, T. O., & Ückert, F. (2017). Register für seltene Erkrankungen. Bundesgesundheitsblatt-Gesundheitsforschung-Gesundheitsschutz, 60(5), 523-531.

Vorarbeiten von MCS Datalabs

  • ONCORELIEF 
  • DECIDE 
  • Scherrer A, Zimmermann T, Riedel S, Mousa F, Wasswa-Musisi I, Zifrid R, Tillil. H, Ulrich P, Kosmidis T, Reis J, Oestreicher G, Möhler M, Kalamaras I, Votis K, Venios S, Plakia M, Diamanopoulos S. (2022). Digitally assisted planning and monitoring of supportive recommendations in cancer patients. In: Maglogiannis I, Iliadis L, Macintyre J, Cortez P (eds). Artificial Intelligence Appliations and Innovations. AIAI 2022 IFIP WG 12.5 International Workshops. AIAI 2022. IFIP Advances in Information and Communication Technology, vol 652. Springer, Cham, pp 401-411. DOI: 10.1007/978-3-031-08341-9_32

Ihre Ansprechpartnerin am Fraunhofer ITEM

Lena Wiese

Contact Press / Media

Prof. Dr. Lena Wiese

Arbeitsgruppenleiterin Bioinformatik & Leiterin der Attract-Gruppe IDA

Telefon +49 511 5350-303