Sensible medizinische Daten der UK Biobank, einem großen medizinischen Forschungsprojekt, das Aufzeichnungen von 500.000 britischen Freiwilligen speichert, wurden aufgrund unzureichender Sicherheitspraktiken wiederholt online offengelegt. Eine Guardian -Untersuchung ergab, dass Forscher, denen der Zugriff auf diese Daten gestattet wurde, versehentlich Dateien mit detaillierten Patienteninformationen auf öffentlichen Plattformen wie GitHub veröffentlicht haben.
Während diesen Datensätzen direkte Identifikatoren wie Namen und Adressen fehlen, wirft die schiere Menge der offengelegten Datensätze – darunter Krankenhausdiagnosen, Eingriffsdaten und demografische Details – ernsthafte Bedenken hinsichtlich des Datenschutzes auf. Das Risiko wird durch Fortschritte in der KI und Datenaggregation verstärkt, die eine erneute Identifizierung immer einfacher machen.
Das Ausmaß des Problems
Zwischen Juli und Dezember 2025 hat die UK Biobank 80 rechtliche Hinweise an GitHub herausgegeben, in denen sie die Entfernung geleakter Daten forderte, doch erhebliche Teile bleiben weiterhin zugänglich. Allein ein Datensatz enthielt Diagnosen von über 413.000 Teilnehmern sowie Geburtsdaten und Geschlecht. Der Guardian testete das Risiko, indem er einem Datenwissenschaftler nur minimale persönliche Informationen zur Verfügung stellte, der die Krankengeschichte eines Freiwilligen erfolgreich mit nahezu sicherer Sicherheit abgleichte, indem er nur seinen Geburtsmonat/-jahr und ein Operationsdatum verwendete.
„Es lief mir schon beim Öffnen ein Schauer über den Rücken … Es war sehr detailliert und schon beim bloßen Anblick fühlte es sich wie ein grober Eingriff in die Privatsphäre an.“ – Ein Datenexperte überprüft die durchgesickerten Dateien.
Antwort und Kritik der Biobank
Die UK Biobank verteidigt ihre Sicherheit und erklärt, dass den Forschern weder Namen noch Adressen mitgeteilt wurden. CEO Prof. Sir Rory Collins behauptet, es habe keine erneute Identifizierung stattgefunden. Experten halten diese Haltung jedoch für unrealistisch, da es im digitalen Zeitalter so einfach ist, Daten mit Querverweisen zu versehen.
„Wissen diese Leute, dass das Internet existiert?“ fragte Prof. Felix Ritchie, Wirtschaftswissenschaftler an der University of the West of England. „Die Vorstellung, dass sie sich darauf verlassen können, dass ihre Freiwilligen niemals andere Informationen über sich preisgeben, ist eine völlig unvernünftige Erwartung.“
Dr. Luc Rocher vom Oxford Internet Institute weist darauf hin, dass selbst Teildaten – wie Geburtsdaten und Verletzungsdaten – ausreichen können, um Personen genau zu bestimmen. Sobald diese Aufzeichnungen identifiziert sind, können sie äußerst sensible Informationen preisgeben, darunter psychiatrische Diagnosen oder den HIV-Status.
Die Spannung zwischen Forschung und Datenschutz
Die Leaks sind auf eine Richtlinie zurückzuführen, die es Forschern bis Ende 2024 erlaubt, Daten direkt auf ihre Systeme herunterzuladen, verbunden mit einem zunehmenden Druck, Forschungscode zu veröffentlichen. Einige Forscher haben versehentlich Biobank-Datensätze in diese Uploads aufgenommen. Biobank hat weitere Schulungen eingeführt, räumt jedoch ein, dass das Problem weiterhin besteht.
Die Situation verdeutlicht einen inhärenten Konflikt zwischen der Förderung der Forschung mit großen Datensätzen und dem Schutz der Privatsphäre des Einzelnen. Trotz der Bemühungen der Biobank, durchgesickerte Daten zu entfernen, bleiben Kopien online archiviert, sodass die Frage gestellt wird, ob eine vollständige Kontrolle möglich ist. Das Ausmaß dieser Lecks – Hunderte von Vorfällen – lässt auf systemische Ausfälle und nicht auf isolierte Fehler schließen.
Der Vorfall unterstreicht die wachsenden Herausforderungen der Datensicherheit im Zeitalter der offenen Wissenschaft und der KI-gesteuerten Re-Identifizierung. Obwohl die Arbeit der Biobank nach wie vor wertvoll ist, lassen diese wiederholten Verstöße Zweifel aufkommen, ob die derzeitigen Sicherheitsvorkehrungen ausreichen, um die Daten der Teilnehmer zu schützen.
