Úniky dat UK Biobank: Záznamy pacientů byly nalezeny online navzdory bezpečnostním opatřením

0

Důvěrná lékařská data z UK Biobank, rozsáhlého lékařského výzkumného projektu uchovávajícího záznamy 500 000 britských dobrovolníků, byla opakovaně vystavena online kvůli nedostatečným bezpečnostním opatřením. Průzkum The Guardian zjistil, že výzkumníci s povolením přístupu k datům neúmyslně publikovali soubory obsahující podrobné informace o pacientech na veřejných platformách, jako je GitHub.

Přestože tyto datové soubory postrádají přímé identifikátory, jako jsou jména a adresy, naprostý objem vystavených záznamů – včetně diagnóz, dat procedur a demografie – vyvolává vážné obavy o soukromí. Toto riziko je umocněno pokroky v oblasti umělé inteligence a agregace dat, které stále více usnadňují opětovnou identifikaci.

Rozsah problému

Od července do prosince 2025 vydala UK Biobank GitHubu 80 právních oznámení požadujících odstranění úniku dat, ale mnoho informací zůstává k dispozici. Jeden ze souborů dat obsahoval diagnózy více než 413 000 účastníků a také data narození a pohlaví. The Guardian testoval riziko poskytnutím minimálních osobních informací datovému vědci, který s vysokou mírou spolehlivosti porovnal anamnézu dobrovolníka s použitím pouze měsíce/roku narození a data operace.

“Už při jejím otevření mi běhal mráz po zádech… Bylo to velmi detailní a připadalo mi to jako hrubý zásah do soukromí, jen když jsem se na to podíval.” – Datový expert kontroluje uniklé soubory.

Reakce a kritika Biobank

UK Biobank hájí svou bezpečnost a tvrdí, že výzkumníkům nebyla poskytnuta žádná jména ani adresy. Generální ředitel profesor Sir Rory Collins říká, že nedošlo k žádné opětovné identifikaci. Odborníci však tvrdí, že tento postoj je nereálný vzhledem k tomu, jak snadno lze v digitálním věku kontrolovat data.

“Chápou tito lidé vůbec, že ​​existuje internet?” zeptal se profesor Felix Ritchie, ekonom ze Západoanglické univerzity. “Naznačovat, že mohou očekávat, že jejich dobrovolníci o sobě nikdy neprozradí žádné další informace, je naprosto nerozumné.”

Dr Luke Roche z Oxford Internet Institute poznamenává, že i dílčí údaje – jako jsou data narození a zranění – mohou stačit k určení jednotlivce. Jakmile jsou tyto záznamy identifikovány, mohou odhalit hluboce citlivé informace, včetně psychiatrických diagnóz nebo stavu HIV.

Kontroverze mezi výzkumem a soukromím

Úniky dat byly výsledkem politiky, která výzkumníkům umožňovala stahovat data přímo do jejich systémů do konce roku 2024, ve spojení s rostoucím tlakem na zveřejňování výzkumného kódu. Někteří výzkumníci do těchto stahování omylem zahrnuli datové sady Biobank. Biobanka zavedla další školení, ale připouští, že problém přetrvává.

Tato situace zdůrazňuje přirozené napětí mezi podporou výzkumu využívajícího velké soubory dat a ochranou soukromí lidí. Navzdory snaze Biobanky odstranit úniky dat zůstávají kopie archivovány online, což zpochybňuje možnost plné kontroly. Rozsah těchto úniků – stovky incidentů – naznačuje selhání systému spíše než izolované chyby.

Incident zdůrazňuje rostoucí výzvy zabezpečení dat v éře otevřené vědy a opětovné identifikace založené na umělé inteligenci. Navzdory hodnotě práce Biobanky tyto opakované úniky vyvolávají pochybnosti o tom, zda jsou současné záruky dostatečné k ochraně dat účastníků.