zum Hauptinhalt
Die Initiative ist Teil der Open-Data-Strategie der Bundesregierung (Symbolbild).

© dpa

Open Data in der Gesundheitsforschung: RKI öffnet seine „Daten-Silos“ für die Forschung

Das Potsdamer Unternehmen Data4Life hat eine digitale Plattform gebaut, mit der Wissenschaftler:innen RKI-Daten besser und schneller nutzen können.

Potsdam - Daten sind das Fundament der Forschung: Egal, ob es um die Wirksamkeit von Medikamenten geht, um die Ausbreitungsgeschwindigkeit von Krankheiten oder um die Gefährlichkeit neuer Viren – ohne entsprechende Daten aus der Praxis oder aus Studien können Wissenschaftler:innen zu all diesen Fragen keine Antworten geben.

Um der Forschung den Zugang zu Gesundheitsdaten zu erleichtern, hat das gemeinnützige Potsdamer Unternehmen Data4Life die digitale Plattform „MEx“ ins Leben gerufen: Die Abkürzung steht für „Metadata Exchange“ („Austausch von Metadaten“) und soll ab 2023 die Forschungsdaten des Robert Koch-Instituts (RKI) transparent abbilden und besser für andere Wissenschaftler:innen nutzbar machen.

Die Initiative ist Teil der Open-Data-Strategie der Bundesregierung und das erste gemeinsame Projekt von Data4Life und RKI, deren Teams MEx derzeit gemeinschaftlich umsetzen. Beide Institutionen hatten 2021 eine entsprechende Kooperation geschlossen.

Datenberge bislang zu selten wissenschaftlich genutzt

„Es geht bei dem Projekt um sämtliche Forschungsdaten und Forschungsaktivitäten am RKI, also beispielsweise die großen epidemiologischen Studien zur Gesundheit der Gesellschaft in Deutschland“, sagt Cornelius Remschmidt, Epidemiologe und medizinischer Leiter bei Data4Life, der selbst sieben Jahre lang am RKI tätig war. „Angenommen, eine Forscherin oder ein Forscher arbeitet an einem Projekt zu Affenpocken oder zur Wirksamkeit von Covid-19-Impfungen, dann kann er oder sie über MEx gezielt und tagesaktuell nach bestehenden Studien zu diesen Themen suchen und in Kontakt mit den zuständigen Wissenschaftlern treten“, so Remschmidt.

Cornelius Remschmidt, medizinischer Leiter bei Data4Life.
Cornelius Remschmidt, medizinischer Leiter bei Data4Life.

© promo 

Das RKI und viele andere Forschungseinrichtungen sitzen quasi auf riesigen Datenbergen, die bislang viel zu selten wissenschaftlich genutzt wurden. Nicht, weil es verboten gewesen wäre, sondern weil die Forscher:innen zum Teil gar nicht wussten, welche Daten überhaupt existieren, um nach ihnen fragen zu können. „Bisher gibt es keine Übersicht aller Forschungsaktivitäten am RKI“, sagt Remschmidt. Genau hier setzt die Plattform von Data4Life an: „Über MEx als Metadatenkatalog werden Angaben wie die Art der Studie, das Dateiformat des Datensatzes, der Forschungsbereich, etc. auffindbar“, sagt Remschmidt.

[Was ist los in Potsdam und Brandenburg? Die Potsdamer Neuesten Nachrichten informieren Sie direkt aus der Landeshauptstadt. Mit dem Newsletter Potsdam HEUTE sind Sie besonders nah dran. Hier geht's zur kostenlosen Bestellung.

Es sollen also nicht die Forschungsergebnisse selbst öffentlich zugänglich werden, sondern nur die Metadaten, also etwa die Kontextinformationen einer Studie. „Das ist vergleichbar mit einem Bibliothekskatalog, in dem nach Titel, Schlagworten, Autor und ISBN-Nummer gesucht werden kann, der Inhalt des Buchs aber selbst nicht einsehbar ist“, so Remschmidt. Nach ihrer Recherche bei MEx sollen die Wissenschaftler:innen gezielt Studien oder Forschungsdaten anfragen, für die sie sich interessieren.

Durch Wiederverwendung von Daten sollen neue Impulse entstehen

„Sekundärforschung“ nennt sich dieser Ansatz, also die Nachnutzung wissenschaftlicher Daten, die für vielfältige Analysen wertvoll sind, obwohl sie einst für ganz andere Forschungsfragen erhoben wurden. Das Ganze läuft dabei nach den sogenannten „FAIR“-Prinzipien ab: „Findability, Accessibility, Interoperability, Reuse“, also „Auffindbarkeit, Zugänglichkeit, Verknüpfbarkeit und Wiederverwendbarkeit“ der Daten. „Dadurch sollen Daten-Silos in der Forschungslandschaft abgebaut werden und neue Impulse durch die Wiederverwendung von Daten entstehen“, sagt Remschmidt. Auch solle dadurch ein Umdenken in der Gesundheitsforschung angestoßen werden.

Data4Life möchte daran mitwirken, dass große Datenschätze in Zukunft besser gehoben werden können – auch, damit sie maschinenlesbar gemacht werden können: „Das bedeutet, dass die große Datenbasis für Methoden der künstlichen Intelligenz aufbereitet wird“, sagt Remschmidt. Künstliche Intelligenzen sollen künftig also mit großen Datenmengen gefüttert werden können und der Forschung so neue Möglichkeiten eröffnen.

Plattform soll der Öffentlichkeit zugänglich gemacht werden

Aktuell befindet sich MEx in der internen Pilotphase: Nach dem Start Anfang 2023 soll die Plattform zunächst nur den Mitarbeiter:innen des RKI zur Verfügung stehen, danach soll sie öffentlich zugänglich sein. Data4Life möchte MEx in Zukunft auch anderen Wissenschaftseinrichtungen anbieten: „Auch in anderen Institutionen besteht zunehmendes Interesse an wissenschaftlicher Transparenz und der Bereitstellung erhobener Daten für eine wissenschaftliche Nachnutzung“, sagt Remschmidt. Um welche Institutionen es sich dabei handelt, wollte er noch nicht sagen, es liefen aber bereits Gespräche.

Die Kooperation mit dem RKI geht ursprünglich auf die Initiative von Hasso Plattner zurück, dessen Stiftung Data4Life finanziert. Das 2017 gegründete Unternehmen hat derzeit rund 100 Mitarbeiter:innen und verfügt über zwei weitere Standorte in Berlin und Singapur. Teil der Kooperation ist auch, dass Data4Life dem RKI sichere Server für die Speicherung seiner Daten zur Verfügung stellt.

Zur Startseite