Datenraum-übergreifende Mediation von Erkrankungsdaten für die KI-gestützte Forschung

TrustME verfolgt das Ziel, eine generische, nachhaltige und flexibel adaptierbare Infrastruktur zu konzipieren, die den Zugang zu und die Nutzung von sensiblen Gesundheitsdaten für die Forschung deutlich vereinfacht.

Mehr erfahren

Über das Projekt

Gesundheitsdaten zählen zu den zentralen Ressourcen der biomedizinischen Forschung. Insbesondere im Kontext datengetriebener Methoden und künstlicher Intelligenz (KI) gewinnen umfangreiche, institutionsübergreifende Datensätze aus klinischen Registern, Studien und Biobanken zunehmend an Bedeutung. Sie ermöglichen substanzielle Fortschritte in der Erkenntnisgewinnung und tragen maßgeblich zur Entwicklung innovativer diagnostischer und therapeutischer Ansätze bei. Gleichzeitig stellt die Zusammenführung und Nutzung dieser Daten höchste Anforderungen an Datenschutz, Datensicherheit sowie die Einhaltung regulatorischer Rahmenbedingungen.

Vor diesem Hintergrund adressiert TrustME den bestehenden Mangel an standardisierten, interoperablen und institutionsübergreifend adaptierbaren Lösungen. Derzeit führt dieser Mangel dazu, dass in neuen Forschungsprojekten erhebliche Ressourcen für die wiederholte Umsetzung regulatorischer und technischer Anforderungen aufgewendet werden müssen. TrustME setzt hier an und verfolgt das Ziel, eine generische, nachhaltige und flexibel adaptierbare Infrastruktur zu konzipieren, die den Zugang zu und die Nutzung von sensiblen Gesundheitsdaten für die Forschung deutlich vereinfacht.

Im Zentrum steht die Entwicklung eines übertragbaren Konzepts, das sowohl technische als auch organisatorische Prozesse integriert und dabei bestehende Infrastrukturen effizient nutzt. Die Validierung von Algorithmen erfolgt über eine spezialisierte Plattform, die eine automatisierte und datenschutzkonforme Ausführung ermöglicht, ohne dass der Algorithmusentwickler direkten Zugriff auf die sensiblen Rohdaten erhält. Diese Infrastruktur wird von EMPAIA International e. V. erstellt.

BMFTR Logo

Arbeitsablauf und Datenintegration

Der im Projekt entwickelte Arbeitsablauf bildet eine durchgängige Prozesskette von der Studienanfrage bis zur Bereitstellung validierter Ergebnisse ab.

  1. Ausgangspunkt ist eine Forschungsanfrage zur Identifikation geeigneter Fälle für eine Studie, die sowohl nationale als auch internationale Datenquellen einbeziehen kann.

  2. Über die Biobanken-Infrastruktur werden relevante Proben und zugehörige Daten identifiziert und an lokale Einrichtungen weitergeleitet.

  3. In den beteiligten Institutionen erfolgt die Prüfung der Einwilligungen (Consent) durch eine Datentreuhandstelle, um die rechtssichere Nutzung der Daten zu gewährleisten.

  4. Für Fälle mit gültigem Consent werden klinische Daten aus Datenintegrationszentren abgerufen und ggf. durch Informationen aus Krebsregistern angereichert.

  5. Parallel dazu wird die Bereitstellung histologischer Daten organisiert (ggf. erforderliche Digitalisierung wird über standardisierte Prozesse durchgeführt).

  6. Die zusammengeführten, pseudonymisierten Daten werden dann an die übergeordnete Forschungsinfrastruktur übermittelt.

  7. Abschließend erfolgt die Validierung des KI-Algorithmus auf den bereitgestellten Daten über eine gesicherte Plattform. Die Ergebnisse werden dem Algorithmusentwickler zur Verfügung gestellt, ohne dass ein Zugriff auf die zugrunde liegenden Daten erfolgt.

Use Case: KI-gestützte Diagnostik des nicht-kleinzelligen Lungenkarzinoms (NSCLC)

Die Konzeptentwicklung orientiert sich an einem konkreten Anwendungsszenario: der Validierung eines KI-Algorithmus zur Diagnostik des nicht-kleinzelligen Lungenkarzinom (NSCLC) mit PD-L1-Quantifizierung. Ziel ist es, die Generalisierbarkeit und Validität des Algorithmus unter realistischen Bedingungen zu evaluieren.

Die Validierung wurde mittels einer von EMPAIA entwickelten, semi-automatisierten Pipeline durchgeführt, die die Schritte Fallregistrierung, Gewebesegmentierung mit pathologischer Qualitätskontrolle, automatisierte Job-Ausführung sowie Ergebnisaggregation und statistische Analyse umfasst.

Beteiligte Partner

Das Projekt bringt führende Einrichtungen der biomedizinischen Forschung und Dateninfrastruktur zusammen, ergänzt durch europäische Forschungsinfrastrukturen zur Sicherstellung der Skalierbarkeit und internationalen Anschlussfähigkeit.

IMI

Institut für Medizinische Informatik der Charité - Universitätsmedizin Berlin

KKRBB

Klinisch-epidemiologisches Krebsregister Brandenburg-Berlin gGmbH

EMPAIA

EMPAIA International e. V.

ZeBanC

Zentrale Biobank Charité - Universitätsmedizin Berlin

DTHC

Datentreuhandstelle des BIH@Charité - Universitätsmedizin Berlin

BBMRI-ERIC

Europäische Biobanken­infrastruktur

Öffentlichkeitsarbeit

Beitrag und Ausblick

TrustME leistet einen wesentlichen Beitrag zur Standardisierung und Effizienzsteigerung im Umgang mit sensiblen Gesundheitsdaten in der Forschung. Durch die Entwicklung eines generischen, modularen Ansatzes werden bestehende Infrastrukturen miteinander verknüpft und Prozesse harmonisiert. Dies reduziert nicht nur den Implementierungsaufwand für zukünftige Projekte, sondern stärkt auch die Interoperabilität zwischen nationalen und internationalen Dateninitiativen.

Langfristig schafft TrustME die Grundlage für eine vertrauenswürdige, skalierbare und nachhaltige Nutzung von Gesundheitsdaten und damit für eine beschleunigte Translation wissenschaftlicher Erkenntnisse in die klinische Praxis.