Benutzerspezifische Werkzeuge

01. März 2024

Verwendung von Metadaten-gesteuerten Ansätzen zur Datenharmonisierung im Medizinischen Bereich

Die Verwendung von sogenannten Real-World-Data in multizentrischen klinischen Studien wird immer wichtiger, wie beispielsweise die COVID-19-Pandemie gezeigt hat. Aufgrund des Ursprungs der Daten aus verschiedenen Krankenhausinformationssystemen liegen die Daten heterogen vor, was jedoch standortübergreifende Analyse erschwert. Durch die Harmonisierung heterogener Daten in standardisierten Datenmodellen, wie z.B. Observational Medical Outcomes Partnership (OMOP) Common Data Model (CDM) , wird nicht nur deren semantische, sondern auch syntaktische Interoperabilität hergestellt. Solche Harmonisierungen sind jedoch mit hohen Zeitaufwänden verbunden. Die Verwendung eines standardisierten Datenaustauschformats wie FHIR kann die Komplexität reduzieren, zeigt aber Herausforderungen auf nationaler und internationaler Ebene, die zu erhöhtem Implementierungsaufwand und geringerer Wartbarkeit führen. Um diese Schwierigkeiten zu überwinden, können Metadaten-getriebenen (MDD) Ansätzen zur Datenharmonisierung (Extract-Transform-Load, ETL Prozess) verwendet werden.

Um einen Überblick über die Arten von MDD Ansätzen und deren Anwendung in verschiedenen thematischen Kategorien zu erhalten, wurde ein Scoping Review durchgeführt. Die Ergebnisse des Scoping Reviews sollten dabei helfen, einen MDD Ansatz zu identifizieren, um die Datenübertragung von FHIR zu OMOP CDM zu generalisieren.

Die Ergebnisse des Scoping Reviews verdeutlichten, dass MDD Ansätze aus der Kategorien Medizin, Data Warehouse, Big Data, Industrie, Geoinformatik, Archäologie und Militär stammten. Ontologie- und regelbasierte Ansätze waren dabei am häufigsten vertreten. Der Einsatz von MDD Ansätzen zielte hauptsächlich auf die Entwicklung von ETL Prozessen ab, wobei deren Automatisierung, die Generierung generischer ETL Prozesse und die Entwicklung neuer ETL Prozesse ohne weitere technische Spezifikationen als Hauptziele genannt wurden. Für die Umsetzung der MDD Ansätze wurden verschiedene Werkzeuge verwendet, darunter Protégé und OntoEdit für ontologiebasierte Ansätze.

Die Ergebnisse zeigten, dass MDD Ansätze bereits erfolgreich in verschiedenen Anwendungsbereichen zur Verbesserung von ETL Prozess eingesetzt wurden. Daher ist die Verwendung von MDD-Ansätzen bei der Entwicklung eines generischen ETL Prozesses von FHIR nach OMOP CDM vielversprechend. Auf diese Weise kann die semantische und syntaktische Interoperabilität von Gesundheitsdaten für die nationale und internationale Forschung sichergestellt werden.

 https://medinform.jmir.org/2024/1/e52967