SCaDS. AI - "Center for Scalable Data Analytics and Artificial Intelligence"
Projektlaufzeit:
01.05.2021 - 30.09.2025
Projektinhalt:
SCaDS.AI - das "Center for Scalable Data Analytics and Artificial Intelligence" -Zentrum für skalierbare Datenanalyse und Künstliche Intelligenz - wurde als nationaler Kompetenzknotenpunkt für KI-Forschung, Big Data sowie für die Entwicklung fortschrittlicher KI-Methoden und Verfahren zur effizienten Nutzung von Massendaten ausgebaut. Das ZMI ist in einem Leuchtturmprojekt des Zentrums involviert, das unter dem Titel "Generation and evaluation of tabular data in medicine" firmiert und ganz jenem Titel folgend die Erzeugung synthetischer Daten aus tabellarischen Datensätzen ins Auge fasst.
Trotz seiner hohen Bedeutung für die medizinische Forschung ist der Fortschritt des Maschinellen Lernens (ML) innerhalb der Medizin nicht so weit vorangeschritten wie es wünschenswert wäre. Eine wesentliche Einschränkung für die meisten Anwendungen ist die Spärlichkeit und Knappheit der verfügbaren Datensätze im Gesundheitswesen. Obwohl die Digitalisierung weiter voranschreitet und immer mehr Daten in der klinischen Routine gesammelt werden, können diese nicht ohne Anonymisierung frei geteilt werden, hinzu kommen Sicherheitsangriffe und Datenschutzprobleme.
Rolle der Hochschulmedizin Dresden
An dieser neuralgischen Stelle setzen die an der Hochschulmedizin Dresden involvierten Wissenschaftler*innen an: Eine vielversprechende Lösung zur Abschwächung des Risikos von Datenschutzverletzungen ist die Generierung synthetischer Daten, die anstelle von oder zusätzlich zu realen Daten verwendet werden können. Da es in vollsynthetischen Daten keine Eins-zu-Eins-Zuordnungen zu realen Datenpunkten gibt, wird die Identifizierung der realen Datenpunkte sehr unwahrscheinlich. Ein weiterer Vorteil synthetischer Daten ist, dass sie nicht auf die ursprünglichen Eigenschaften der Datensätze beschränkt sind. Dies ist insbesondere für medizinische Fälle wichtig, in denen nur wenige Daten zur Verfügung stehen - etwa bei seltenen Erkrankungen oder seltenen Tumoren.
Die synthetische Erzeugung von Bildern wird bereits häufig angewandt. Da die meisten Gesundheitsdaten jedoch in Tabellenform gespeichert sind, wird sich dieses Projekt hauptsächlich auf diese Art von tabellarischen Daten konzentrieren, um die Anwendung dieser fortgeschrittenen KI-gestützten Methoden in der Medizin zu erleichtern und die Auswertung dieser Datensätze zu untersuchen. Das Projekt zielt darauf ab, die Erzeugung und Anwendung synthetischer Daten im klinischen Umfeld und darüber hinaus zu verbessern und bestehende Methoden zur Generierung und Auswertung von Tabellendaten zu identifizieren, neue zu entwickeln und beide zu optimieren.
Ansprechpartner*innen:
Finanzierung:
Die Finanzierung erfolgt aus Mitteln des Bundesministeriums für Bildung und Forschung (BMBF).
Förderkennzeichen: SCADS22B