EnTrust
Data Science ist ein interdisziplinäres Gebiet, das wissenschaftliche Methoden, Prozesse, Algorithmen und Systeme verwendet, um Wissen aus und Einsichten in Daten zu gewinnen, die in unterschiedlichen Formaten vorliegen. Aufgrund der gewonnenen Resultate werden zahlreiche wichtige Entscheidungen getroffen, die den einzelnen oder die Gesellschaft als Ganzes betreffen: Diagnosen, Therapien, Kreditentscheidungen, Raumplanungen, etc. Andererseits ist Data Science charakterisiert durch die iterative und empirisch-heuristische Vorgehensweise, mittels derer Wissen extrahiert und
Entscheidungen abgeleitet werden. Was typischerweise zu kurz kommt, ist eine systematische, ingenieurorientierte Vorgehensweise, die Aussagen über die Qualität der Datenanalyse erlaubt. Für Data Science und daraus entstehende datenintensive Software fehlt ein entsprechendes Inventar an Methoden, Prozessen, Algorithmen und Systemen, die zur Korrektheit beitragen. Insbesondere lässt sich auch nicht ohne weiteres “korrektes Verhalten” eines datenintensiven Systems beschreiben, denn das Ergebnis ist nicht vorherbestimmt und soll erst durch den Datenanalyseprozess gewonnen werden. Das Ziel dieses Profilbereiches ist es, methodische Vorgehensweisen und formale Werkzeuge zu erforschen, die die ingenieurmäßigen Entwicklung korrekter – oder zumindest vertrauenswürdiger – datenintensiver Software unterstützen.