Data Science – cross-sectional topic

Die Untersuchung und Überwachung verschiedener Materialien und Systeme auf allen Ebenen, von der Skala einzelner Atome bis hin zur Ebene ganzer Städte, erzeugen riesige Datenmengen. Dies gilt umso mehr, als Digitalisierung, Steuerungs- und Datenerfassungssysteme sowie Simulationen die Datenmenge in der Industrie und im akademischen Bereich deutlich erhöhen. Gleichzeitig wächst die Komplexität der Daten durch eine Vielzahl unterschiedlicher Formate und Programmiersprachen. Die Handhabung und Interpretation dieser grossen Datenmengen stellt eine enorme Herausforderung dar. Gleichzeitig bietet sie den Forschenden der Empa einzigartige Möglichkeiten, mehr über die Materialien und Systeme zu erfahren. Das Querschnittsthema Datenwissenschaft umfasst somit alle Aspekte, die mit dem Umgang und der Interpretation grosser Datenmengen zusammenhängen.

/documents/20659/13105930/Data+Science+RFA+Sustainable+Built+1.png/640d3664-7421-43a1-8720-7bfad264acfc?t=1590408132620

Ziel dieses Querschnittsthemas ist es, Technologien zu entwickeln, um verfügbare Daten in wertvolle Informationen umzuwandeln und so ein umfassendes Verständnis zu gewinnen und neues Wissen daraus zu extrahieren. Hier kommen Methoden wie das maschinelle Lernen ins Spiel. Techniken des maschinellen Lernens sind dafür geeignet komplexe Systeme statistisch zu analysieren. Diese datengetriebenen Ansätze sind in der Lage, hochkomplexe, nichtlineare Muster in Daten unterschiedlicher Art und Herkunft zu finden und automatisch ein Modell zu erstellen, das zur Erkennung, Klassifizierung, Regression oder Prognose eingesetzt werden kann. Werkzeuge für das maschinelle Lernen, insbesondere das auf künstlichen neuronalen Netzen basierende "deep learning", stellen wichtige Voraussetzungen dafür dar, Materialwissenschaftler und Ingenieure in die Lage zu versetzen, die Entwicklung neuartiger Materialien, Prozesse und Techniken zu beschleunigen. Eines der Ziele dieser Ansätze im Bereich der Materialwissenschaft ist die Identifizierung und Quantifizierung wesentlicher Merkmale entlang der Prozess-Struktur-Eigenschafts-Leistungskette mit hohem Durchsatz.

Eine Voraussetzung für die Datenwissenschaft ist, dass Daten verfügbar und zugänglich sind. Daher sind Wege und Werkzeuge zur Datenverwaltung und zur leichten Zugänglichkeit von Daten eine weitere Aktivität dieses Querschnittsthemas. Dieser Aspekt umfasst Werkzeuge wie Plattformen zur Zusammenarbeit, Datenrepositorien sowie elektronische Labornotizbücher. Dies ist auch im Kontext der offenen Wissenschaft von hoher Relevanz.

Schliesslich gehören auch Simulations- und Modellierungsaktivitäten zu den wissenschaftlichen Kernaktivitäten dieses Querschnittsthemas. Datengetriebenes maschinelles Lernen und traditionelle konstitutive modellbasierte Simulationswerkzeuge können sich gegenseitig ergänzen. Solche hochgradig zuverlässige und effiziente Hybridmodellen können bei der Entwicklung neuer funktionaler Materialien sehr effizient sein. Darüber hinaus profitieren Modellierungs- und Simulationsansätze in hohem Masse von guten Datenmanagementansätzen, sowohl um die grossen Datenmengen, die sie produzieren, zu bewältigen, als auch um zuverlässige Daten für die Validierung verfügbar und zugänglich zu machen.

Dr. Sandra Galmarini

Dr. Sandra Galmarini
PhD Materials Science_ Atomistic Simulation of cementitious systems, EPFL

Telefon: +41 58 765 4066