Wir erforschen und entwickeln umsetzbare innovative Lösungen an der Schnittstelle von Softwarearchitektur, Data Engineering, Machine Learning und synthetischer Datengenerierung.
Unsere Forschungsschwerpunkte im Detail:
Softwarearchitektur:
Der Forschungsschwerpunkt Softwarearchitektur beschäftigt sich mit der strukturierten Analyse, Gestaltung und Bewertung von Architekturen komplexer Softwaresysteme. Im Zentrum stehen dabei sowohl technologische und methodische Fragestellungen als auch konkrete Anwendungskontexte, in denen architektonische Entscheidungen besondere Herausforderungen mit sich bringen.
Auf methodischer Ebene untersuchen wir unter anderem Konzepte und Muster zur Modularisierung, Schnittstellengestaltung, Architekturbewertung und zum Umgang mit nicht-funktionalen Anforderungen. Technologisch liegt ein Schwerpunkt auf Architekturen für datengetriebene Systeme, einschließlich Fragen der Integration von Machine Learning-Komponenten, Datenflusssteuerung und technischen MLOps-Strategien.
Anwendungsseitig befassen wir uns mit Architekturfragen im Rahmen unternehmensweiter IT-Landschaften (Enterprise Architecture) sowie in domänenspezifischen Kontexten, etwa im Bereich Logistik, der öffentlichen Verwaltung oder datenintensiven Plattformen. Dabei interessieren uns insbesondere Situationen, in denen Komplexität, Veränderungsdynamik oder Interdisziplinarität besondere architektonische Sorgfalt erfordern.
Datengenerierung und Datensynthese:
Unser Forschungsschwerpunkt Datengenerierung und Datensynthese zielt darauf ab, realitätsnahe Datensätze automatisiert zu erzeugen, gezielt zu verdichten oder bedarfsorientiert zu reduzieren. Wir entwickeln regelbasierte Verfahren, mit denen strukturierte Datensätze auf Basis von Domain-Logiken und Geschäftsregeln simuliert werden können. Parallel dazu erforschen wir generative ML-Ansätze zur Synthese tabellarischer, relationaler und multimodaler Daten.
Ein zentrales Ziel ist es, KI- und Machine-Learning-Projekte auch bei begrenztem Zugang zu Originaldaten durch synthetische Daten zu unterstützen – etwa zur Robustheitssteigerung von Modellen oder zur Erzeugung vielfältiger Testdatensätze für die Softwareentwicklung. Unsere Methoden ermöglichen sowohl die realitätsnahe Abbildung statistischer Verteilungen (für ML-Use-Cases) als auch eine inhaltlich vielfältige Datenrepräsentation (wichtig für hochwertige Testszenarien). Auch der Ersatz sensibler Originaldaten durch synthetische Äquivalente zur Wahrung von Datenschutz und Privatsphäre ist Teil unseres Forschungsinteresses.
Technologisch arbeiten wir mit einem breiten Spektrum moderner generativer Modelle – darunter spezialisierte GANs, VAEs, Diffusionsmodelle und Transformer-Architekturen. Ergänzt werden diese durch Metriken zur Bewertung von Qualität, Konsistenz und Privatsphäre-Eigenschaften der generierten Daten. Unsere Ansätze finden Anwendung z. B. in der Testdatensynthese oder Predictive Maintenance und lassen sich flexibel auf weitere Domänen übertragen.