Wie lässt sich Künstliche Intelligenz (KI) sinnvoll einsetzen, wenn nur wenige Daten zur Verfügung stehen? Mit dieser Frage beschäftigte sich das Innovationsprojekt „AI for Scarce Data – Maschinelles Lernen und Informationsfusion zur nachhaltigen Nutzung von Labor- und Kundendaten“ (AI4ScaDa), das nun erfolgreich abgeschlossen wurde. Ziel war es, praxistaugliche KI-Lösungen für datenarme Szenarien in der Industrie zu entwickeln. Insbesondere, um kleinen und mittleren Unternehmen (KMU) den Zugang zu KI zu erleichtern.
Die Ergebnisse sowie die konkreten Anwendungen bei den Projektpartnern sind im Abschlussbericht auf der it’s OWL Innovationsplattform veröffentlicht.
Erprobung in industriellen Anwendungsszenarien
Die Umsetzbarkeit der entwickelten Methoden wurde gemeinsam mit den Industriepartnern GEA, SU BIOTEC und Miele demonstriert. Die KI-Verfahren kamen dabei unter anderem bei der Optimierung von Pflanzenanzuchtprozessen, der maschinengestützten Entscheidungsfindung auf Basis von Expertenwissen sowie bei der Auswertung von Zeitreihen zur Zustandsüberwachung in Haushaltsgeräten zum Einsatz. In allen Fällen konnten KI-gestützte Verfahren konkrete Verbesserungen erzielen, ohne auf große Datenmengen angewiesen zu sein.
Abbildung 1: Ziele der Projektpartner SU BIOTEC, GEA und Miele im Projekt AI4ScaDa.
Ein modularer KI-Workflow für die Praxis
Im Projekt entstand zudem ein modularer Workflow, mit dem sich auch aus kleinen und heterogenen Datensätzen verlässliche und nachvollziehbare KI-Modelle erstellen lassen. Die plattformunabhängigen Komponenten sind leicht bedienbar und erfordern keine tiefgehenden Vorkenntnisse. Durch den gezielten Einsatz von Active Learning, Datenannotation und Informationsfusion konnten selbst unter Datenknappheit aussagekräftige Modelle entstehen, beispielsweise in Form transparenter Entscheidungsbäume.
Eine ausführliche Anleitung zum KI-Workflow ist ebenfalls auf der Innovationsplattform verfügbar: https://doi.org/10.5281/zenodo.15598391
Abbildung 2: Der Workflow zur Handhabung spärlicher Daten umfasst die 1) Versuchsplanung mit optimierten SLHDs, die 2) tabellarische Aufbereitung der Daten, die 3) Expertenbewertung, die 4) Analyse mittels Entscheidungsbaum (M5’, GUIDE), die iterative Modellverbesserung durch 5) Active Learning sowie die 6) Evaluation neuer Datenpunkte mit visualisierter Entscheidungsnachverfolgung.
Beteiligung vom inIT
Vom inIT war Julian Bültemeier, wissenschaftlicher Mitarbeiter der von Prof. Dr. Volker Lohweg geleiteten Arbeitsgruppe Diskrete Systeme, am Projekt beteiligt. Er wirkte insbesondere an der Entwicklung des modularen Workflows mit.
„Das Projekt war fachlich spannend und hat gezeigt, wie viel Potenzial auch in kleinen Datenmengen steckt. Es hat einmal mehr verdeutlicht, wie wichtig es ist, dass Forschung und Praxis Hand in Hand gehen. Die Zusammenarbeit mit den Partnern aus Industrie und Forschung war durchweg konstruktiv und wertschätzend – ein tolles Projekt!“, so Julian Bültemeier.
Dank an alle Projektbeteiligten!
Ein besonderer Dank gilt den Projektpartnern GEA, SU BIOTEC und Miele sowie der Hochschule Bielefeld für die erfolgreiche und vertrauensvolle Zusammenarbeit.
Wenig Daten, viel Erkenntnis
Weitere Informationen zum Projekt: https://its-owl.de/projekte/wenig-daten-viel-erkenntnis-entwicklung-von-ki-anwendungen-fuer-small-data-ai4scada/