Relevanz Generativer Künstlicher Intelligenz in der Robotik
Automatisierungslösungen und Roboter werden seit vielen Jahren erfolgreich für klar definierte Aufgaben in strukturierten Umgebungen eingesetzt. In unstrukturierten Szenarien oder bei der Interaktion mit vielfältigen Objekten und Menschen stoßen klassische Systeme jedoch an ihre Grenzen. Die zugrunde liegenden Algorithmen und KI-Modelle sind meist für spezifische Aufgaben ausgelegt und können nicht auf unbekannte Situationen und Objekte generalisieren.
Generative KI-Modelle wie Large Language Models (LLMs) und Vision Language Models (VLMs) erweitern klassische KI-Algorithmen um die Fähigkeit zur Generalisierung. Diese sogenannten Foundation-Modelle (deutsch: Basismodelle) sind auf riesigen Datenmengen aus dem Internet trainiert und in der Lage, aus dem Gelernten neue Inhalte wie Texte oder Bilder zu erzeugen. Dadurch erhalten Roboter ein umfassendes Verständnis ihrer Umgebung und können darauf basierend gezielt Aktionen planen.
Durch den Aufbau von Agentensystemen entwickeln wir intelligente Werkzeuge, die sowohl das Situationsverständnis als auch die Handlungsfähigkeit von Robotern verbessern. Während diese Modelle in virtuellen Anwendungen oft beeindruckende Ergebnisse liefern, stellt ihre Übertragung in die physische Welt – insbesondere in die Robotik sowie in spezialisierte Domänen wie Logistik und Intralogistik – eine besondere Herausforderung dar.
Wir bündeln interdisziplinäre Expertise aus Robotik, KI und Logistik und nutzen unsere Infrastruktur – vom Motion Capture im PACE Lab bis hin zu High-Performance-Compute-Clustern – zur erfolgreichen Integration und domänenspezifischen Anpassung der Modelle, einschließlich (Fine-)Tuning. So verbinden wir neueste Forschungstrends mit konkreten industriellen Anforderungen.