Immer komplexere Prozesse stellen viele Unternehmen vor Herausforderungen. Um diese zu bewältigen und erfolgreich zu sein, sind assistierende Informationstechnologien von großer Bedeutung. Die Benutzerschnittstelle muss den steigenden Anforderungen entsprechen und auf die Anwender zugeschnitten sein. Dies ist oft mit hohen Kosten und Aufwänden verbunden ist. Moderne Sprachinteraktionsschnittstellen bieten Vorteile gegenüber grafischen Interfaces, da sie einen direkten Zugriff auf komplexe Funktionen ermöglichen. So wird die kognitive Belastung durch die Verwendung natürlicher Sprache reduziert.
Das Projekt AI-Consult entwickelt ein System, das einen intuitiven Zugriff auf kontextabhängige Informationen bietet. Durch eine natürliche und niederschwellige Kommunikation in Kombination mit optischen Erkennungsverfahren soll ein multifunktionaler 2D/3D-Scanner versierten Anwendern einen direkten und berührungslosen Zugriff auf einen großen Funktionsumfang ermöglichen. Die Kommunikation zwischen Mensch und System erfolgt über eine multimodale Schnittstelle. Diese fusioniert die Erfassung und Ausgabe natürlicher Sprache, die graphische Darstellung von Daten sowie die dreidimensionale Repräsentation des Gesprächspartners. Zur Sicherstellung des Datenschutzes sollen personenbezogene Bild- und Sprachdaten durch eine integrierte Recheneinheit bearbeitet werden.
Zunächst werden die Systemanforderungen anhand von Anwendungsszenarien in der Logistik und Baubranche ermittelt. Diese unterscheiden sich hinsichtlich der Erfahrenheit der Anwender, Komplexität der Prozesse sowie Umgebungsbedingungen. Eine Nutzerstudie evaluiert die Anwendbarkeit des Gesamtsystems. Die hardware- und softwareseitige Entwicklung setzt sich aus der Entwicklung verschiedener KI-Modelle und der Erstellung von Tools für das Management der Trainingsdaten zusammen. Die Trainingsdaten werden durch eine Datenaufnahmekampagne erweitert und das System auf die Anwendungsszenarios angepasst.