Knowledge Graph basiertes Assistenzsystem zur Unterstützung der Datenanalyse für das Engineering Smarter Produkte

  • Durch die zunehmende Interdisziplinarität der Produkte und Trends wie digitale Zwillinge werden im Engineering-Kontext mehr Daten aus immer mehr Datenquellen genutzt. Gleichwohl fehlt den Nutzern häufig das Wissen welche Daten für ihre Aufgaben relevant sein könnten und wo diese abgespeichert sind. Aufbauend auf dieser Feststellung ergibt sich die Frage, wie man Abhilfe schaffen könnte durch die Nutzung von Technologien und einem neuen Konzept, welches die Anforderungen erfüllt, welche sich aus der initialen Recherche, Interviews mit Firmen und aus Forschungssicht ergeben. Eine potenzielle Lösungsmöglichkeit sind Metadaten-Repositories – Verzeichnisse, welche einen Überblick über vorhandene Daten bereitstellen und deren Vernetzung ermöglichen. Es zeigt sich weiterhin, dass bereits verschiedene Forschungsansätze verfolgt werden und es Lösungen gibt, welche von Firmen vermarktet werden, die allerdings häufig einen anderen Fokus haben und die hier beschriebenen Anforderungen nicht erfüllen (können). Deswegen wird in dieser Arbeit ein Konzept vorgeschlagen, welches auf Basis eines Metadaten-Repository neue Prozesse, Methoden und ein IT-Werkzeug zur besseren formalen Beschreibung der Datenbestände in Unternehmen beinhaltet. Methodisch wird ein Knowledge Graph erarbeitet, welcher auf einer abstrakten Ebene die in IT-Systemen gespeicherten, sowie im Metadaten-Repository repräsentiert Daten modelliert. Dies erweitert Metadaten-Repositories, welche nur über eine Modellierung der Daten ohne Abstrahierung verfügen. Anschließend wird ein Algorithmus genutzt, um Daten aus dem Knowledge-Graph und dem Metadaten-Repository auszuwerten, Ähnlichkeiten zu finden, diese einem Dateningenieur vorzuschlagen und Verbindungen zu ziehen. So entsteht ein semantisch angereichertes Datenmodell, welches eine abstrakte Sicht auf Engineering-Daten (den Knowledge Graph), als auch die IT-Sicht (das Metadaten-Repository) enthält und von Nutzern auf der Suche nach Daten ausgewertet werden kann. Der Lösungsbaustein des Algorithmus zur Ähnlichkeitssuche kombiniert verschiedenen Strategien und auch verschiedene Suchräume, deren Inhalte verglichen werden, um möglichst viele Übereinstimmungen zwischen den abstrahierten Datenobjekten und den vorhandenen Datentypen aus realen IT-Quellsystemen festzustellen. Auch kann basierend auf den Ergebnissen noch die Sensibilität des Algorithmus durch den Nutzer eingestellt werden, falls zu viele oder zu wenige Übereinstimmungen vorgeschlagen werden. Zur Realisierung dieses Ansatzes wurde auf Technologien zurückgegriffen, welche im Bereich des Semantic Web eingesetzt werden. Z.B. wurde eine server- und servicebasierte Architektur gewählt, Kommunikation über REST-Schnittstellen gewährleistet und mit einem Demonstrator auch prototypisch umgesetzt. Die Ergebnisse dieser Arbeit wurden anschließend mithilfe des Demonstrators und den erhobenen Anforderungen erfolgreich verifiziert und das Konzept in verschiedenen Interviews mit Forschenden erfolgreich validiert.
  • Due to the increasing interdisciplinarity of products and trends such as the digital twin, more data from more data sources is being used in the engineering context. Nevertheless, users often lack the knowledge of which data could be relevant for their tasks and where it is stored. Based on this observation, the question arises as to how this could be remedied using technologies and a new concept that fulfills the requirements resulting from initial research, interviews with companies and from a research perspective. One potential solution is metadata repositories - directories that provide an overview of existing data and enable them to be linked. It is also apparent that various research approaches are already being pursued and that there are solutions that are marketed by companies, although these often have a different focus and do not (or cannot) fulfill the requirements described here. For this reason, this paper proposes a concept based on a metadata repository that includes new processes, methods and an IT tool for better formal description of data stocks in companies. Methodologically, a knowledge graph is developed for this purpose, which models the data stored in the IT systems and represented in the metadata repository on an abstract level. This extends previous metadata repositories, which only have a model of the existing data without any abstraction. An algorithm is then used to evaluate data from the knowledge graph and the metadata repository, find similarities, suggest these to a data engineer and draw connections. This creates a semantically enriched data model that contains an abstract view of engineering data (the knowledge graph) as well as the IT view (the metadata repository) and can be evaluated by users searching for data. The solution module of the similarity search algorithm combines different strategies and different search spaces whose contents are compared in order to determine as many matches as possible between the abstracted data objects and the existing data types from real IT source systems. The sensitivity of the algorithm can also be adjusted by the user based on the results if too many or too few matches are suggested. Various semantic technologies, which are also used in the Semantic Web, were used to implement this approach. Among other things, a server- and service-based architecture was chosen, communication via REST interfaces was ensured and prototypically implemented with an IT demonstrator. The results of this work were then successfully verified using the demonstrator and the requirements collected, and the concept was also successfully validated in various interviews with researchers.

Download full text files

Export metadata

Additional Services

Search Google Scholar
Metadaten
Author:Andreas Eiden
URN:urn:nbn:de:hbz:386-kluedo-86573
DOI:https://doi.org/10.26204/KLUEDO/8657
Series (Serial Number):Berichte aus der virtuellen Produktentwicklung (2)
Advisor:Jens Christian Göbel
Document Type:Doctoral Thesis
Cumulative document:No
Language of publication:German
Date of Publication (online):2025/01/31
Year of first Publication:2025
Publishing Institution:Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau
Granting Institution:Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau
Acceptance Date of the Thesis:2024/09/06
Date of the Publication (Server):2025/02/03
Page Number:XI, 187
Faculties / Organisational entities:Kaiserslautern - Fachbereich Maschinenbau und Verfahrenstechnik
DDC-Cassification:6 Technik, Medizin, angewandte Wissenschaften / 620 Ingenieurwissenschaften und Maschinenbau
Licence (German):Creative Commons 4.0 - Namensnennung, nicht kommerziell, keine Bearbeitung (CC BY-NC-ND 4.0)