Application of hybrid quantum machine learning for image processing in the NISQ era

  • Machine learning and artificial intelligence are pivotal pillars in the area of computer vision, especially object detection and classification. They support or replace conventional methods such as morphological operators or manual surveillance. These models, tailored and trained for various use cases, typically possess a vast number of trainable parameters to cover a wide range of scenarios. However, their sizes have reached a point where classical computers struggle to train them efficiently, both in terms of time and computational resources. Moreover, the data itself is becoming increasingly detailed and thus larger. In our case, we are dealing with 2D or 3D image data, specifically gray value images. One promising avenue to mitigate computational demands is quantum computing. With properties like superposition, entanglement, and other quantum mechanical properties, there exists a theoretical advantage over classical methods. In this doctoral thesis, we aim to investigate the practical utility of quantum hardware in several application scenarios. The first part of our study focuses on encoding classical image data into quantum states. To design quantum algorithms, we must first transform image information, represented as gray values, into quantum states. This step is crucial and a main part for the development of quantum algorithms. Image information is converted into quantum states through methods like basis encoding, amplitude encoding, or phase encoding. We contribute to this field by enhancing a phase encoding method called Flexible Representation of Quantum Images (FRQI). This contribution is included in our two papers [1, 2] and in Chapter 4 in this thesis. Our approach reduces the number of so called CXoperations and consequently the errors observed on current quantum hardware. We also evaluate the scalability in terms of feasibility and usability on existing hardware. We adapted our research for the following parts of the thesis based on the results of the first part. We can not encode and retrieve large images on current quantum devices. Either we simulate the quantum hardware as in the second part of this thesis, reduce the image size, or use hybrid approaches as in the other parts of this thesis. In the second part, we concentrate on amplitude encoding, with Quantum Probability Image Encoding (QPIE), and apply the Quantum Fourier Transform (QFT) to the quantum states. We can detect the orientation of objects in images with this approach by using additional post-processing methods. We compare the results of the QFT with those of the Fast Fourier Transform (FFT) and demonstrate that, at least on the simulator, we get the same results as with the classical method (see Chapter 5). The third part of the study is about edge detection of objects in gray value images. We use the idea of a quantum artificial neuron as the core building block of our algorithm (see [3] and Chapter 6). In this part, our primary focus is on the algorithm’s robustness in the face of current hardware limitations. To tailor it further to the current hardware, we developed six variations of the algorithm with the aim of reducing the number of quantum circuits. We compare the results of the six variations. Our adaption of the algorithm allows to examine image sizes that were previously unattainable by quantum algorithms on existing quantum hardware. In the fourth part, we focus on hybrid algorithms in the form of quantum transfer learning. Drawing from the experiences of the first part regarding the practical usability of current hardware, quantum transfer learning offers a way to circumvent these limitations by keeping some parts of the algorithm classical while executing other parts on quantum hardware. Our algorithm demonstrates its utility in detecting small cracks with a thickness of approximately one or two pixels in concrete samples (see [4] and Chapter 7). We highlight differences between simulators and current quantum computers and demonstrate the capability to detect the cracks in the images with the current quantum hardware.
  • Maschinelles Lernen und künstliche Intelligenz bilden wichtige Säulen im Bereich Computer Vision. Vor allem bei der Erkennung von Objekten oder der Klassifizierung von Bildern unterstützen oder ersetzen sie dabei klassische Methoden, wie morphologische Operatoren oder auch händische Überwachung. Dabei sind die Modelle, die trainiert und auf Probleme angepasst werden, meist nicht optimiert. Es wird versucht, mit einer großen Anzahl von trainierbaren Parametern jeden Use-Case abzudecken. Mittlerweile ist die Anzahl an Parametern so stark gestiegen, dass selbst leistungsstarke klassische Computer einen hohen Rechenaufwand haben und viel Zeit benötigen, um die Modelle zu trainieren. Des Weiteren werden die Bilder oder Daten mit verbesserten Kameras oder Scangeräten zunehmend detaillierter und benötigen somit auch mehr Speicherplatz. In unserem Fall handelt es sich um 2D oder 3D Bilddaten und in dieser Arbeit speziell um 2D Grauwertbilder. Eine vielversprechende Möglichkeit, Rechenaufwand zu sparen, bildet Quantencomputing. Mit Superposition, Verschränkung und weiteren quantenmechanischen Effekten ist dabei ein theoretischer Vorteil gegenüber klassischen Methoden nachweisbar. Allerdings ist neben den theoretischen Vorteilen nur wenig über den praktischen Nutzen von Quantencomputern erforscht. Wir untersuchen in dieser Doktorarbeit speziell die Möglichkeiten für eine Nutzung von Quantencomputern im Bereich der Bildverarbeitung. Im ersten Teil geht es dabei um die Kodierung der klassischen Bilddaten. Um Quantenalgorithmen entwerfen zu können, müssen wir zunächst die Bildinformationen, in Form von Grauwerten, in Quantenzustände überführen. Diese Kodierung ist ein sehr wichtiger Schritt und legt den Grundstein dafür, welche Arten von Quantenalgorithmen später angewendet werden können. Die Bildinformationen werden dabei über Basis-, Amplituden- oder Phasenkodierung in Quantenzustände umgewandelt. Die Verbesserung einer Methode basierend auf Phasenkodierung, Flexible Representation of Quantum Images (FRQI), ist Teil dieser Arbeit (siehe [1, 2] und Kapitel 4). Wir reduzieren dabei die Anzahl von sogenannten CX-Operationen und somit auch den Fehler, welchen wir aktuell auf der Quantenhardware bekommen. Zusätzlich zeigen wir mit einer experimentellen Studie, bis zu welcher Bildgröße eine Nutzung von FRQI auf aktuellen Quantencomputern möglich ist und bis zu welcher die Rekonstruktion des Bildes genaue Ergebnisse liefert. Nach der Untersuchung verschiedener Quantenkodierungsmöglichkeiten im ersten Teil, nutzen wir diese für die weiteren Teile dieser Arbeit. Wir haben unsere weiteren Forschungen und Untersuchungen für die folgenden Teile der Arbeit anhand der Erkenntnisse des ersten Teils angepasst. Wir können mit den aktuellen Quantencomputern keine großen Bilder enkodieren und wieder verlustfrei rekonstruieren. Als Ausweg können wir aktuell entweder einen Quantencomputer wie im zweiten Teil der Arbeit simulieren, die Bildgröße reduzieren oder hybride Ansätze verwenden, wie in den anderen Teilen dieser Arbeit. Im zweiten Teil dieser Arbeit nutzen wir die Amplitudenkodierungmethode Quantum Probability Image Encoding (QPIE) und wenden die Quanten Fourier Transformation (QFT) auf die Quantenzustände an. Dadurch können wir mit weiteren Bildverarbeitungsmethoden die Orientierung von Objekten in Bildern erkennen. Wir vergleichen die Ergebnisse der QFT mit der schnellen Fourier Transformation (FFT) und zeigen, dass zumindest auf dem Simulator die gleichen Ergebnisse erzielt werden können wie mit der klassischen Methode (siehe Kapitel 5). Den dritten Teil der Arbeit bildet die Erkennung von Kanten von Objekten in Grauwertbildern. Dabei nutzen wir die in die Quantenwelt überführte Idee eines künstlichen Neurons als Grundbaustein unseres Algorithmus (siehe [3] und Kapitel 6). In diesem Teil der Arbeit liegt der Fokus vor allem auf der Robustheit des Algorithmus gegenüber den aktuellen Fehlern der Hardware. Um den Algorithmus noch stärker auf die aktuelle Hardware anzupassen, entwickelten wir sechs Varianten des Algorithmus mit dem Ziel die Anzahl der Quanten-Schaltkreise zu reduzieren. Wir vergleichen die Ergebnisse der sechs Variationen in dieser Arbeit. Durch die Anpassung des Algorithmus können wir größere Bilder verarbeiten, die zuvor noch nicht von Quantenalgorithmen auf der aktuellen Quantenhardware verarbeitet wurden. Im vierten Teil konzentrieren wir uns auf hybride Algorithmen. Aus den Erfahrungen des ersten Teils bez üglich der praktischen Nutzbarkeit der aktuellen Hardware, bildet Quantum Transfer Learning eine Möglichkeit mit diesen aktuellen Beschränkungen umzugehen. Wir behalten die Struktur eines neuronalen Netzes wie im klassischen Sinne bei und ersetzen lediglich Teile davon mit Quantenschaltkreisen. Wir nutzen diesen hybriden Algorithmus zur Erkennung kleiner Risse mit einer Dicke von etwa ein oder zwei Pixeln in Betonproben (siehe [4] und Kapitel 7). Wir zeigen Unterschiede zwischen Simulatoren und den aktuellen Quantencomputern auf und demonstrieren die Fähigkeit, Risse in den Bildern mit der aktuellen Quantenhardware zu erkennen.

Download full text files

Export metadata

Metadaten
Author:Alexander GengORCiD
URN:urn:nbn:de:hbz:386-kluedo-82075
DOI:https://doi.org/10.26204/KLUEDO/8207
Advisor:Claudia RedenbachORCiD, Ali MoghisehORCiD, Katja SchladitzORCiD
Document Type:Doctoral Thesis
Cumulative document:Yes
Language of publication:English
Date of Publication (online):2024/05/14
Year of first Publication:2024
Publishing Institution:Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau
Granting Institution:Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau
Acceptance Date of the Thesis:2024/02/08
Date of the Publication (Server):2024/05/15
Page Number:X, 146
Faculties / Organisational entities:Kaiserslautern - Fachbereich Mathematik
DDC-Cassification:5 Naturwissenschaften und Mathematik / 510 Mathematik
Licence (German):Creative Commons 4.0 - Namensnennung (CC BY 4.0)