Einführung
Deep Learning ist ein Teilgebiet des maschinellen Lernens, das wiederum ein Teilbereich der KI ist. KI kann lediglich eine programmierte Regel sein, die der Maschine sagt, wie sie sich in bestimmten Situationen verhalten soll. Mit anderen Worten, künstliche Intelligenz kann nichts anderes sein als mehrere If-Else-Anweisungen. Um die Fehler bei den Vorhersagen des Modells im Vergleich zu den tatsächlichen Gegebenheiten zu verringern, erfordert maschinelles Lernen erhebliche Benutzereingaben. Ein äußerst leistungsstarkes Framework für Deep Learning in der modernen Ära kann durch das Hinzufügen zusätzlicher Schichten und Einheiten innerhalb jeder Schicht Funktionen von zunehmender Komplexität ausdrücken.
Bei einem ausreichend großen Modell und einem Datensatz mit beschrifteten Trainingsbeispielen kann Deep Learning typischerweise Aufgaben, die das Mapping einer Eingabesequenz auf eine Ausgabesequenz erfordern, schnell und einfach bewältigen. Deep Learning benötigt jedoch stärkere und bessere Computerhardware, um erfolgreich zu funktionieren.
Deep Learning
Chronische myeloische Leukämie (CML) ist eine Art von Leukämie, die in den myeloischen Zellen des Knochenmarks entsteht. Sie produziert weiße Blutkörperchen, die normalerweise dem Körper helfen, Krankheiten abzuwehren. Bei einem Patienten haben die Zellen in fast allen Fällen von CML ein verändertes Chromosom. Diese Veränderung wird als Philadelphia-Chromosom bezeichnet. Das Ergebnis ist die Produktion des beschädigten Gens BCR-ABL. Mit dem Vorhandensein dieses Gens entwickeln sich Leukämiezellen unkontrolliert. Wenn die Leukämiezellen wachsen, könnten die gesunden Knochenmarkszellen verdrängt werden. Dadurch kann das Blut nicht genügend verschiedene Blutzelltypen enthalten. Eine erhöhte Menge an abnormalen weißen Blutkörperchen könnte im Blut von CML-Patienten gefunden werden.
Für die Untersuchung von Mikroanatomiedaten werden Deep Learning-Algorithmen eingesetzt, um den Prozess zu beschleunigen, die Objektivität zu verbessern und Fehler zu verringern. Darüber hinaus wird die Entwicklung von erklärbarer KI (xAI), auch bekannt als erklärbare KI-Systeme, genutzt, um die Deep Learning-Berechnungen einfach zu erklären und uns zu helfen, medizinische Störungen besser zu verstehen.
Kosten- und Verlustfunktion
Das Ziel der Entwicklung eines DL-Modells besteht darin, den Fehler zwischen Vorhersagen und tatsächlichen Werten zu reduzieren. Dies wird mithilfe von Verlustfunktionen erreicht, die mit jedem Trainingsbeispiel verbunden sind. Der Durchschnitt der Verlustfunktionswerte aller Datenproben ist die Kostenfunktion. Die Kostenfunktion wird optimiert, um den DL-Fehler zu verringern. Wir können die besten Ergebnisse im DL erzielen, indem wir die Kostenfunktion verbessern.
Metrik
Die Effektivität von Algorithmen zum Verständnis medizinischer Bilder wird anhand verschiedener Metriken bewertet. Die Tabelle, die zur Visualisierung der Algorithmenleistung und zur Bestimmung mehrerer Bewertungsmetriken verwendet wird, wird als Konfusionsmatrix bezeichnet. Konfusionsmatrizen werden verwendet, um Deep Learning-Modelle zu bewerten und eine realistischere Sicht auf ihre Leistung zu bieten. Der Output könnte zwei oder mehr Klassen umfassen. In der Tabelle gibt es vier mögliche Kombinationen von vorhergesagten und tatsächlichen Werten.
Mittlere Durchschnittliche Präzision
Mean Average Precision (mAP) ist eine Metrik zur Bewertung von Objekterkennungsmodellen. Konfusionsmatrix, Intersection over Union (IoU), Recall, Precision sind die Untermessgrößen, die das Rückgrat der Formel für die mAP-Genauigkeit bilden. Die mAP wird berechnet, indem die Durchschnittliche Präzision (AP) für jede Klasse ermittelt und dann über eine Anzahl von Klassen gemittelt wird.
Erstellung von Ground Truth Data
Um ein Modell im Deep Learning zu trainieren, wird Ground Truth Data (GTD) benötigt, die durch einfaches Erstellen von Basis-ROIs und Annotieren der vorhandenen Zellen innerhalb der Basis-ROIs erreicht wird. Die Anzahl der Zellen im GTD-Formular, das in dieser Arbeit verfügbar ist (siehe Tab.1), betrug 10 Dateien zusammen mit + 800.000 GTD unter Verwendung der HSA KIT-Software. Es gibt verschiedene Phasen bei der Erstellung des GTD. Die Carl Zeiss Image Data File enthält eine WSI-Datei, die zuerst in das HSA KIT (CZI) geladen wird. Die Anmerkungen werden innerhalb des ROI in Bezug auf eine Funktion des HSA KIT festgelegt. Dann werden die Blutzellstrukturen annotiert, und diese Struktur hat 2 Unterstrukturen, nämlich Erythrozyten und Leukozyten. Die Leukozyten werden weiter in 45 verschiedene Klassen unterteilt, darunter (NET, Pseudo-Gaucher-Zelle und Megakaryozyt) und die Anzahl der Klassen beträgt (5399, 97 und 149) bzw. Die Menge und Qualität dieser Anmerkungen hängt von der Lage, Klarheit und Größe des Basis-ROI ab. Nachfolgend eine Aufschlüsselung der Klassenverteilung zusammen mit den entsprechenden Prozentsätzen.
Klassen | Leukozyten | Erythrozyten | Megakaryozyt | NET | Pseudo-Gaucher-Zelle |
Alle Daten | 274,553 | 617,709 | 149 | 5,399 | 97 |
Verwendete Daten | 48,887 | 88,947 | 59 | 4,587 | 93 |
Framework
Das Deep Learning (DL)-Modellerstellungsframework PyTorch hat sich als sehr beliebt und effektiv erwiesen. Diese auf Torch basierende Open-Source-Maschinenlernbibliothek wurde entwickelt, um die Implementierung von tiefen neuronalen Netzen zu beschleunigen und die Flexibilität zu erhöhen. PyTorch ist eine auf Torch und Python basierende Deep Learning Tensor-Bibliothek, die hauptsächlich in CPU- und GPU-Anwendungen verwendet wird. Torch ist eine Open-Source-ML-Bibliothek zur Erstellung tiefer neuronaler Netze und ist in der Skriptsprache Lua geschrieben.
Auswahl des Datensatzes
Nach der Erstellung des GTD wurde die folgende Tabelle für das Training des 3-Klassen-KI-Modells und das Training des Erythrozyten- und Leukozyten-KI-Modells verwendet:
Modelltyp | Epochen | Lernrate | Batch-Größe | Kachelgröße |
Instanzsegmentierung | 100 | 0.0001 | 2 | 512 |
Modelltyp | Epochen | Lernrate | Batch-Größe | Kachelgröße |
Instanzsegmentierung | 50 | 0.0001 | 1 | 256 |
HyperCMLNet
In dieser Arbeit wurde das HSA KIT von HS Analysis GmbH verwendet, um CML-Zellen und deren Strukturen zu identifizieren. HyperCMLNet, ein proprietäres Deep Learning-KI-Modell mit Fokus auf die Instanzsegmentierung und Klassifizierung von CML-Zellen, wurde bei HS Analysis GmbH entwickelt. Die Architekturen Mask R-CNN, die die Grundlage für HyperCMLNet (Typ 1) bildete, und Vision Transformer, die die Grundlage für HyperCMLNet (Typ 2) bildete, wurden in dieser Arbeit verwendet.
Interpretation und Validierung des Ergebnisses
Die folgenden Daten zeigen den Vergleich von Verlust und mAP-Bewertungen der Instanzsegmentierungsergebnisse, die von beiden trainierten (Typ 1 & 2) der HyperCMLNet-Architekturen für Erythrozyten und Leukozyten sowie der 3 Klassifizierungen durchgeführt wurden. Die folgende Tabelle zeigt die tatsächlich erhaltenen Ergebnisse aus dem Modelltraining.
Interpretation von xAI
In diesem Abschnitt werden die Ergebnisse der CML-Klassen mit dem Heatmap-Tool-Detektion verglichen, das im HSA KIT verwendet wurde. Das Heatmap-Tool im HSA KIT wird verwendet, um die Vorhersage zu erkennen, wo die Klassen der KI-Modelle am wahrscheinlichsten mit ihren Farben liegen. Je wärmer (roter) es ist, desto höher ist die Wahrscheinlichkeit der Erkennung, und umgekehrt, je kälter (blauer) es ist, desto weniger wahrscheinlich wird die Vorhersage auftreten. Kurz gesagt, das Heatmap-Tool wird verwendet, um den Hotspot von KI-generierten Anmerkungen zu visualisieren. Es ist für die Visualisierung von KI-Projekten mit Ergebnissen gedacht, die große Mengen an GTD auf einem Slide enthalten, wie das Projekt, das in dieser Arbeit verwendet wurde.
Wir können den tatsächlichen Vergleich aus der folgenden Abbildung sehen, zwischen den ((A) Erythrozyten und Leukozyten, (B) NET, (C) Pseudo-Gaucher-Zelle und (D) Megakaryozyt), wobei die erste Spalte Typ 2 und die zweite Spalte Typ 1 zeigt. Im Fall von (A), da es nur sehr wenig Unterschied zwischen beiden Architekturen bei der Erkennung von Erythrozyten- und Leukozytenklassen gibt, ist es schwierig zu bestimmen, welche am optimalsten ist, jedoch zeigen beide Architekturen hervorragende Hotspot-Vorhersagen. Dies ist auf die große Menge an Erkennung zurückzuführen, die von jedem einzelnen Modell durchgeführt wurde.
Im Fall von (B) zeigten die Erkennungsqualität beider Architekturen vielversprechende Ergebnisse, jedoch ist klar, dass die Heatmap-Erkennung beider Architekturen ebenfalls sehr ähnlich war. Da sich die NET-Zellen selbst nicht in unmittelbarer Nähe befinden, führte dies dazu, dass die Heatmap keine großen Hotspots bildete, sondern stattdessen einzelne.
Im Fall von (C) und (D) wird gezeigt, dass die Heatmap-Erkennung wieder sehr ähnlich ist, aber genau wie im Fall von (B) waren die tatsächlichen Zellerkennungen wenige und weit voneinander entfernt, was dazu führte, dass die Heatmap-Erkennung singulär war.
Zusammenfassung und Ausblick
In dieser Arbeit wurden die Mutterstrukturen (Erythrozyten, Leukozyten) und die 3 Unterklassen der Leukozyten (NET, Pseudo-Gaucher-Zelle und Megakaryozyt) der chronischen myeloischen Leukämie mithilfe von Deep Learning-Modellen erkannt und dann berechnet und validiert. Darüber hinaus wurde das Heatmap-Tool des HSA KIT verwendet, um diese Modelle zu visualisieren und zu bestimmen, wie die gleichen Zellklassen mit unterschiedlicher Architektur erkannt wurden. HyperCMLNet (Typ 1), das auf der Mask R-CNN-Architektur basiert, und HyperCMLNet (Typ 2), das auf der Vision Transformer-Architektur basiert, wurden beide auf GTD von CML implementiert. Das Ziel dieser Arbeit war es, die Erkennung mehrerer Klassen von CML auf beiden Architekturen in der Instanzsegmentierung im Deep Learning zu vergleichen.