Zum Inhalt springen

#Coronazeit #Wissenschaft #Wissenschaftskommunikation

Wie Künstliche Intelligenz Corona erkennen kann

Antonia Gustke, Alumna bei B-MINT und Master Plus

In Zeiten von Corona hat sich gezeigt, dass Künstliche Intelligenz (KI) nicht nur ein Trend ist, sondern eine potenziell entscheidende Rolle bei der Bewältigung der Krise spielt. Natürlich kann Corona durch Schnelltests erkannt werden oder auch durch Abwassermessungen, aber auch modernste Technologien aus dem Bereich KI können eingesetzt werden, um Infektionen möglichst schnell und genau zu erkennen.

Beispielsweise hat ein Forschungsteam der Universität in Maastricht eine Künstliche Intelligenz erschaffen, die anhand von Stimmaufnahmen eine Corona-Infektion erkennt [1]. Die Diagnose ist dabei sehr viel schneller festzustellen als bei einem herkömmlichen Schnelltest und liefert eine Genauigkeit von 89% [2]. Solche technologischen Fortschritte sind ein Beleg dafür, wie KI den Diagnoseprozess revolutionieren kann.

Aber auch anhand von Röntgenaufnahmen der Lunge kann man erkennen, ob ein Patient Corona-positiv ist oder nicht. Genau darum soll es in diesem Text gehen. Beschäftigt habe ich mich mit diesem Projekt im Rahmen eines Seminars zur Datenerfassung während meines Bachelorstudiums an der TU Hamburg-Harburg.

Um zu verstehen, wie Künstliche Intelligenz uns bei der Eindämmung der Corona-Pandemie oder anderer Krankheiten unterstützen kann, müssen wir zunächst begreifen, wie sie lernt. Voraussetzung dafür ist eine Vielzahl an Röntgenaufnahmen. Je mehr Bilder zur Verfügung stehen, desto präziser wird die Künstliche Intelligenz. Im Folgenden sind die Begriffe „Modell” und „Künstliche Intelligenz” gleichzusetzen.

Preprocessing

Der erste Schritt besteht darin, die vorliegenden Bilder zu vereinheitlichen. Sie werden auf eine einheitliche Größe gebracht, normalisiert und schließlich in Graustufen umgewandelt. Jedes Pixel eines Bildes wird in einer Grauschattierung dargestellt, die als Zahlenwert repräsentiert werden kann. Dadurch lässt sich das Bild als Matrix oder Vektor darstellen, womit ein Computer rechnen kann. Die vorbereiteten Bilder werden dann in Trainings- und Testdaten aufgeteilt. Ein Modell oder auch ein neuronales Netzwerk besteht aus zahlreichen Parametern, die wir aber in diesem Text als Black Box betrachten. Diese Parameter lernt das Modell im Training: sie werden angepasst. Die Testdaten dienen später zur Evaluierung unseres Modells. Damit diese Evaluierung möglich ist, müssen wir für diese Bilder die Antwort auf unsere Fragestellung kennen: Wir müssen also wissen, ob die Röntgenaufnahme von einer tatsächlich Corona-infizierten Person stammt oder nicht.

Das Training

Sobald die Bilder also so vorbereitet sind, dass eine Maschine sie lesen kann, beginnt das Training. Ziel des Trainings ist es, ein Modell zu schaffen, das als Eingabe eine Röntgenaufnahme erhält und entweder „Corona” oder „kein Corona” möglichst korrekt ausgibt.

Da wir sowohl die tatsächlichen Befunde der Trainings- als auch der Testdaten kennen, können wir berechnen, in wie vielen Fällen unser Modell richtig liegt und wie oft eine falsche Klassifizierung vorliegt. Anfangs ist die Trainingsgenauigkeit sehr gering und nur wenige Bilder werden korrekt klassifiziert. Um diese Genauigkeit zu verbessern, ändern wir einige Parameter unseres Modells und lassen mit diesen Änderungen alle Bilder erneut klassifizieren. Mit jedem Trainingsdurchlauf wird die KI besser, bis schließlich alle Trainingsbilder korrekt klassifiziert werden. 

Man könnte nun vermuten, dass das Modell hervorragend für die Klassifizierung von Röntgenaufnahmen geeignet ist, weil alle Trainingsbilder korrekt klassifiziert wurden. Wenn jedoch neue, beim Training nicht verwendete Bilder gezeigt werden (was in der Evaluationsphase mithilfe der Testdaten geschieht), werden diese häufig falsch eingeordnet. Obwohl alle Trainingsbilder korrekt klassifiziert wurden, werden die Testbilder kaum richtig erkannt. Dieses Phänomen nennt sich Overfitting. Man kann es sich so vorstellen, dass die KI aufhört, allgemeine Muster zu erkennen, die für oder gegen eine Erkrankung sprechen, und stattdessen die Trainingsbilder auswendig lernt. 
Grafik zum Download anbieten und darauf im Text verweisen!

Vermeidung von Overfitting

Um Overfitting zu vermeiden, gibt es verschiedene Strategien, zum Beispiel Early Stopping. Dabei wird das Modell nach jedem Trainingsdurchlauf anhand ungesehener Bilder (der Testbilder) evaluiert. Sobald die Testgenauigkeit wieder sinkt, wird das Training gestoppt. So wissen wir, dass unser Modell tatsächlich gut ist, weil es auch bei ungesehenen Bildern gut abschneidet. Weitere Methoden wie Regularisierung, Datenaugmentation und Cross-Validation können ebenfalls dazu beitragen, Overfitting zu verhindern. Können uns solche Methoden helfen?

Beispiele

Bereits heute investieren große Unternehmen intensiv in die Entwicklung Künstlicher Intelligenzen für den medizinischen Bereich. So arbeitet Google Health an einer KI, die zur Brustkrebserkennung eingesetzt werden soll [3]. Ein weiteres Beispiel ist SkinVision, eine App, die erfolgreich KI nutzt, um anhand von Fotos Anzeichen von Hautkrebserkrankungen zu identifizieren [4].

Vorteile der Diagnose durch KI

Ein sehr gutes Modell kann oft eine höhere Genauigkeit erreichen als ein Mensch. Eine Studie von 2021 zeigt, dass ein KI-basiertes System eine höhere Genauigkeit bei der Diagnose von Corona auf Röntgenaufnahmen zeigt als Radiologen mit unterschiedlichen Erfahrungsstufen [5]. Zudem ist es möglich, eine schnellere Diagnose durch eine KI zu bekommen als durch einen Arzt. Innerhalb kürzester Zeit können große Datenmengen ausgewertet werden, was bei der Eindämmung einer Pandemie entscheidend sein kann.

Erklärbare KI und ethische Überlegungen

Ein großes Problem bei der Nutzung von Künstlicher Intelligenz ist die Nachvollziehbarkeit der Entscheidungen. Die KI liefert keine Erklärung dazu, wie sie die Entscheidung getroffen hat, weil sie komplexe Berechnungen ausführt, die für einen Menschen schwierig bis kaum zu interpretieren sind. Dieses Problem wird auch als Black-Box-Problem bezeichnet.

Eine Möglichkeit, dieses Problem zu lösen, bietet die sogenannte explainable AI, also erklärbare KI. Das ist eine Methode, die den Entscheidungsprozess einer KI transparenter macht. Beispielsweise können die Merkmale und Variablen hervorgehoben werden, die den größten Einfluss auf die Entscheidung haben [6]. In unserem Röntgen-Beispiel könnte der Bereich im Bild optisch umrandet werden, der für eine Erkrankung spricht. Auch ethische Fragen müssen diskutiert werden, bevor eine solche KI in der Medizin eingesetzt werden kann. Wer haftet, wenn die KI eine falsche Diagnose abgegeben hat? Sollte eine KI die Diagnose direkt an den Patienten übermitteln oder sollte dies durch eine:n menschliche:n Expert:in geschehen?

Herausforderungen

Die Diagnose durch eine KI stützt sich immer auf vergangene Daten. Im Röntgen-Beispiel haben wir gesehen, dass die KI anhand von Trainingsdaten lernt. Allerdings kann es vorkommen, dass die Daten nicht vielfältig genug sind, was zu einer Diskriminierung führen kann. Es muss sichergestellt werden, dass die Diagnose ohne Vorurteile oder Diskriminierung erfolgt. Dies stellt eine große Herausforderung dar, weil es oft vorkommt, dass nicht für jede Bevölkerungsgruppe ausreichend Trainingsdaten zur Verfügung stehen.

Insbesondere in Europa erweist sich die Nutzung von Patientendaten als schwierig. Die Datenschutz-Grundverordnung (DSGVO) gibt strenge Regeln vor, unter denen Patientendaten verwendet werden dürfen, wie zum Beispiel durch die Anonymisierung der Daten [7]. Je mehr Daten der KI beim Training zur Verfügung stehen, desto genauer können die Diagnosen ausfallen. Die Balance zwischen dem Schutz der Privatsphäre und der Verfügbarkeit von ausreichenden Datenmengen ist daher essenziell, um die Leistungsfähigkeit von KI in der medizinischen Diagnose zu maximieren.

Zukunftsaussichten

Die Integration von KI in medizinische Diagnoseverfahren steht noch am Anfang, hat aber enormes Potenzial. Mit zunehmender Datenlage und verbesserten Technologien können KI-Modelle entstehen, die noch genauer und vielseitiger sind. Meiner Meinung nach spielt die Zusammenarbeit zwischen menschlichen Expert:innen und der KI eine entscheidende Rolle. Denn diese stärkt nicht nur das Vertrauen in die Diagnose, sondern kann auch personalisierte Behandlungspläne hervorbringen. Ein Beispiel dafür könnte sein, dass die KI eine erste Diagnose stellt, die anschließend von einem Experten oder einer Expertin überprüft und bestätigt wird.
Letztendlich liegt es an uns zu entscheiden, ob wir für eine effektive Eindämmung von Krankheiten durch schnelle Entscheidungen Abstriche bei der Transparenz der Diagnose in Kauf nehmen wollen.


Quellen:

  1. mdr.de. (2022, 5. September). Covid-19: Künstliche Intelligenz erkennt Corona an der Stimme. MDR.DE. https://www.mdr.de/wissen/corona-per-app-an-der-stimme-erkennen-statt-per-schnelltest-100.html#:~:text=KI%20stellt%20erkennt%20positive%20F%C3%A4lle,positiven%20Person%20kamen%20oder%20nicht.
  2. Aljbawi, W., Simmons, S. O., & Urovi, V. (2022). Developing a multi-variate prediction model for the detection of COVID-19 from Crowd-sourced Respiratory Voice Data. arXiv preprint arXiv:2209.03727.
  3. https://health.google/caregivers/mammography/
  4. https://www.skinvision.com/de/
  5. Fontanellaz, Matthias MSc; Ebner, Lukas MD; et al. A Deep-Learning Diagnostic Support System for the Detection of COVID-19 Using Chest Radiographs: A Multireader Validation Study. Investigative Radiology 56(6):p 348-356, Juni 2021. | DOI: 10.1097/RLI.0000000000000748 
  6. Mehta, D. (2024, 13. März). Erklärbare KI: Das Geheimnis der Blackbox lüften. Fraunhofer IAO – BLOG. https://blog.iao.fraunhofer.de/erklaerbare-ki-das-geheimnis-der-blackbox-lueften/
  7. Wittig, F. (2024, 8. Mai). Bessere Krebsdiagnose und -therapie dank KI. tagesschau.de. https://www.tagesschau.de/wissen/forschung/ki-krebsdiagnose-100.html

Foto: National Cancer Institute/Unsplash

Artikel kommentieren

Kommentare sind nach einer redaktionellen Prüfung öffentlich sichtbar.