Grafenberger Allee 100
40237 Düsseldorf
Tel.: + 49 211 600692-0
Fax: + 49 211 600692-10
info@dgk.org

Mittels künstlicher Intelligenz die Vorhersage von KHK und Mortalität basierend auf EKGs verbessern – ein Vergleich verschiedener Methoden

Abdruck frei nur mit Quellenhinweis
Pressetext als PDF - gegebenenfalls mit Bildmaterial

PD Dr. Jürgen Kampf und Prof. Dr. Amir Abbas Mahabadi, Essen

Hintergrund

Die Evaluation der Vortestwahrscheinlichkeit des Vorliegens einer obstruktiven Koronaren Herzkrankheit (KHK) ist eine Herausforderung im Alltag klinisch tätiger Kardiolog:innen. Diese kann mittels modifiziertem Diamond and Forrester Score eingeschätzt werden. Zur weiterführenden Abklärung kommen bildgebende Verfahren wie die CT-Untersuchung des Herzens, die Stress-Echokardiographie oder die Stress-MRT-Untersuchung des Herzens zum Einsatz, welche jedoch einen hohen Ressourcen-Bedarf haben. Die Elektrokardiographie (EKG) des Herzens, welche routinemäßig breit verfügbar ist, liefert zahlreiche strukturierte Informationen, die mittels Algorithmen basierend auf künstlicher Intelligenz die Vorhersage mehrerer kardiovaskulärer Erkrankungen ermöglicht.

Ziel

Wir wollen Methoden der multivariaten Statistik (logistische Regression, lineare Diskriminanzanalyse) und des maschinellen Lernens (neuronale Netze, random forests, support vector machines) hinsichtlich ihrer Eignung, aus strukturierten Daten des EKGs eine obstruktive KHK oder die langfristige Überlebenswahrscheinlichkeit vorherzusagen, vergleichen. Weiter werden wir evaluieren, wie die Vorhersagequalität dieser Methoden verbessert werden kann.

Methoden

Unsere Analyse basiert auf dem ECAD Register. Dieses enthält Daten von Patient:innen, die zwischen 2004 und 2019 am Westdeutschen Herz- und Gefäßzentrum Essen eine konventionelle Koronarangiographie erhielten. In die Studie wurden nur Patient:innen mit einem digital verfügbaren Ruhe-EKG, das maximal 90 Tage vor der Koronarangiographie durchgeführt wurde, eingeschlossen. Die Analyse der EKGs basiert auf den 648 Charakteristiken, die der MUSE-Algorithmus liefert.

Eine obstruktive KHK wurde definiert als Notwendigkeit einer Revaskularisationstherapie, entsprechend der Einschätzung des behandelnden interventionellen Kardiolog:innen. Zur Analyse der Sterblichkeit wurden alle Todesfälle während des Nachverfolgungszeitraums, unabhängig von der Ursache, herangezogen.

Ein erstes neuronales Netz (NN1) wurde durch dropout, weight regularization und Optimierung der Hyperparameter verbessert (NN2). Mittels feature reduction erhielten wir NN3. Random forests (RF1) wurden durch angepasste Gewichtung der Einflussgrößen (RF2) und feature reduction (RF3) verbessert. Weiter betrachteten wir logistische Regression (LR), lineare Diskriminanzanalyse (LDA) und support vector machines (SVM). Zum Vergleich der Verfahren wurde die über 100 Durchläufe gemittelte area under the receiver operating curve (AUC) in einer Validierungskohorte verwendet.

Ergebnisse

Wir werteten Daten von 7.076 Koronarangiographien aus. In 2.075 Fällen (29.3 %) wurde eine obstruktive KHK diagnostiziert. Während des Nachverfolgungszeitraums (median [Q1; Q3] 2,4 [0,8; 6,3 Jahre]) starben 1.137 Patient:innen (16.1 %). Ein Vergleich der verschiedenen statistischen Verfahren findet sich in Tabelle 1. Zwar liefern im ersten Versuch random forests die besten Resultate, allerdings werden diese nach feature reduction von den neuronalen Netzen überholt.

 

  LR LDA NN1 NN2 NN3 RF1 RF2 RF3 SVM
(A) KHK                  
EKGs allein 0.567 0.568 0.584 0.603 0.623 0.599 NA 0.611 0.542
Risikofaktn. allein 0.576 0.576 0.586 0.590 NA 0.568 NA NA 0.536
beides 0.584 0.587 0.599 0.636 0.656 0.609 0.622 0.622 0.547
(B) Mortalität                  
EKGs allein 0.590 0.618 0.627 0.659 0.707 0.659 NA 0.667 0.641
Risikofaktn. allein 0.581 0.582 0.567 0.580 NA 0.580 NA NA 0.559
beides 0.600 0.627 0.610 0.663 0.711 0.660 0.663 0.673 0.651

 

NA Kombination aus Verfahren und Einflussgröße macht keinen Sinn
LR Logistische Regression
LDA Lineare Diskriminanzanalyse
NN1 Neuronale Netze – ein erster Versuch
NN2 Neuronale Netze mit Dropout, weight regularization und Optimierung der Hyperparameter
NN3 Neuronale Netze mit feature reduction
RF1 Random forests – ein erster Versuch
RF2 Random forests mit unterschiedlicher Gewichtung der Einflussgrößen
RF3 Random forests mit feature reduction
SVM Support vector machines

Tab.1: Vergleich der verschiedenen statistischen Verfahren

 Zusammenfassung und Ausblick

Wir haben fünf Verfahren verglichen, um mit Hilfe von EKGs und kardiovaskulären Risikofaktoren vor einer Koronarangiographie eine KHK und die Sterbewahrscheinlichkeit vorherzusagen. Meistens schnitten random forests am besten ab, gefolgt von neuronalen Netzen. Verschiedene Vorgehensweisen, um neuronale Netze und random forests zu verbessern waren erfolgreich, insbesondere die feature reduction. Letztere führte auch dazu, dass neuronale Netze random forests überholten. Weitere Verbesserungen erhoffen wir uns zum einen davon, neuronale Netze auf die EKG-Rohdaten anstatt auf die Charakteristika des MUSE-Algorithmus anzuwenden, und zum anderen davon, die Ergebnisse verschiedener Methoden des maschinellen Lernens zu kombinieren (model ensembling).

 Die Deutsche Gesellschaft für Kardiologie – Herz- und Kreislaufforschung e. V. (DGK) mit Sitz in Düsseldorf ist eine gemeinnützige wissenschaftlich medizinische Fachgesellschaft mit mehr als 12.000 Mitgliedern. Sie ist die älteste und größte kardiologische Gesellschaft in Europa. Ihr Ziel ist die Förderung der Wissenschaft auf dem Gebiet der kardiovaskulären Erkrankungen, die Ausrichtung von Tagungen, die Aus-, Weiter- und Fortbildung ihrer Mitglieder und die Erstellung von Leitlinien. Weitere Informationen unter www.dgk.org