Skip to main content
main-content

18.04.2017 | Kardiologie | Nachrichten

Besser als die Leitlinie

Künstliche Intelligenz sagt kardiovaskuläre Ereignisse voraus

Autor:
Philipp Grätzel

Selbstlernende Computeralgorithmen schneiden bei der Vorhersage kardiovaskulärer Ereignisse signifikant besser ab als klassische Risiko-Scores. Gehört die gesamte kardiovaskuläre Risikoprädiktion auf den Prüfstand?

Der Einsatz von Computerprogrammen mit künstlicher Intelligenz (KI) wird in immer mehr klinischen Versorgungsszenarien evaluiert. Heutzutage handelt sich dabei meist um KI-Systeme, die mit „deep learning“ arbeiten: Die Software wird mit vielen tausend Patientendatensätzen „gefüttert“ und sucht sich in diesem Wust digitaler Daten prädiktive Faktoren, um bestimmte Ereignisse vorherzusagen.

Künstliche Intelligenz kann auch unklare Variablen berücksichtigen

Wissenschaftler der Abteilung für „Primary Care Research“ der Universität Nottingham um Stephen F. Wenig und Jenna Reps haben die Vorhersagekraft von Deep Learning-Algorithmen für den Spezialfall der kardiovaskulären Risikoprädiktion untersucht. Goldstandard war dabei das in den US-amerikanischen Leitlinien von ACC und AHA hinterlegte Prädiktionsmodell für das kardiovaskuläre Zehnjahresrisiko, das acht Faktoren einbezieht, nämlich Geschlecht, Alter, Raucherstatus, systolischer Blutdruck, Blutdrucktherapie, Gesamtcholesterin, HDL-Cholesterin und Diabetes mellitus. Die „Herausforderer“ waren vier Algorithmen mit unterschiedlichen methodischen Ansätzen der KI, darunter die relativ häufig eingesetzte Methodik der neuronalen Netzwerke.

Die Datengrundlage für die Arbeit lieferte die britische Forschungsdatenbank CPRD, in die seit Jahren annähernd 700 große allgemeinmedizinische Praxen in Großbritannien Daten einfüttern. Insgesamt standen knapp 380.000 Patientendatensätze zur Verfügung, für die ein entsprechend langer Follow-up-Zeitraum dokumentiert war. Davon wurden 295.000 genutzt, um die Algorithmen zu trainieren. Die übrigen 80.000 waren die Studienpopulation, anhand derer die unterschiedlichen Ansätze der Risikoprädiktion im Hinblick auf die Vorhersage kardiovaskulärer Ereignisse verglichen wurden.

Für das Training der KI-Systeme stellten die Wissenschaftler nur Basisinformationen zur Verfügung. Sie definierten den Outcomeparameter „kardiovaskuläre Ereignisse“, und sie gaben den Systemen eine lange Latte an Variablen an die Hand, die berücksichtigt werden können. Dazu zählten die acht bekannten Risikofaktoren des ACC/AHA-Modells, zusätzlich aber auch noch 22 weitere Variablen, deren kausale Bedeutung für kardiovaskuläre Ereignisse unklar ist.

Diese Variablen wurden teils der Literatur entnommen, teils von Experten festgelegt. Dazu zählten beispielsweise der BMI, das Serumkreatinin, aber auch Faktoren wie „schwere psychische Erkrankung“, Therapie mir oralen Kortikosteroiden, Immunsuppressiva oder Antipsychotika, das forcierte Einsekundenvolumen, der CRP-Wert, diverse Leberwerte oder ein Index zur sozialen Deprivierung.

Neuronale Netzwerke schlagen AHA/ACC-Modell

Das Ergebnis ist beeindruckend. Kurz gesagt: Alle vier Algorithmen schnitten signifikant besser ab als das ACC/AHA-Modell. Letzteres sagte von 7.404 kardiovaskulären Ereignissen 4.643 korrekt vorher, eine Sensitivität von 62,7 % und ein positiv prädiktiver Wert (PPV) von 17,1 %. Außerdem wurden 53.106 von 75.585 „Non-Cases“ korrekt vorhergesagt, eine Spezifität von 70,3 % und ein negativ prädiktiver Wert (NPV) von 95,1 %. Das beste KI-System, jenes, das auf neuronalen Netzwerken basiert, schaffte eine Sensitivität von 67,5 % und einen PPV von 18,4 % sowie eine Spezifität von 70,7 % und einen NPV von 95,7 %.

Die Autoren rechnen vor, dass im Vergleich zum AHA/ACC-Modell beim Einsatz neuronaler Netzwerke kardiovaskuläre Ereignisse bei 355 Patienten korrekt vorhergesagt worden wären, bei denen das Standardmodell keinen Alarm geschlagen hätte. Außerdem wäre 355 Patienten ein „falscher Alarm“ erspart geblieben. Das Ganze bezieht sich jeweils auf einen Zehnjahreszeitraum.

Diabetes interessierte die Künstliche Intelligenz herzlich wenig

Die britische Studie ist nicht die erste Studie dieser Art, aber die bei Weitem größte. In Deutschland konnten Wissenschaftler um Prof. Gerd Assmann schon 2002 anhand der PROCAM-Datensätze bei allerdings nur gut 5.000 männlichen Probanden zeigen, dass die Vorhersagegenauigkeit durch ein neuronales Netz um gut 3 % steigt, also in ähnlicher Größenordnung wie das jetzt in der britischen Studie der Fall war.

Moderne KI-Systeme sind leistungsfähiger, schneller und viel besser zu trainieren als die damaligen Systeme. Vor allem aber liegen die Patientendaten zunehmend in einer Form vor, die solche Auswertungen im Alltag möglich erscheinen lässt.

Die Briten denken, dass die Vorhersagegenauigkeit noch gesteigert werden kann, wenn mehr Variablen berücksichtigt und mehr Patientendatensätze für das Training zur Verfügung gestellt werden. Spannend wird es, wenn etwas detaillierter in die KI-Systeme hineingeschaut wird. Zwar lassen sich die Entscheidungen neuronaler Netzwerke nicht im Detail nachvollziehen. Es lässt sich aber schon grob analysieren, welche Faktoren in die jeweiligen Empfehlungen einfließen.

So sind schwere psychische Erkrankungen und die orale Kortikosteroidtherapie Teil der „Top-Ten-Liste“ jener Risikofaktoren, die die KI-Systeme am höchsten gewichten. Beides kommt in den traditionellen Risiko-Scores gar nicht vor. Der Diabetes wiederum, ein zentraler Risikofaktor der traditionellen Scores, spielte für die Vorhersagen der KI-Systeme nur eine untergeordnete Rolle. In der „Top-Ten-Liste“ der wichtigsten Risikofaktoren der Künstlichen Intelligenz taucht er gar nicht auf.

Literatur