ECR 2023 – KI-Support für die Prostata-MRT: Test unter Real-World-Bedingungen
Sensitivität und Spezifität eines in Cambridge entwickelten KI-Algorithmus für die Prostatakarzinom-Erkennung unter unterschiedlichen klinischen Bedingungen sind mit denen von Radiolog:innen in großen Studien vergleichbar.
-
Präsentationstag:02.03.2023 0 Kommentare
-
Autor:mh/ktg
-
Sprecher:Aarti Shah, Stockbridge, UK
-
Quelle:ECR 2023
"Unsere KI bietet eine vergleichbare Sensitivität und Spezifität wie menschliche Befunde“, so Aarti Shah, Stockbridge, UK. |
Die meisten Studien zum Einsatz von KI bei der Prostata-MRT sind monozentrische Studien ausschließlich mit 3T-Scannern. Für einen breiteren Einsatz müssen die KI-Algorithmen jedoch zeigen, dass sie unter unterschiedlichen Bedingungen funktionieren – in unterschiedlichen Zentren mit verschiedenen Scannern, Feldstärken und Scan-Protokollen. Aarti Shah, Stockbridge, UK, und Kollegen haben daher untersucht, wie ihre KI für die Prostata-MRT unter realen Bedingungen funktionieren würde.
Was der KI-Algorithmus leistet
Der KI-Algorithmus (Prostate Intelligence v2.1) wurde von Lucida Medical in Zusammenarbeit mit britischen NHS-Krankenhäusern entwickelt. Er identifiziert Prostataläsionen und leistet dies:
- Risikoscore pro Patient – zur Unterstützung der Radiolog:innen bei der Entscheidung über eine Biopsie
- Risikoscore pro Läsion – nach Biopsieentscheidung zur Feinabstimmung und Beurteilung weiterer Läsionen
- Prostata-Volumen
- Volumen der einzelnen Läsionen
Je nach klinischen Erfordernissen kann die Radiologie einen Schwellenwert für den Likert-Score für die KI variieren:
- Scores 2,5-3,0 sind für die Prostatakarzinom-Erkennung geeignet.
- Scores 3,5-4,0 eignen sich zur Vermeidung von Biopsien
"In unserer Einrichtung verwenden wir in der Regel zunächst einen Likert-Score Schwellenwert von 3,0", so Shah.
Daten für Training und Vergleich mit radiologischen Befunder:innen
Die Daten für Training, Validierung und Test stammen aus der niederländischen PROSTATEx-Studie (Litjens G et al. 2017; www.cancerimagingarchive.net) und einer Kohortenstudie an drei britischen NHS-Krankenhäusern. Shah und Kollegen maßen die KI-Performance anhand einer Biopsie-basierten Groundtruth aus diesen Studien.
Zum Vergleich mit den radiologischen Befunder:innen dienten Daten aus Studien mit erfahrenen Befunde:innen wie PROMIS (Ahmed HU et al. 2017) oder MRI-First (Rouvière O et al. 2019) und der Cochrane-Datenbank.
Ein Gleason-Score ≥3+4 galt als klinisch signifikantes Prostatakarzinom.
Ergebnisse – Ausschluss von Patienten
Etwa 10 Prozent der Daten wurden aus der Analyse ausgeschlossen. Die Ursachen:
- Patient mit Hüftendoprothese
- Schwache Bildqualität
- Biopsie nicht möglich = fehlende Groundtruth
Ergebnisse – Risikoscore pro Patient zur Unterstützung der Biopsieentscheidung
Bei Verwendung eines Likert-Scores von 3,0 erreichte die KI eine Sensitivität von 93% und eine Spezifität von 41% im Vergleich zur Groundtruth.
Der Vergleich mit den erfahrenen Befunden:innen zeigte: "Die KI bietet eine vergleichbare Sensitivität und Spezifität wie menschliche Befunder“, so Shah, „bei Verwendung eines niedrigen Schwellenwerts werden Sie häufiger biopsieren, haben aber zugleich eine höhere Sensitivität.“ Sie empfahl eine gleitende Skala von Cut-Off-Werten zu verwenden.
Bei Anwendung der KI auf heterogene Datensätze aus verschiedenen Kliniken zeigten sich leicht geringere, „aber immer noch robuste“ Werte für Sensitivität und Spezifität als bei den Daten aus der monozentrischen Studie.
Fazit – Vergleichbare Genauigkeit wie erfahrene Radiolog:innen
Sensitivität und Spezifität der KI für die Prostatakarzinom-Erkennung in unterschiedlichen klinischen Szenarien mit verschiedenen Feldstärken sind vergleichbar mit denen erfahrener Radiolog:innen in großen Studien. Die Ergebnisse lassen erwarten, dass der KI-Algorithmus geeignet ist, die Befundung von Prostata-MRT-Untersuchungen vor einer Biopsie zu unterstützen.
"Wir haben noch nicht alle Daten ausgewertet, aber es sieht sehr gut aus", so Shah abschließend, "im nächsten Schritt werden wir die klinischen Auswirkungen untersuchen und eine doppelblinde Leserstudie durchführen.“
Referenzen
Ahmed HU et al. PROMIS study group. Diagnostic accuracy of multi-parametric MRI and TRUS biopsy in prostate cancer (PROMIS): a paired validating confirmatory study. Lancet. 2017 Feb 25;389(10071):815-822.Litjens G et al. SPIE-AAPM-NCI PROSTATEx Challenges (PROSTATEx). The Cancer Imaging Archive 2017.
Rouvière O et al. MRI-FIRST Investigators. Use of prostate systematic and targeted biopsy on the basis of multiparametric MRI in biopsy-naive patients (MRI-FIRST): a prospective, multicentre, paired diagnostic study. Lancet Oncol. 2019 Jan;20(1):100-109.