banner

Nachricht

Sep 28, 2023

Vergleichende Validierung von KI und Nicht-KI

Scientific Reports Band 13, Artikelnummer: 3439 (2023) Diesen Artikel zitieren

1082 Zugriffe

12 Altmetrisch

Details zu den Metriken

Eine Verlagskorrektur zu diesem Artikel wurde am 3. Mai 2023 veröffentlicht

Dieser Artikel wurde aktualisiert

Die automatisierte Segmentierung und Volumetrie von Magnetresonanztomographie-Scans (MRT) des Gehirns sind für die Diagnose der Parkinson-Krankheit (PD) und des Parkinson-Plus-Syndroms (P-plus) unerlässlich. Um die diagnostische Leistung zu verbessern, verwenden wir Deep-Learning-Modelle (DL) bei der MRT-Segmentierung des Gehirns und vergleichen ihre Leistung mit der Goldstandard-Nicht-DL-Methode. Wir haben Gehirn-MRT-Scans von gesunden Kontrollpersonen (\(n=105\)) und Patienten mit Parkinson-Krankheit (\(n=105\)), multipler systemischer Atrophie (\(n=132\)) und progressiver supranukleärer Parese (\) gesammelt. (n=69\)) am Samsung Medical Center von Januar 2017 bis Dezember 2020. Mithilfe des Goldstandard-Nicht-DL-Modells FreeSurfer (FS) segmentierten wir sechs Gehirnstrukturen: Mittelhirn, Pons, Nucleus caudatus, Putamen, Pallidum und dritten Ventrikel und betrachtete sie als annotierte Daten für DL-Modelle, das repräsentative Convolutional Neural Network (CNN) und Vision Transformer (ViT)-basierte Modelle. Würfelwerte und die Fläche unter der Kurve (AUC) zur Unterscheidung von Normal-, PD- und P-Plus-Fällen wurden berechnet, um das Maß zu bestimmen, mit dem die FS-Leistung unverändert reproduziert werden kann, während die Geschwindigkeit durch die DL-Ansätze erhöht wird. Die Segmentierungszeiten von CNN und ViT für die sechs Gehirnstrukturen pro Patient betrugen 51,26 ± 2,50 bzw. 1101,82 ± 22,31 s und waren damit 14 bis 300 Mal schneller als FS (15.735 ± 1,07 s). Die Dice-Scores beider DL-Modelle waren ausreichend hoch (> 0,85), sodass ihre AUCs für die Krankheitsklassifizierung denen des FS nicht unterlegen waren. Für die Klassifizierung von normal vs. P-plus und PD vs. P-plus (außer multiple systemische Atrophie – Parkinson-Typ) auf der Grundlage aller Gehirnteile zeigten die DL-Modelle und FS AUCs über 0,8, was zusätzlich den klinischen Wert der DL-Modelle demonstriert zu FS. DL reduziert die Analysezeit erheblich, ohne die Leistung der Gehirnsegmentierung und Differentialdiagnose zu beeinträchtigen. Unsere Ergebnisse können zur Einführung der DL-Gehirn-MRT-Segmentierung im klinischen Umfeld beitragen und die Hirnforschung vorantreiben.

Die Diagnose der Parkinson-Krankheit (PD) basiert in erster Linie auf dem klinischen Erscheinungsbild. Bei atypischen Symptomen, sogenannten „Red Flags“1, ist die Magnetresonanztomographie (MRT) des Gehirns jedoch für die Diagnose von Parkinson-Plus-Syndromen (P-Plus), wie z. B. Multisystematrophie (MSA) und progressiver supranukleärer Parese (PSP), unerlässlich. Die MRT verbessert die diagnostische Genauigkeit und kann zur Überwachung des Krankheitsverlaufs eingesetzt werden2. Die MRT des Gehirns kann verschiedene Merkmale aufdecken, die bei P-plus, aber nicht bei PD2,3,4 auftreten. Beispielsweise weisen Patienten mit PSP eine ausgeprägte Mittelhirnatrophie5 auf, die als Kolibri-Zeichen bekannt ist. Beim MSA-Parkinson-Typ (MSA-P) ist das Putamen atrophisch, hat einen abgeflachten seitlichen Rand und zeigt auf T1-gewichteten Gradientenechobildern ein hypointenses Signal. Patienten mit MSA-Kleinhirntyp (MSA-C) zeigen eine vorherrschende Atrophie in den Pons und den mittleren Kleinhirnstielen, was zu einem erhöhten Verhältnis von Mittelhirn zu Pons6 und einem Rückgang des Magnetresonanz-Parkinsonismus-Index7 führt. Dementsprechend wurden auch quantitative Messungen des Volumens dieser Gehirnstrukturen bewertet, die eine hohe Sensitivität und Spezifität bei der Unterscheidung von PD von P-plus8 zeigten.

Obwohl die diagnostische Sensitivität und Spezifität, die durch die Beurteilung des Mittelhirnbereichs erzielt werden, für die Unterscheidung zwischen PSP, MSA und PD9 im Allgemeinen hoch sind, ist die visuelle Beurteilung dieses Bereichs nicht quantitativ, es mangelt an Objektivität und sie hängt stark von den Fähigkeiten des Arztes oder der Bildaufnahme ab. Folglich haben Diagnosen, die auf visuellen Beurteilungen basieren, ein breites Spektrum an Genauigkeit gezeigt und liegen sogar unter 80 %10,11,12. Um eine konsistente und quantitative Analyse der Gehirn-MRT zu entwickeln, wurde die Volumetrie des Mittelhirnbereichs als optimaler Prädiktor für eine genaue Diagnose verwendet6,8,13,14. Daher ist die Segmentierung von Gehirnbildern zu einem wichtigen Schritt in den meisten nachgelagerten Analysen geworden, die auf Vorhersagemodellen oder automatisierten Methoden des maschinellen Lernens (ML) für Volumetrie und Diagnose basieren.

Die manuelle Segmentierung von MRT-Scans des Gehirns durch einen ausgebildeten Arzt ist anstrengend und zeitaufwändig und erfordert einen hochqualifizierten Spezialisten, um die Gehirnstrukturen korrekt zu identifizieren. Um diese Probleme zu überwinden, wurden verschiedene automatisierte Techniken entwickelt, die auf Atlas oder Deep-Learning-Techniken (DL) basieren. Obwohl automatisierte Bildsegmentierungsmodelle für das Gehirn Einschränkungen aufweisen15,16, kann FreeSurfer (FS)17 Gehirnstrukturen mit relativ hoher Genauigkeit extrahieren. Daher wurde FS weithin als nicht-DL-automatisierte Segmentierungsmethode übernommen17,18,19,20,21.

Es wurden verschiedene automatisierte Segmentierungsmethoden für Gehirnstrukturen entwickelt, deren Einsatz in der klinischen Praxis jedoch begrenzt ist und typischerweise in einmaligen Studien eingesetzt wird. Dies ist auf den zeitaufwändigen und komplexen Prozess automatisierter Segmentierungsmodelle im Vergleich zu einfachen visuellen Beurteilungen von MRT-Scans des Gehirns durch Ärzte zurückzuführen. Beispielsweise benötigt die automatisierte FS zur Segmentierung mehr als 4,5 Stunden pro Patient, um das in einem MRT-Scan erfasste Gehirn zu segmentieren. Dieses Komplexitätsproblem tritt auf, weil bestehende automatisierte Segmentierungsmethoden eine atlasbasierte Registrierung verwenden22,23,24,25. Tatsächlich erfordert die Darstellung der Segmentierung als atlasbasiertes Registrierungsproblem viel Zeit, und FS muss optimiert werden, um eine Koordinatentransformationsfunktion zu erhalten, die für das interne Atlasmodell jeder Testprobe geeignet ist.

Für den klinischen Einsatz sollte ein automatisiertes Modell zur schnellen Segmentierung und Diagnose ohne den Einsatz komplizierter Methoden entwickelt werden. Obwohl die DL-Segmentierung in verschiedenen Bereichen entwickelt und verwendet wurde, einschließlich der Gehirnsegmentierung26,27,28, gibt es Studien zur Effizienz und Genauigkeit der Segmentierung spezifischer Teile der Gehirn-MRT (z. B. Trennung von Mittelhirn und Pons für die Hirnstamm-Substruktur-Pipeline) spezifischer neurodegenerativer Erkrankungen geht immer noch voran. Im Gegensatz zu bestehenden Nicht-DL-Methoden kann DL die Analysegeschwindigkeit erhöhen, indem die Segmentierung nur mithilfe von Vorwärtsberechnungen auf der Grundlage gelernter Parameter durchgeführt wird, ohne dass Optimierungsprozesse wie Registrierung erforderlich sind. Es ist jedoch schwierig vorherzusagen, ob DL im Vergleich zu Nicht-DL-Methoden einen Leistungsabfall zeigt, insbesondere bei der Segmentierung der Hirn-MRT neurodegenerativer Erkrankungen. Unsere Studie ist von Bedeutung, weil sie die vergleichende Leistung von DL- und Nicht-DL-Methoden bei der Segmentierung der Gehirn-MRT zeigt und sie auf die Diagnose von Parkinson-Erkrankungen anwendet. Mit anderen Worten: Diese Studie ging einen weiteren Schritt, indem sie die Differenzialdiagnose von Parkinson-Erkrankungen anhand der Gehirnsegmentierung durch KI- und Nicht-KI-Modelle zeigte und nicht nur die Leistung der Segmentierung zwischen KI- und Nicht-KI-Modellen wie frühere Studien vergleicht26.

Aktuelle DL-Segmentierungsmodelle werden in die Architekturen Convolutional Neural Network (CNN) und Vision Transformer (ViT) eingeteilt. Dementsprechend wurde in dieser Studie ein repräsentatives Modell jedes Frameworks, V-Net29 und UNet Transformer (UNETR)30, übernommen, um eine volumetrische 3D-Bildsegmentierung durchzuführen. Die DL-Modelle wurden darauf trainiert, Gehirnstrukturen auf MRT-Scans zur Diagnose neurodegenerativer Erkrankungen zu segmentieren, und ihre Leistungen wurden analysiert und mit einem bestehenden Nicht-DL-Modell, FS, verglichen. Sechs Gehirnstrukturen, die für die Klassifizierung von Normal-, Parkinson- und P-Plus-Fällen wichtig sind, wurden segmentiert: Putamen, Pallidum, Mittelhirn, Pons, Caudat und dritter Ventrikel. Die Volumina der segmentierten Bereiche wurden anschließend verwendet, um zwischen Normal-, PD- und P-plus-Fällen zu unterscheiden. Wie in Abb. 1 dargestellt, verglichen wir die Genauigkeit der Krankheitsdifferenzierung und die Segmentierungszeit der DL-Modelle mit denen von FS, die als Referenz (dh Grundwahrheit) für das Training der DL-Segmentierungsmodelle angesehen wurden. Daher lauten die wichtigsten Beiträge unserer Studie aus dieser vergleichenden Analyse wie folgt: (1) Wir zeigen, dass die Goldstandard-DL-Modelle die FS-Inferenzzeit erheblich verkürzen können, ohne die diagnostische Leistung zu beeinträchtigen (Tabelle 1) und die Ergebnisse der Segmentierung von Gehirnteilen erfolgreich reproduzieren können FS bei neurodegenerativen Erkrankungen (Abb. 2), (2) Folglich zeigen wir, dass DL eine weitaus weniger komplexe Segmentierung und vergleichbare automatische Diagnose neurodegenerativer Erkrankungen ermöglicht als der aktuelle Nicht-DL-Ansatz (Tabellen 2 und 3), was eine praktische Anwendung verspricht der DL-basierten MRT-Segmentierung des Gehirns bei der Diagnose oder Untersuchung neurodegenerativer Erkrankungen (z. B. Differenzialdiagnose zwischen PD, P-plus und normalen Fällen).

Überblick über die Studie. Die diagnostische Leistung des Parkinson-Syndroms hinsichtlich Analysezeit und Genauigkeit für die Extraktion und Segmentierung von Gehirnstrukturen wurde zwischen DL-Modellen und FS verglichen. Die Krankheitsdiagnose erfolgte anhand der extrahierten Strukturen einzeln oder umfassend.

Tabelle 1 listet die Zeit auf, die zum Segmentieren der sechs Gehirnstrukturen pro Patient erforderlich ist. Wie im Abschnitt „Segmentierung der Gehirnstruktur: Basislinie mit FS“ erwähnt, verarbeitet das FS nacheinander den Rest der Recon-All-Pipeline und die gesamte Brainstem Substructure-Pipeline. Bei der FS-Segmentierungszeit haben wir die Zeit entfernt, die für die Vorverarbeitung (d. h. das Extrahieren des vom Schädel befreiten Bildes aus der ursprünglichen MRT) benötigt wurde, wie im Abschnitt „Segmentierung der Gehirnstruktur: Basislinie mit FS“ beschrieben. Die resultierende Zeit bietet einen fairen Vergleich der Gesamtzeiten, da FS- und DL-Modelle den Schädel-Streifen-MRT-Scan als Eingabe verwenden, um die endgültigen Segmentierungsergebnisse abzuleiten, die in Tabelle 1 durch fettgedruckte Werte gekennzeichnet sind. Bei Einbeziehung der Vorverarbeitungszeit CNN -basiertes V-Net und ViT-basiertes UNETR waren 14 bzw. 7 Mal schneller als FreeSurfer.

(a) Segmentierungsergebnisse von CNN-basiertem V-Net (linke 3D-Bilder in der ersten Spalte und rot hervorgehobene Bereiche in der zweiten Spalte) und FS (rechte 3D-Bilder in der ersten Spalte und blau hervorgehobene Bereiche in der zweiten Spalte) für jede Gehirnstruktur . (b) Segmentierungsergebnisse von ViT-basiertem UNETR (linke 3D-Bilder in der ersten Spalte und rot hervorgehobene Bereiche in der zweiten Spalte) und FS (rechte 3D-Bilder in der ersten Spalte und blau hervorgehobene Bereiche in der zweiten Spalte) für jede Gehirnstruktur.

Zum Vergleich mit der FS-Verarbeitungszeit haben wir die Zeit für die CPU-Nutzung in DL-Modellen hinzugefügt. Das CNN-basierte V-Net und das ViT-basierte UNETR sind erheblich schneller als FS. Im Durchschnitt benötigte V-Net 3,48 s, um die sechs Gehirnstrukturen zu segmentieren, und UNETR benötigte 48,14 s mit der GPU und 51,26 s bzw. 1101,82 s mit der CPU, während FS mit der CPU etwa 15.735 s benötigte, was etwa 307 und 14 Mal langsamer als V ist -Net bzw. UNETR. Trotz Berechnung der Zeit mithilfe der CPU waren die DL-Modelle 14- bis 300-mal schneller als FS. Nicht nur GPU-basierte DL-Modelle, sondern auch CPU-genutzte DL-Modelle zeigten im Vergleich zur Nicht-KI-Methode (d. h. FS) eine signifikante Leistung.

Die Segmentierungs- und Vorhersageergebnisse von V-Net, UNETR und FS sind in Abb. 2 dargestellt. Der Dice-Score wurde ermittelt (Ergänzungstabelle S1), um die Leistung der 3D-Bildsegmentierung zu bewerten. Die CNN- und ViT-basierten Modelle zeigten für alle Gehirnstrukturen hohe Dice-Werte über 0,85. Die Dice-Werte waren für das Mittelhirn und die Pons höher als für die Basalganglien (d. h. Caudat, Putamen, Pallidum), möglicherweise weil die Hirnstämme von Liquor cerebrospinalis umgeben sind und einen stärkeren Kontrast für eine genaue Segmentierung bieten. Das ViT-basierte Modell zeigte einen höheren Dice-Score als das CNN-basierte Modell, das wiederum eine viel kürzere Segmentierungszeit als das ViT-basierte Modell zeigte (z. B. 51,26 s für V-Net und 1101,82 s für UNETR, wie in gezeigt). Tabelle 1). Obwohl wir V-Net und UNETR in unterschiedlichen Entwicklungsumgebungen von TensorFlow bzw. PyTorch evaluiert haben, gehen wir davon aus, dass das CNN-basierte V-Net hinsichtlich der Geschwindigkeit mit dem ViT-basierten UNETR konkurrenzfähig sein wird, da der Unterschied in der Segmentierungsgeschwindigkeit mindestens zehnmal beträgt unsere Experimente. Darüber hinaus wies das CNN-basierte V-Net bei der tatsächlichen Krankheitsklassifizierung eine ähnliche Leistung wie das ViT-basierte UNETR auf, wie in Tabelle 2 aufgeführt.

Unter Verwendung der geschätzten Volumina führten wir eine binäre Klassifizierung für Fälle normal vs. P-plus, normal vs. PD und PD vs. P-plus durch, wobei P-plus PSP-, MSA-P- und MSA-C-Fälle umfasste. Die AUCs der Gehirnstrukturen für jedes Modell wurden verglichen, wie in Tabelle 2 aufgeführt, die auch die AUC des Verhältnisses von Mittelhirn zu Pons darstellt31.

Unter den 98 Fällen (7 Fälle binärer Klassifizierung × 2 DL-Modelle × 7 Fälle Gehirnstrukturen) gab es keinen signifikanten Unterschied in der AUC zwischen den DL-Modellen und FS, mit Ausnahme von 11 Fällen (d. h. Fälle, in denen der p-Wert beträgt). kleiner als 0,05). In mehr als der Hälfte der 11 Fälle (d. h. 7 Fälle) waren die AUCs der DL-Modelle (d. h. CNN-basiertes V-Net und ViT-basiertes UNETR) ebenfalls nicht geringer als die von FS. Dieses Ergebnis zeigte, dass das DL-Modell die Leistung des FS-Modells erfolgreich reproduziert (dh eine ähnliche Leistung wie das FS erzielt). Darüber hinaus zeigten die meisten Fälle des CNN-basierten V-Net keine niedrigere AUC für die Krankheitsklassifizierung als die Fälle des ViT-basierten UNETR.

Die höchsten AUCs im Vergleich zwischen den Methoden waren bei Normal oder PD vs. MSA-C (0,91–0,94) höher als bei Normal oder PD vs. PSP (0,75–0,89). Unter den Gehirnstrukturen zeigte das Mittelhirn-zu-Pons-Verhältnis die beste Leistung bei normalem vs. MSA-C und PD vs. MSA-C, während der dritte Ventrikel und das Pallidum die beste Leistung bei normalem vs. PSP und PD vs. PSP. Die höchsten AUCs unterschieden sich nicht signifikant in der Klassifizierung „normal“ oder „PD“ gegenüber MSA-P (0,69–0,73) oder „PD“ (0,63).

Die meisten AUCs der DL-Modelle unterschieden sich nicht wesentlich von denen von FS, wie in Tabelle 3 aufgeführt, obwohl ein erheblicher Unterschied in der Segmentierungsgeschwindigkeit zwischen den Modellen und FS bestand, wie in Tabelle 1 aufgeführt. In Tabelle 3 ist die höchste AUC von FS- und DL-Modelle für jede binäre Klassifizierung sind fett gedruckt. Die höchsten AUCs der Klassifizierung zwischen PD vs. P-plus und normal vs. P-plus waren in beiden DL-Modellen höher als 0,8, mit Ausnahme von PD vs. MSA-P (AUC > 0,76). Bei allen höchsten AUCs gab es keinen signifikanten Unterschied zwischen FS- und DL-Modellen (p-Wert von 0,05 oder höher).

Tabelle 3 zeigt, dass von den 28 Fällen (2 ML-Modelle × 2 DL-Modelle × 7 binäre Klassifizierungen) die meisten Fälle (dh 24 Fälle) keine signifikanten Unterschiede zum FS aufwiesen (dh mit p-Werten über 0,05), was den Erfolg beweist Reproduzierbarkeit der Leistung von FS durch DL-Modelle. Wie in Tabelle 2 aufgeführt, erzielte das CNN-basierte V-Net eine bessere AUC als das ViT-basierte UNETR; In 9 der 14 Fallpaare übertraf das CNN-basierte V-Net das ViT-basierte UNETR. Anhand der Ergebnisse von LR und XGBoost bestätigen wir, dass die Berücksichtigung aller sechs Gehirnstrukturen (Tabelle 3) zu einer deutlich höheren AUC führte als bei Berücksichtigung der einzelnen Strukturen (Tabelle 2).

Wir haben zwei DL-Modelle entwickelt, V-Net und UNETR, die eine deutlich schnellere Gehirnsegmentierung als FS und eine vergleichbare Genauigkeit zeigten. Unsere DL-Modelle verkürzten die Segmentierungszeit im Vergleich zu FS um das 14- bis 300-fache. Darüber hinaus zeigten sie eine robuste und hohe Leistung bei der Differentialdiagnose zwischen PD- und P-plus-Fällen unter Verwendung des Volumens segmentierter Gehirnstrukturen. Die DL-Modelle waren effizient (d. h. Analysegeschwindigkeit 14 bis 300 Mal schneller als FS) und effektiv (d. h. vergleichbar mit FS in Dice Score und AUC) bei der automatisierten Gehirnsegmentierung und Krankheitsdiagnose, selbst für die gleichzeitige Analyse aller Gehirnstrukturen und ihrer individuelle Analysen. Somit können die vorgeschlagenen DL-Modelle die Anwendung der automatisierten Gehirnsegmentierung in der klinischen Praxis fördern und eine effiziente und genaue Gehirnforschung in der Medizin erleichtern.

Automatisierte Werkzeuge wurden in der klinischen Praxis kaum für die Gehirnsegmentierung eingesetzt, trotz ihrer hohen Genauigkeit bei der Differentialdiagnose von Patienten mit Parkinsonismus13,16. Dies ist vor allem auf den komplizierten und zeitaufwändigen Prozess der automatisierten Gehirnsegmentierung im Vergleich zur qualitativen visuellen Beurteilung von MRT-Scans des Gehirns durch Ärzte zurückzuführen. Folglich wurden automatisierte Segmentierungsmodelle hauptsächlich in Forschungsumgebungen verwendet, die quantitative Gehirnmessungen erfordern. Dennoch könnte ihre Anwendung im klinischen Umfeld mit unseren DL-Modellen zunehmen, die eine viel schnellere Segmentierung als FS mit ähnlicher Genauigkeit gezeigt haben. Die DL-Modelle können dazu beitragen, die Genauigkeit der klinischen Diagnose von PD- oder P-plus-Fällen zu verbessern, indem sie eine präzise Analyse der Gehirnbilder ermöglichen. Darüber hinaus können klinische Studien, die quantitative Gehirnmessungen an einer großen Population erfordern, bequem mit unseren schnellen und genauen DL-Modellen durchgeführt werden. In der Vergangenheit waren Methoden zur Gehirnbildanalyse selbst mit einem automatisierten Segmentierungstool wie FS zeit- und ressourcenaufwändig.

Während V-net und UNETR sowohl in der CPU als auch in der GPU eine deutlich schnellere Segmentierung mit zufriedenstellender Genauigkeit zeigten, könnte das CNN-basierte V-Net in klinischen Umgebungen besser für die Diagnose auf der Grundlage der Volumetrie von MRT-Scans des Gehirns geeignet sein. Beachten Sie, dass die Zeit aus Gründen der Fairness der Zeitmessung ohne die Vorverarbeitungszeit berechnet wurde. Die Segmentierungszeit von FreeSurfer entspricht der Zeit, die bei der registrierungsbasierten Segmentierung für die Recon-All-Pipeline und die Brainstem-Substrukturen-Pipeline benötigt wird (ergänzende Abbildung S1). Selbst wenn die Vorverarbeitungszeit berechnet wird, waren CNN-basiertes V-Net und ViT-basiertes UNETR 14 bzw. 7 Mal schneller als FreeSurfer. Obwohl das ViT-basierte UNETR das neueste DL-Modell ist und einen hohen Dice-Score aufweist, ist die Anzahl der Trainingsparameter etwa 46-mal größer als die von V-Net. Wie in Tabelle 1 dargestellt, kann die Nutzung der CPU um das 14- bis 22-fache länger dauern. Es ist jedoch offensichtlich, dass die Verarbeitungszeit von DL-Modellen im Vergleich zur FS-Segmentierungszeit schneller ist und die gleiche Leistung wie FS aufweist. Da die Anzahl der Berechnungen mit der Anzahl der trainierbaren Parameter zunimmt, steigen auch die Hardwareanforderungen in Bezug auf den Speicher der Grafikprozessoreinheit (GPU) und die Verarbeitungsleistung. Folglich kann das ViT-basierte UNETR erhebliche Anforderungen an Training und Evaluierung stellen und eine hochspezifizierte GPU erfordern. Das CNN-basierte V-Net zeigte eine im Allgemeinen höhere AUC als die von UNETR und niedrigere Dice-Scores. Bis die ViT-Leistung weiter verbessert wird, scheint das CNN-basierte V-Net, das weniger GPU-Ressourcen verbraucht, die beste Option für die klinische Praxis zu sein.

Unter Verwendung von auf maschinellem Lernen basierenden Goldstandard-Ansätzen haben wir die AUC der Diagnose basierend auf der Segmentierung von FreeSurfer und der Segmentierung der DL-Methode gezeigt, um zu zeigen, dass es keinen signifikanten Unterschied zwischen den Segmentierungsergebnissen von FreeSurfer und den DL-Modellen gibt. Da unsere DL-Modelle 14- bis 300-mal schneller als FS sind, ohne dass die diagnostische Leistung darunter leidet, sind sie FS hinsichtlich der klinischen Wirksamkeit überlegen. Bei der binären Klassifizierung unter Verwendung einzelner Gehirnstrukturen stimmte die relative Reihenfolge der AUC jeder Gehirnstruktur mit zuvor berichteten Ergebnissen überein10,32. Beispielsweise zeigten die Pons und das Mittelhirn-zu-Pons-Verhältnis die höchste AUC bei der Klassifizierung normaler vs. MSA-C- und PD vs. MSA-C-Fälle. Der dritte Ventrikel und das Pallidum zeigten die höchste AUC bei der Klassifizierung normaler vs. PSP- und PD vs. PSP-Fälle. Das Putamen zeigte die höchste AUC bei der Klassifizierung von PD- und MSA-P-Fällen. Bei der Klassifizierung von PD- und PSP-Fällen zeigte der dritte Ventrikel eine höhere AUC, wohingegen das Mittelhirn eine relativ niedrigere AUC aufwies. Einzelne Messungen des Mittelhirns konnten PSP nicht von PD oder MSA unterscheiden33,34,35, obwohl klassische MRT-Studien ein atrophisches Mittelhirn bei PSP zeigten7,11. Andererseits hat sich gezeigt, dass der dritte Ventrikel ein zuverlässiger Marker für die Diagnose von PSP im Frühstadium bei Parkinson und PSP im Spätstadium ist36 und er wurde zu einer neuen Version des Magnetresonanz-Parkinsonismus-Index37 hinzugefügt.

Für die binäre Klassifizierung basierend auf allen sechs Gehirnstrukturen wurden in allen Modellen signifikante Verbesserungen der AUC erzielt. In beiden DL-Modellen lag die höchste AUC der Klassifizierung von PD vs. P-plus- und normalen vs. P-plus-Fällen über 0,8, mit Ausnahme der PD vs. MSA-P-Fälle. Die relativ niedrige AUC der Klassifizierung zwischen PD- und MSA-P-Fällen basierend auf Hirn-MRT-Fällen wurde auch in früheren Studien berichtet10,32. Die Einschränkung der klinischen Diagnose könnte aufgrund der überlappenden Manifestationen zwischen PD- und MSA-P-Fällen zu den relativ niedrigen AUCs in diesen Studien beigetragen haben. Es wurde berichtet, dass die klinische Diagnose von PSP und MSA-P selbst bei Berücksichtigung diagnostischer Kriterien am häufigsten von der durch Autopsie bestätigten Diagnose abweicht38. Es wurde kein signifikanter Unterschied in den MRT-Scans des Gehirns zwischen Normal- und PD-Fällen gefunden, was zu keinen signifikanten AUC-Unterschieden für die Klassifizierung zwischen diesen Fällen führt.

Unsere Studie weist einige Einschränkungen auf. Erstens wurden die Diagnosen PD, PSP und MSA-C nicht pathologisch bestätigt. Stattdessen stellten Bewegungsspezialisten klinische Diagnosen auf der Grundlage eines validierten klinischen Konsenses und lieferten nur wahrscheinliche Diagnosen. Zweitens segmentierten wir sechs Gehirnstrukturen, nämlich Mittelhirn, Pons, Medulla, Putamen, Pallidum und dritter Ventrikel, ließen aber andere Gehirnstrukturen außer Acht, die unterschiedliche pathologische Merkmale zwischen PD und P-plus widerspiegeln könnten (z. B. Kleinhirn, mittlerer Kleinhirnstiel). . Wir haben diese Strukturen aufgrund der geringen Segmentierungsgenauigkeit von FS ausgeschlossen. Außerdem lernen DL-Methoden die groben Merkmale vorrangig, da sie den gemeinsamen Bereich der Trainingsdaten darstellen, bei denen es sich um Bereiche mit niedriger Frequenz handelt. Dies führt zu einem glatteren Bild als bei FS und mildert die geringfügigen Bildartefakte an den Außenrändern. Im Fall des Kleinhirns, bei dem kleinere Veränderungen wesentlich sind, sind jedoch spezifischere Untersuchungen erforderlich, um herauszufinden, ob unsere DL-Methoden auf die Segmentierung der kleinen Gyri des Kleinhirns anwendbar sind und sie mit der manuellen Segmentierung des Kleinhirns vergleichen. Dennoch wurde berichtet, dass die Differenzialdiagnose von P-plus, bei der nur die in dieser Studie berücksichtigten Gehirnstrukturen verwendet wurden, zuverlässig ist31. Drittens haben wir aufgrund von Speicherbeschränkungen die Ausgabeform von \(256 \times 256 \times 256\) auf \(256 \times 256 \times 128\) verkleinert, was möglicherweise zu einem Informationsverlust geführt hat. Dennoch deuten die Dice-Scores auf eine vernachlässigbare Auswirkung des Informationsverlusts hin, wohingegen die Verwendung einer herunterskalierten Eingabe das Training und die Schlussfolgerung in DL-Modellen beschleunigt. Viertens unterstützt FreeSurfer keine GPU (dh CUDA) für die Segmentierung, was es schwierig macht, die Zeit zwischen DL-Modellen zu vergleichen. Wir haben die Segmentierungszeit mithilfe der CPU berechnet und sind dennoch zu dem Schluss gekommen, dass DL-Modelle um das 14- bis 300-fache schneller sind.

Die automatisierte Segmentierung von MRT-Scans des Gehirns hat sich zu einer einflussreichen Methode zur Diagnose neurodegenerativer Erkrankungen, einschließlich Bewegungsstörungen, entwickelt. Mit den leistungsstarken CNN- und ViT-basierten Modellen konnten wir die Segmentierungszeit tiefer Hirnstrukturen deutlich verkürzen und dabei eine mit der herkömmlichen FS-Segmentierung vergleichbare Genauigkeit erzielen. Trotz der überlegenen DL-Leistung wurden bisher keine quantitativen Ergebnisse der vergleichenden Analyse und Bewertung der Leistung von DL für die Differentialdiagnose neurodegenerativer Erkrankungen, einschließlich PD und P-plus, gemeldet. Wir haben festgestellt, dass das kostengünstige CNN-basierte Modell im Vergleich zum neuesten ViT-basierten Modell sowohl bei der Segmentierung als auch bei der Differentialdiagnose eine zufriedenstellende Leistung erzielt. Unsere DL-Modelle können zur Entwicklung patienten- und klinikfreundlicher Segmentierungsmethoden beitragen, die eine schnelle und genaue Diagnose ermöglichen und eine aussagekräftige Referenz für Krankenhäuser darstellen, die die Einführung der DL-Gehirnsegmentierung und -Diagnose für neurodegenerative Erkrankungen planen.

Diese Studie konzentriert sich auf den Vergleich, ob KI bei der Diagnoseleistung effektiver ist als die bestehende repräsentative Nicht-KI-Methode. Da das Thema dieser Studie der Vergleich von Techniken ist, wurde in dieser Studie kein Vergleich mit Klinikern durchgeführt. Es wäre eine vielversprechende zukünftige Studie, die Genauigkeit der Diagnose zwischen maschinellen Lernmethoden und Ärzten zu vergleichen.

In diesem Abschnitt beschreiben wir die Gehirn-MRT-Daten (Abschnitt „Datenvorbereitung“), die FS-Implementierung (Abschnitt „Gehirnstruktursegmentierung: Basislinie mit FS“) und die DL-Methodenimplementierung (Abschnitt „DL-Modelle für die Gehirnstruktursegmentierung“) volumetrische Analyse wichtiger Gehirnstrukturen zur Diagnose neurodegenerativer Erkrankungen. Abbildung 1 zeigt einen Überblick über den Studienprozess unter Berücksichtigung der Bewertung und Vergleiche zwischen FS- und DL-Modellen (d. h. modifiziertes V-Net und UNETR, die CNN- bzw. ViT-DL-Architekturen darstellen). Ergänzende Abbildung S1 zeigt ein Diagramm des Gesamtleistungsvergleichs. Wir haben DL-Modelle mit schnellerer Verarbeitung, aber ähnlicher Segmentierungsleistung wie FS entwickelt. Die DL-Modelle wurden darauf trainiert, die Ergebnisse von FS für jede Gehirnstruktur \(F_i \in [0,1]^{256 \times 256 \times 128}\) als Modellausgabe \(V_i \in [0, 1]^{256 \times 256 \times 128}\), indem ein vom Schädel befreites Gehirnbild \(I \in \mathbb {R}^{256 \times 256 \times 128}\) als Eingabe verwendet wird (\(i \ in \{pallidum, \, putamen, \, caudatus, \, dritter \, Ventrikel, \, Mittelhirn, \, pons \}\)), mit Auflösung (h, w, d) (Höhe \(h=256\) ), Breite \(w=256\), Tiefe \(d=128\)). Die DL-Segmentierungsergebnisse für die sechs Gehirnstrukturen wurden als 3D-Binärmasken gespeichert (\(F_i\) und \(V_i\) geben die FS- bzw. DL-Modellmasken für die Gehirnstruktur i an), wobei jede Maskenausgabe Intensitäten dazwischen enthielt 0 und 1 (Bereich außerhalb bzw. innerhalb der Zielhirnstruktur). Durch Berechnung des absoluten Volumens jeder oder aller durch FS- oder DL-Modelle vorhergesagten Gehirnstrukturen führten wir eine binäre Klassifizierung von PD, MSA-C, MSA-P, PSP und Normalfällen durch und berechneten die Fläche unter der Kurve (AUC). der Segmentierung.

Alle Autoren dieser Studie bestätigen, dass alle Methoden oder Experimente in Übereinstimmung mit der Deklaration von Helsinki und den relevanten Richtlinien und Vorschriften der Richtlinien der Nature Portfolio-Zeitschriften durchgeführt wurden. Diese Studie wurde vom Institutional Review Board des Samsung Medical Center genehmigt (IRB-Nummer: SMC 2021-07-026). Das Institutional Review Board des Samsung Medical Center verzichtete auf die schriftliche Einverständniserklärung der Patienten, da wir anonymisierte und retrospektive Daten verwendeten.

Wir haben zwischen Januar 2017 und Dezember 2020 retrospektiv Patienten aus der Abteilung für Neurologie des Samsung Medical Center untersucht. In diese Studie wurden Patienten einbezogen, bei denen PD, wahrscheinlich MSA oder wahrscheinlich PSP diagnostiziert wurde. Die Diagnose für jeden Patienten wurde von Spezialisten für Bewegungsstörungen auf der Grundlage der folgenden Kriterien festgelegt: PD wurde gemäß den Brain Bank-Kriterien der United Kingdom PD Society39 unter Verwendung von [18F] N-(3-Fluorpropyl)-2β-Kohlenstoffethoxy-3β-( 4-Iodphenyl)-Nortropan-Positronenemissionstomographie, während wahrscheinliches MSA und PSP gemäß der zweiten Konsensdiagnose von MSA40 bzw. den klinischen Diagnosekriterien der Movement Disorder Society für PSP41 diagnostiziert wurden. MSA-Fälle wurden nach Erreichen eines Konsenses weiter als MSA-P oder MSA-C klassifiziert40. Patienten mit begleitenden oder strukturellen Hirnläsionen, einschließlich Schlaganfall und Tumoren, die sich auf die MRT-Untersuchungen des Gehirns auswirken können, wurden von der Studie ausgeschlossen. Als Kontrollgruppe wurde eine altersentsprechende gesunde ältere Bevölkerung einbezogen. Demografische Informationen zu Alter, Geschlecht und Krankheitsdauer bis zur MRT-Untersuchung des Gehirns wurden gesammelt, wie in Tabelle 4 aufgeführt. Wir analysierten die Daten von 411 Personen und führten eine dreifache Kreuzvalidierung durch, um die DL-Modelle zu trainieren und zu bewerten. Jede Gruppe bestand aus 105 gesunden Kontrollpersonen und 105 PD-, 69 PSP-, 69 MSA-C- und 63 MSA-P-Fällen.

Wir haben zur Auswertung eine Kreuzvalidierung mit drei Außenfalten angewendet, um Verzerrungen in den Validierungs- und Testsätzen zu mildern und die Auswirkung der Satzzusammensetzung (Kombinationen von Fällen in Gruppen) zu analysieren. Die Daten wurden nach dem Zufallsprinzip in drei Abschnitte unterteilt, einen zum Testen und zwei für das Training. Jede Gruppe umfasste 35 normale, 35 PD-, 23 PSP-, 23 MSA-C- und 21 MSA-P-Fälle.

Axiale MRT-Scans des Gehirns wurden unter Verwendung eines Standardprotokolls für die durch T1-Magnetisierung vorbereitete schnelle Erfassung von Gradientenechos mit einer Wiederholungs-/Echozeit von 11.000/125 ms, einer Umkehrzeit von 2.800 ms, einem Sichtfeld von 240 mm und einer Erfassungsmatrixgröße von \(320 \times 249\), Echozuglänge von 27, 1 Signaldurchschnitt, Schichtdicke von 5 mm, Zwischenschichtabstand von 1,5 mm und Scanzeit von 198 s.

Wir haben sechs Gehirnstrukturen einbezogen, die an Parkinson-Syndromen in der grauen Substanz beteiligt sind, nämlich Mittelhirn, Pons, Putamen, Pallidum, Caudat und dritter Ventrikel. Es wird berichtet, dass diese Bereiche die höchste Sensitivität und Spezifität für die Differenzierung von Parkinson-Syndromen aufweisen13,16. Die Größe der MRT-Scans wurde auf \(256 \times 256 \times 128\) geändert (dh die Anzahl der Schichten in der koronalen/sagittalen/axialen Ebene), um jede Struktur zu segmentieren.

Die FS akzeptiert Dateien von Digital Imaging and Communications in Medicine (DICOM) oder Neuroimaging Informatics Technology Initiative (NIfTI) als Eingaben. DICOM ist ein überzeugendes und flexibles, aber komplexes Format, das Interoperabilität zwischen mehreren Hardware- und Softwaretools bietet. Aufgrund seiner Komplexität wurde das DICOM-Format in das NIfTI-Format konvertiert42. NIfTI ist ein einfacheres Format als DICOM und bewahrt die wesentlichen Metadaten. Darüber hinaus verwaltet es das Volumen als einzelne Datei und verwendet Rohdaten nach einem einfachen Header, und NIfTI-Dateien können für Bilder des gesamten Gehirns schneller geladen und verarbeitet werden als DICOM-Dateien. Daher haben wir Dateien im Gehirn-MRI-DICOM-Format mithilfe von MRIcroGL in Dateien im NIfTI-Format konvertiert.

Die Extraktion von Gehirnstrukturen, die mithilfe einer atlasbasierten automatisierten Segmentierung gewonnen wurden, ist für das Training und die Validierung erforderlich, bevor ein automatisiertes DL-Segmentierungsmodell erstellt werden kann. In dieser Studie haben wir diese Ergebnisse als DL-Ground-Truth-Labels verwendet und die Gültigkeit des DL-Modells zur Generierung desselben Labels bewertet. Als repräsentative Technologie für die atlasbasierte automatisierte Segmentierung (siehe Einzelheiten im ergänzenden Abschnitt A.2) haben wir FS (Version 7.2) ausgewählt, das für die neurowissenschaftliche Forschung öffentlich verfügbar ist und eine hohe Segmentierungsleistung bietet18,19,20,21,43, 44. Darüber hinaus unterstützt FS CUDA nicht mehr und kann daher die Zeit nicht mithilfe der GPU berechnen.

Um die sechs Gehirnstrukturen mithilfe von FS zu segmentieren und zu extrahieren, werden nacheinander die Recon-All45-Pipeline und die Brainstem Substructure Pipeline46 ausgeführt. Wir haben beide Pipelines verwendet, da die Recon-All-Pipeline die Segmentierung von Hirnstammstrukturen (z. B. Pons und Mittelhirn) nicht unterstützt. Da die Brainstem Substructure-Pipeline jedoch vorverarbeitete Eingaben von der Recon-All-Pipeline erhält, sollten beide Pipelines ausgeführt werden. Daher kann die Extraktion der sechs Gehirnstrukturen durch FS in die Vorverarbeitung des MRT-Scans in der Recon-All-Pipeline und die verbleibende Segmentierung der Recon-All-Pipeline zusammen mit der Segmentierung in der Brainstem Substructure-Pipeline unterteilt werden. Diese Prozesse werden im Abschnitt „Datenaufbereitung“ und im Abschnitt „Segmentierung der Gehirnstruktur: Basislinie mit FS“ erläutert.

Die Vorverarbeitung des MRT-Scans in der Recon-All-Pipeline von FS besteht hauptsächlich aus (1) Bewegungskorrektur, (2) Normalisierung und (3) Schädelentfernung. Wenn verschiedene Quellvolumina verwendet werden, wird vor der Mittelwertbildung eine Bewegungskorrektur durchgeführt, um kleine Bewegungsschwankungen zwischen den Volumina auszugleichen. FS erstellt kortikale Oberflächenmodelle und die Grenze zwischen weißer und kortikaler grauer Substanz, um mithilfe von Software automatisch die Gehirnbilder von Patienten abzugleichen17. Zusätzlich wird eine Intensitätsnormalisierung auf das Originalvolumen angewendet. Allerdings kann die Anpassung an Intensitätsschwankungen die intensitätsbasierte Segmentierung behindern. Stattdessen skalieren wir die Intensitäten aller Voxel auf den Mittelwert (110) der weißen Substanz.

Nach der Korrektur der Bewegungen und der Normalisierung der Daten entfernt FS den Schädel und stellt den vom Schädel befreiten MRT-Scan des Gehirns bereit. Die Entfernung intrakranieller Hirnhöhlen (z. B. Haut, Fett, Muskeln, Hals und Augäpfel) kann die Variabilität menschlicher Beurteiler verringern47, die automatisierte Bildsegmentierung des Gehirns fördern und die Analysequalität verbessern. Daher sollten MRT-Scans des Gehirns vorverarbeitet werden, um das Gehirn in einem Prozess, der als „Skull Stripping“ bekannt ist, von extrakraniellen oder nichthirnigen Geweben zu isolieren48. FS-Entwickler haben interne automatisierte Schädelentfernungsalgorithmen entwickelt und angewendet, um intrakranielle Hohlräume standardmäßig zu isolieren.

In dieser Studie dauerten die Schritte der Vorverarbeitung des MRT-Scans des Gehirns (z. B. Schädelentfernung mit Bewegungskorrektur und Normalisierung eines MRT-Scans des Gehirns) etwa 20 Minuten. Wir haben die endgültigen, vom Schädel befreiten Bilder in NIfTI-Dateien mit einer Größe von (256 x 256 x 128) konvertiert, während der ursprüngliche MRT-Scan des Gehirns eine Größe von (256 x 256 x 256) hatte angepasst für einen effizienten Vergleich mit den DL-Modellen.

Nach der Vorverarbeitung (Abschnitt „Segmentierung der Gehirnstruktur: Basislinie mit FS“) segmentiert FS die sechs Gehirnstrukturen, indem es die verbleibenden Prozesse der Recon-All-Pipeline und der vollständigen Brainstem Substructure-Pipeline anwendet. Nach der Schädelentfernung läuft die registrierungsbasierte Segmentierung wie folgt ab. FS bestimmt und verfeinert die Schnittstellen der weißen und grauen Substanz für beide Hemisphären. Dann sucht FS nach dem Rand der grauen Substanz, der die Pialoberfläche darstellt. Mit Pialoberflächen dehnt sich FS aus und bläst Sulci-Bänke und Gyri-Kämme auf. Anschließend dehnt es sich wieder zu einer Kugel aus und parzelliert die Kortikalis. Nach der Anwendung dieser Prozesse segmentiert FS das Gehirn. Die Recon-All-Pipeline umfasst einige Gehirnstrukturen (z. B. Putamen, Caudat, Pallidum und dritter Ventrikel), während die Brainstem Substructure-Pipeline das Mittelhirn und die Pons segmentiert.

In dieser Studie wurde das endgültige Segmentierungsergebnis mit der gleichen Eingabegröße von \(256 \times 256 \times 128\) bewertet. Die ursprüngliche Größe des Segmentierungsergebnisses betrug \(256 \times 256 \times 256\), wurde jedoch zum Vergleich mit den DL-Modellen auf \(256 \times 256 \times 128\) angepasst. Darüber hinaus haben wir FS durch ein DL-Modell ersetzt, das auf den vom Schädel befreiten MRT-Scan (dh das Vorverarbeitungsergebnis der Recon-All-Pipeline) angewendet wurde, um eine Segmentierung durchzuführen. Für den Ersatz haben wir bewertet, ob die DL-Analyse schneller ist als die FS-Analyse und ob das Segmentierungsergebnis von DL im Vergleich zu dem von FS ausreichend reproduzierbar ist. Die Unterschiede zwischen FS- und DL-Segmentierung sind in Abb. 2 dargestellt.

In dieser Studie haben wir DL-Modelle und FS verwendet, um dieselben Schädel-entfernten Bilder zu segmentieren (d. h. Bilder, die von der FS-Recon-All-Pipeline vorverarbeitet wurden, wie im Abschnitt „Segmentierung der Gehirnstruktur: Basislinie mit FS“ beschrieben). Die ursprüngliche Größe des von FS erzeugten Bildes ohne Schädel wurde auf (256 x 256 x 256) für die DL-Segmentierung aufgrund des begrenzten GPU-Speichers angepasst. Wir haben die Leistung und Analysezeit der DL-Modelle bewertet und verglichen, indem wir den Segmentierungsprozess von FS nach der Schädelentfernung durch DL ersetzt haben. FS ist möglicherweise ineffizient, da es das gesamte Gehirnbild segmentiert und viele Stunden Verarbeitung erfordert. Tatsächlich benötigt FS mindestens 4,5 Stunden, um die sechs in dieser Studie berücksichtigten Gehirnstrukturen zu segmentieren, da eine atlasbasierte Registrierung erforderlich ist, um die Koordinaten des gesamten MRT-Scans in die Segmentierung spezifischer Gehirnstrukturen umzuwandeln. Folglich kann FS die Verarbeitungszeit auch dann nicht nennenswert verkürzen, wenn nur sechs Gehirnstrukturen segmentiert würden. Andererseits haben wir überprüft, dass die DL-Segmentierung (z. B. mit V-Net oder UNETR) pro Fall weniger als 1 bis 18 Minuten dauert, um die sechs Zielhirnstrukturen zu segmentieren. Da DL-Modelle im Gegensatz zu nicht-künstlichen Intelligenzmethoden (z. B. FS) keine komplexe Registrierung erfordern, können sie die Verarbeitungseffizienz erheblich steigern. Die Implementierungsdetails der DL-Modelle werden hier beschrieben. Als DL-Modelle haben wir das CNN-basierte V-Net29 und das ViT-basierte UNETR30 übernommen und dabei die von FS bereitgestellten Segmentierungsergebnisse als Beschriftungen verwendet (Abschnitt „Segmentierung der Gehirnstruktur: Basislinie mit FS“). Die beiden Modelle wurden darauf trainiert, die FS-Segmentierung zu reproduzieren.

Architektur der CNN-basierten 3D-Segmentierung mit V-Net. ResBlock, MaxPooling und UpConvolution wurden verwendet, um Tiefe, Höhe und Breite zu reduzieren. Die in der Abbildung gezeigte Ausgabe ist die Segmentierung von Pallidum. (Conv-Faltungsschicht, BN-Batch-Normalisierung).

V-Net wurde verwendet, um ein ganzes Volumen zu segmentieren, nachdem ein End-to-End-CNN auf MRT-Volumina zur Darstellung der Prostata trainiert wurde.29,49,50 Die Architektur von V-Net ist V-förmig, wobei sich der linke Teil des Netzwerks befindet einen Komprimierungspfad, während der rechte Teil die Features dekomprimiert, bis die ursprüngliche Eingabegröße wiederhergestellt ist. Der linke Teil des Netzwerks ist in Stufen unterteilt, die mit unterschiedlichen Auflösungen arbeiten.

In dieser Studie wurden in jedem Schritt ein bis drei Faltungsschichten verwendet. Auf jeder Ebene wurde eine Restfunktion gelernt. Die Eingabe des Restteils wurde in den Faltungsschichten und nichtlinearen Operationen verwendet. Diese Ausgabe wurde der letzten Faltungsschicht der Stufe hinzugefügt. Als nichtlineare Aktivierungsfunktion wurde die gleichgerichtete lineare Einheit (ReLU) verwendet. Im gesamten Komprimierungspfad wurden Faltungen angewendet. Der rechte Teil des Netzwerks lernte eine Restfunktion ähnlich der des linken Teils. V-Net hat vielversprechende Segmentierungsergebnisse gezeigt und die Verwendung dieses Modells in unserer Anwendung verbesserte die Leistung. Das Modell wurde entsprechend dem verfügbaren Speicher angepasst. Die vorgeschlagene Architektur ist in Abb. 3 dargestellt. Im linken Teil wurden ein Restblock (ResBlock) und maximales Pooling (MaxPooling) verwendet. ResBlock wurde auf alle Blöcke mit einer Eingabegröße von \(256 \times 256 \times 128\) angewendet. Andererseits reduzierte 3D MaxPooling die Tiefe, Höhe und Breite der Feature-Maps, um deren Auflösung zu verringern. Der rechte Teil verwendete ebenfalls ResBlock, ersetzte jedoch MaxPooling durch UpConvolution, das aus 3D-Upsampling, Batch-Normalisierung, ReLU-Aktivierung und Faltungsschichten (\(5 \times 5\times 5\)-Filter, gleiche Auffüllung und Schrittweite von 1) bestand. Upsampling erhöhte die Auflösung der Feature-Maps und Batch-Normalisierung verbesserte die Konvergenz im gesamten Netzwerk51.

Architektur von ViT-basiertem UNETR, das über Skip-Verbindungen mit unterschiedlichen Auflösungen zur Segmentierung direkt mit einem CNN-basierten Decoder verbunden ist. (Deconv-Entfaltungsschicht, Conv-Faltungsschicht, BN-Batch-Normalisierung, MLP-Mehrschichtperzeptron).

UNETR30 ist eine Transformatorarchitektur für die 3D-Segmentierung medizinischer Bilder. Es gibt eine Studie, in der UNETR zur Segmentierung von Hirntumoren verwendet wurde52, es wurde jedoch keine Studie zur Segmentierung von Gehirnteilen durchgeführt. Es verwendet einen Transformator als Encoder, um die Sequenzdarstellungen des Eingangsvolumens zu lernen und globale Multiskaleninformationen zu erfassen, während U-förmige Architekturen für den Encoder und Decoder übernommen werden. Die vorgeschlagene Architektur ist in Abb. 4 dargestellt. UNETR folgte einem Kontraktions-Expansions-Pfad mit einem Encoder, der aus einem Stapel von Transformatoren bestand, die über Sprungverbindungen mit einem Decoder verbunden waren. Der Encoder nutzte direkt 3D-Patches und war über eine Skip-Verbindung mit einem CNN-basierten Decoder verbunden. Ein 3D-Eingabevolumen wurde in homogene, nicht überlappende Patches aufgeteilt und mithilfe einer linearen Ebene auf einen Unterraum projiziert. Die Positionseinbettung wurde auf die Sequenz angewendet und dann als Eingabe für den Transformator verwendet. Die codierten Darstellungen auf verschiedenen Ebenen im Transformator wurden abgerufen und über Skip-Verbindungen an einen Decoder gesendet, um die Segmentierungsergebnisse zu erhalten.

Für die DL-Modelle umfasste die Eingabe eine Gehirnmaske und die entsprechenden segmentierten Gehirnstrukturen des Patienten in den MRT-Scans, die zu einem Array mit der Dimension \(256 \times 256 \times 128\) zusammengeführt wurden. Die Grundwahrheit jeder Gehirnstruktur wurde mithilfe von FS segmentiert. Zur Auswertung wurde eine dreifache Kreuzvalidierung der Testdaten angewendet, um den Dice-Score und den Dice-Verlust zu berechnen. Wir haben V-Net in TensorFlow und Keras implementiert und für 100 Epochen trainiert. Für UNETR wurden PyTorch und MONAI53 angewendet und das Modell für 20.000 Iterationen trainiert. Beide Modelle verwendeten die Python-Sprache und wurden mit einer NVIDIA Tesla V100 DGXS-GPU mit einer Stapelgröße von 1 und einer anfänglichen Lernrate von 0,0001 trainiert. Als CPU wurde Intel(R) Xeon(R) CPU E5-2698 v4 mit 2,20 GHz verwendet.

Wir haben die Genauigkeit der bewerteten Modelle mithilfe des Dice-Scores bewertet, indem wir die erwartete Segmentierung mit V-Net- (oder UNETR-) und FS-Ausgaben verglichen haben. Der Dice-Score misst die Überlappung zwischen der Referenz- und der vorhergesagten Segmentierungsmaske. Ein Dice-Score von 1 zeigt eine perfekte räumliche Übereinstimmung zwischen den beiden Binärbildern an, während ein Score von 0 keine Korrelation anzeigt. Wir haben den Dice-Verlust verwendet, um die Leistung der drei äußeren Kreuzvalidierungen in ihren Testsätzen für die entsprechenden Strukturen zu bestimmen. Wenn \(F_i\) und \(V_i\) die Grundwahrheitsmaske und ihre Vorhersage für jede Gehirnstruktur sind (dh die FS-Segmentierungsmaske \(F_i\) bzw. ihre DL-Vorhersagemaske \(V_i\). , wie in Abb. 1 gezeigt), wird der Dice-Score54 für jede Gehirnstruktur \(i \in\) \(\{\)pallidum, putamen, caudatus, dritter Ventrikel, Mittelhirn, Pons\(\}\) abgeleitet als

wobei \(\circ {}\) das Hadamard-Produkt (d. h. komponentenweise Multiplikation) bezeichnet und \(||\cdot ||_{1}\) die L1-Norm (d. h. die Summe aller absoluten Werte) ist Komponenten). Darüber hinaus haben wir zur Auswertung die Segmentierungszeit gemessen.

Wir haben die absoluten Volumina aus den sechs segmentierten Gehirnstrukturen (d. h. Pons, Putamen, Pallidum, Mittelhirn, Caudat und dritter Ventrikel) erhalten, die von den DL-Modellen (d. h. CNN-basiertem V-Net oder ViT-basiertem UNETR) oder FS vorhergesagt wurden . Basierend auf dem absoluten Volumen der einzelnen Gehirnstrukturen haben wir die AUC der binären Klassifikation von Krankheiten berechnet, normale vs. P-plus-Fälle, normale vs. PD-Fälle und PD vs. P-plus-Fälle. Die AUC wurde auf der Grundlage der Betriebskennlinie des Empfängers berechnet, die durch die Korrelation zwischen dem vorhergesagten absoluten Volumen jeder Gehirnstruktur und jedem Fall erstellt wurde.

Die binäre Klassifizierung der Krankheit wurde anhand der sechs segmentierten Gehirnstrukturen einzeln oder gemeinsam durchgeführt. Für die individuelle Analyse wurde die AUC durch eine schwellenwertbasierte binäre Klassifizierung abgeleitet, indem das absolute Volumen der einzelnen Strukturen ermittelt wurde. Für eine umfassende Analyse aller Strukturen haben wir zusätzlich einen ML-Klassifizierungsalgorithmus in Betracht gezogen, um eine binäre Klassifizierung der Krankheit mit den sechs Volumina als Eingaben durchzuführen. Für den Klassifizierungsalgorithmus wurden binomiale logistische Regression (LR) und extreme Gradient Boosting (XGBoost) verwendet. LR ist ein statistisches Modell, das häufig in der ML-Klassifizierung verwendet wird55,56,57. XGBoost ist eine etablierte Methode, die fortschrittliche Ergebnisse unter den auf Gradientenverstärkung basierenden Techniken liefert58 (z. B. hat XGBoost 17 der 29 ML-Aufgaben, die bis 2015 auf Kaggle veröffentlicht wurden, erfolgreich gewonnen59). Bei beiden Methoden haben wir die vom DL-Modell und FS erhaltene AUC durch dreifache Kreuzvalidierung bewertet.

Die Autoren erklären, dass die wichtigsten Daten, die die Ergebnisse dieser Studie stützen, in der Arbeit verfügbar sind. Die Rohdatensätze des Samsung Medical Center sind zum Schutz der Privatsphäre der Patienten geschützt, können jedoch auf begründete Anfrage zur Verfügung gestellt werden, sofern die Genehmigung des entsprechenden Institutional Review Board eingeholt wird. Für Anfragen zur Datenverfügbarkeit wenden Sie sich bitte an Jong Hyeon Ahn unter [email protected].

Der für die DL-Modelle verwendete Code ist auf GitHub verfügbar: https://github.com/kskim-phd/AI_vs_FS.

Eine Korrektur zu diesem Artikel wurde veröffentlicht: https://doi.org/10.1038/s41598-023-33774-z

Berg, D. et al. MDS-Forschungskriterien für die prodromale Parkinson-Krankheit. Bewegung. Unordnung. 30, 1600–1611. https://doi.org/10.1002/mds.26431 (2015).

Artikel Google Scholar

Meijer, FJA, Goraj, B., Bloem, BR & Esselink, RAJ Klinische Anwendung der Gehirn-MRT bei der diagnostischen Abklärung von Parkinsonismus. J. Park. Dis. 7, 211–217. https://doi.org/10.3233/JPD-150733 (2017).

Artikel Google Scholar

Watanabe, H. et al. Klinische und bildgebende Merkmale einer Multisystematrophie: Herausforderungen für eine frühe und klinisch eindeutige Diagnose. J. Movem. Unordnung. 11, 107. https://doi.org/10.14802/jmd.1802 (2018).

Artikel Google Scholar

Whitwell, JL et al. Radiologische Biomarker für die Diagnose bei PSP: Wo stehen wir und wo müssen wir sein? Bewegung. Unordnung. 32, 955–971. https://doi.org/10.1002/mds.27038 (2017).

Artikel Google Scholar

Jankovic, J., Hallett, M., Okun, MS, Comella, CL & Fahn, S. E-Book „Prinzipien und Praxis von Bewegungsstörungen“ (Elsevier Health Sciences, Amsterdam, 2021).

Google Scholar

Hussl, A. et al. Diagnostische Genauigkeit des Magnetresonanz-Parkinsonismus-Index und des Mittelhirn-zu-Pontin-Flächenverhältnisses zur Unterscheidung der progressiven supranukleären Parese von der Parkinson-Krankheit und der Parkinson-Variante der Multisystematrophie. Bewegung. Unordnung. 25, 2444–2449. https://doi.org/10.1002/mds.23351 (2010).

Artikel Google Scholar

Quattrone, A. et al. MR-Bildgebungsindex zur Unterscheidung der progressiven supranukleären Parese von der Parkinson-Krankheit und der Parkinson-Variante der Multisystematrophie. Radiologie 246, 214–221. https://doi.org/10.1148/radiol.2453061703 (2008).

Artikel PubMed Google Scholar

Paviour, DC, Price, SL, Jahanshahi, M., Lees, AJ & Fox, NC Regionale Gehirnvolumina unterscheiden PSP, MSA-P und PD: MRT-basierte klinisch-radiologische Korrelationen. Bewegung. Unordnung. 21, 989–996. https://doi.org/10.1002/mds.20877 (2006).

Artikel Google Scholar

Zanigni, S. et al. Genauigkeit von MR-Markern zur Unterscheidung einer progressiven supranukleären Parese von der Parkinson-Krankheit. NeuroImage-Klinik. 11, 736–742. https://doi.org/10.1016/j.nicl.2016.05.016 (2016).

Artikel PubMed PubMed Central Google Scholar

Massey, LA et al. Konventionelle Magnetresonanztomographie bei bestätigter progressiver supranukleärer Parese und Multisystematrophie. Bewegung. Unordnung. 27, 1754–1762. https://doi.org/10.1002/mds.24968 (2012).

Artikel Google Scholar

Schrag, A. et al. Differenzierung atypischer Parkinson-Syndrome mittels Routine-MRT. Neurologie 54, 697–697. https://doi.org/10.1212/WNL.54.3.697 (2000).

Artikel CAS PubMed Google Scholar

Kim, YE, Kang, SY, Ma, H.-I., Ju, Y.-S. & Kim, YJ Eine visuelle Bewertungsskala für das Kolibri-Zeichen mit einstellbarer diagnostischer Validität. J. Park. Dis. 5, 605–612. https://doi.org/10.3233/JPD-150537 (2015).

Artikel Google Scholar

Saeed, U., Lang, AE & Masellis, M. Neuroimaging-Fortschritte bei der Parkinson-Krankheit und atypischen Parkinson-Syndromen. Vorderseite. Neurol. 1189, 572976. https://doi.org/10.3389/fneur.2020.572976 (2020).

Artikel Google Scholar

Möller, L. et al. Manuelle MRT-Morphometrie bei Parkinson-Syndromen. Bewegung. Unordnung. 32, 778–782. https://doi.org/10.1002/mds.26921 (2017).

Artikel Google Scholar

Despotović, I., Goossens, B. & Philips, W. MRT-Segmentierung des menschlichen Gehirns: Herausforderungen, Methoden und Anwendungen. Berechnen. Mathematik. Methoden Med. https://doi.org/10.1155/2015/450341 (2015).

Artikel PubMed PubMed Central Google Scholar

Fawzi, A., Achuthan, A. & Belaton, B. Segmentierung von Gehirnbildern in den letzten Jahren: Ein narrativer Rückblick. Brain Sci.https://doi.org/10.3390/brainsci11081055 (2021).

Artikel PubMed PubMed Central Google Scholar

Fischl, B. Freesurfer. NeuroImage 62, 774–781. https://doi.org/10.1016/j.neuroimage.2012.01.021 (2012).

Artikel PubMed Google Scholar

Dewey, J. et al. Zuverlässigkeit und Validität von MRT-basierter automatisierter Volumetrie-Software im Vergleich zur automatisch unterstützten manuellen Messung subkortikaler Strukturen bei HIV-infizierten Patienten aus einer Multisite-Studie. NeuroImage 51, 1334–1344. https://doi.org/10.1016/j.neuroimage.2010.03.033 (2010).

Artikel PubMed Google Scholar

Eggert, LD, Sommer, J., Jansen, A., Kircher, T. & Konrad, C. Genauigkeit und Zuverlässigkeit automatisierter Segmentierungswege der grauen Substanz auf realen und simulierten strukturellen Magnetresonanzbildern des menschlichen Gehirns. PLUS EINShttps://doi.org/10.1371/journal.pone.0045081 (2012).

Artikel PubMed PubMed Central Google Scholar

Mayer, KN et al. Vergleich automatisierter Gehirnvolumetriemethoden mit Stereologie bei Kindern im Alter von 2 bis 3 Jahren. Neuroradiologie 58, 901–910. https://doi.org/10.1007/s00234-016-1714-x (2016).

Artikel PubMed Google Scholar

Klauschen, F., Goldman, A., Barra, V., Meyer-Lindenberg, A. & Lundervold, A. Evaluierung automatisierter MR-Bildsegmentierungs- und Volumetriemethoden des Gehirns. Summen. Brain Mapp. 30, 1310–1327. https://doi.org/10.1002/hbm.20599 (2009).

Artikel PubMed Google Scholar

Pham, DL, Xu, C. & Prince, JL Aktuelle Methoden in der medizinischen Bildsegmentierung. Annu. Rev. Biomed. Ing. 2, 315–337. https://doi.org/10.1146/annurev.bioeng.2.1.315 (2000).

Artikel CAS PubMed Google Scholar

Christensen, GE, Joshi, SC & Miller, MI Volumetrische Transformation der Gehirnanatomie. IEEE Trans. Med. Bildgebung 16, 864–877. https://doi.org/10.1109/42.650882 (1997).

Artikel CAS PubMed Google Scholar

Collins, DL, Holmes, CJ, Peters, TM & Evans, AC Automatische 3D-modellbasierte neuroanatomische Segmentierung. Summen. Brain Mapp. 3, 190–208. https://doi.org/10.1002/hbm.460030304 (1995).

Artikel Google Scholar

Iosifescu, DV et al. Ein automatisierter Registrierungsalgorithmus zur Messung subkortikaler Hirnstrukturen im MRT. NeuroImage 6, 13–25. https://doi.org/10.1006/nimg.1997.0274 (1997).

Artikel CAS PubMed Google Scholar

McClure, P. et al. Wissen, was Sie über die Gehirnsegmentierung mithilfe von Bayes'schen tiefen neuronalen Netzen wissen. Vorderseite. Neuroinform.https://doi.org/10.3389/fninf.2019.00067 (2019).

Artikel PubMed PubMed Central Google Scholar

Rastogi, D., Johri, P. & Tiwari, V. Hirntumorsegmentierung und Tumorvorhersage mithilfe der 2D-Vnet-Deep-Learning-Architektur. Im Jahr 2021 10. Internationale Konferenz zu Systemmodellierung und Weiterentwicklung in Forschungstrends (SMART)https://doi.org/10.1109/smart52563.2021.9676317 (2021).

Hatamizadeh, A. et al. Swin UNETR: Swin-Transformatoren zur semantischen Segmentierung von Hirntumoren in MRT-Bildern. In International MICCAI Brainlesion Workshop, 272–284 (Springer, 2022).

Milletari, F., Navab, N. & Ahmadi, S.-A. V-Net: Vollständig faltende neuronale Netze für die volumetrische Segmentierung medizinischer Bilder. Im Jahr 2016 vierte internationale Konferenz über 3D-Vision (3DV), 565–571, ​​https://doi.org/10.1109/3DV.2016.79 (2016).

Hatamizadeh, A. et al. Unetr: Transformatoren für die Segmentierung medizinischer 3D-Bilder. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 574–584 (2022).

Chougar, L. et al. Automatisierte Kategorisierung von Parkinson-Syndromen mittels Magnetresonanztomographie im klinischen Umfeld. Bewegung. Unordnung. 36, 460–470. https://doi.org/10.1002/mds.28348 (2021).

Artikel CAS Google Scholar

Sjöström, H., Granberg, T., Hashim, F., Westman, E. & Svenningsson, P. Die automatisierte Hirnstammvolumetrie kann bei der Diagnose von Parkinson-Erkrankungen hilfreich sein. Park. Relat. Unordnung. 79, 18–25 (2020).

Artikel Google Scholar

Brooks, DJ & Seppi, K. Vorgeschlagene Neuroimaging-Kriterien für die Diagnose einer Multisystematrophie. Bewegung. Unordnung. 24, 949–964. https://doi.org/10.1002/mds.22413 (2009).

Artikel Google Scholar

Hotter, A., Esterhammer, R., Schocke, MF & Seppi, K. Potenzial fortschrittlicher MR-Bildgebungstechniken in der Differentialdiagnose von Parkinsonismus. Bewegung. Unordnung. 24, S711–S720. https://doi.org/10.1002/mds.22648 (2009).

Artikel Google Scholar

Oba, H. et al. Neue und zuverlässige MRT-Diagnose für progressive supranukleäre Parese. Neurologie 64, 2050–2055. https://doi.org/10.1212/01.WNL.0000165960.04422.D0 (2005).

Artikel CAS PubMed Google Scholar

Quattrone, A. et al. Eine neue MRT-Maßnahme zur frühzeitigen Unterscheidung einer progressiven supranukleären Parese von der De-novo-Parkinson-Krankheit in der klinischen Praxis: eine internationale Studie. Bewegung. Unordnung. 36, 681–689. https://doi.org/10.1002/mds.28364 (2021).

Artikel CAS Google Scholar

Quattrone, A. et al. Ein neuer MR-Bildgebungsindex zur Unterscheidung zwischen progressiver supranukleärer Parese und Parkinsonismus und der Parkinson-Krankheit. Park. Relat. Unordnung. 54, 3–8. https://doi.org/10.1016/j.parkreldis.2018.07.016 (2018).

Artikel Google Scholar

Rizzo, G. et al. Genauigkeit der klinischen Diagnose der Parkinson-Krankheit: Eine systematische Überprüfung und Metaanalyse. Neurologie 86, 566–576. https://doi.org/10.1212/WNL.0000000000002350 (2016).

Artikel PubMed Google Scholar

Hughes, AJ, Daniel, SE, Kilford, L. & Lees, AJ Genauigkeit der klinischen Diagnose der idiopathischen Parkinson-Krankheit: Eine klinisch-pathologische Studie mit 100 Fällen. J. Neurol. Neurochirurg. Psychiatrie 55, 181–184. https://doi.org/10.1136/jnnp.55.3.181 (1992) https://jnnp.bmj.com/content/55/3/181.full.pdf.

Artikel CAS PubMed PubMed Central Google Scholar

Gilman, S. et al. Zweite Konsenserklärung zur Diagnose einer Multisystematrophie. Neurologie 71, 670–676. https://doi.org/10.1212/01.wnl.0000324625.00404.15 (2008) https://n.neurology.org/content/71/9/670.full.pdf.

Artikel CAS PubMed PubMed Central Google Scholar

Höglinger, GU et al. Klinische Diagnose einer progressiven supranukleären Parese: Die Kriterien der Gesellschaft für Bewegungsstörungen. Bewegung. Unordnung. 32, 853–864. https://doi.org/10.1002/mds.26987 (2017).

Artikel Google Scholar

Whitcher, B., Schmid, VJ & Thorton, A. Arbeiten mit den DICOM- und NIfTI-Datenstandards in RJ Stat. Softw. 44, 1–29. https://doi.org/10.18637/jss.v044.i06 (2011).

Artikel Google Scholar

Heinen, R. et al. Robustheit automatisierter Methoden zur Hirnvolumenmessung bei verschiedenen MRT-Feldstärken. PLoS ONEhttps://doi.org/10.1371/journal.pone.0165719 (2016).

Artikel PubMed PubMed Central Google Scholar

Velasco-Annis, C., Akhondi-Asl, A., Stamm, A. & Warfield, SK Reproduzierbarkeit von Gehirn-MRT-Segmentierungsalgorithmen: Empirischer Vergleich der lokalen Karte PSTAPLE, FreeSurfer und FSL-first. J. Neuroimaging 28, 162–172. https://doi.org/10.1111/jon.12483 (2017).

Artikel PubMed Google Scholar

Aufklärung-alles.

Iglesias, JE et al. Bayesianische Segmentierung von Hirnstammstrukturen in der MRT. NeuroImage 113, 184–195. https://doi.org/10.1016/j.neuroimage.2015.02.065 (2015).

Artikel PubMed Google Scholar

Kleesiek, J. et al. Tiefen-MRT-Gehirnextraktion: Ein 3D-Faltungs-Neuronales Netzwerk zur Schädelentfernung. NeuroImage 129, 460–469. https://doi.org/10.1016/j.neuroimage.2016.01.024 (2016).

Artikel PubMed Google Scholar

Kalavathi, P. & Prasath, VBS Methoden zur Schädelentfernung von MRT-Kopfscanbildern: Eine Übersicht. J. Dig. Bildgebung 29, 365–379. https://doi.org/10.1007/s10278-015-9847-8 (2015).

Artikel Google Scholar

Bocchetta, M. et al. Die automatisierte Hirnstammsegmentierung erkennt eine unterschiedliche Beteiligung an atypischen Parkinson-Syndromen. J. Movem. Unordnung. 13, 39–46. https://doi.org/10.14802/jmd.19030 (2020).

Artikel Google Scholar

Manjón, JV et al. pBrain: Eine neuartige Pipeline für die Segmentierung der Gehirnstruktur im Zusammenhang mit Parkinson. NeuroImage-Klinik. 25, 102184. https://doi.org/10.1016/j.nicl.2020.102184 (2020).

Artikel PubMed PubMed Central Google Scholar

Ioffe, S. & Szegedy, C. Batch-Normalisierung: Beschleunigung des Deep-Network-Trainings durch Reduzierung der internen Kovariatenverschiebung. https://doi.org/10.48550/ARXIV.1502.03167 (2015).

Hatamizadeh, A. et al. Swin unetr: Swin-Transformatoren zur semantischen Segmentierung von Hirntumoren in MRT-Bildern. In BrainLes@MICCAI (2022).

Konsortium, M. Monai: Medizinisches offenes Netzwerk für KI. Technik. Rep.https://doi.org/10.5281/zenodo.6903385 (2022).

Sheller, MJ et al. Föderiertes Lernen in der Medizin: Erleichterung multiinstitutioneller Zusammenarbeit ohne Austausch von Patientendaten. Wissenschaft. Rep.https://doi.org/10.1038/s41598-020-69250-1 (2020).

Artikel PubMed PubMed Central Google Scholar

Austin, PC, Tu, JV, Ho, JE, Levy, D. & Lee, DS Verwendung von Methoden aus der Data-Mining- und maschinellen Lernliteratur zur Klassifizierung und Vorhersage von Krankheiten: Eine Fallstudie zur Untersuchung der Klassifizierung von Herzinsuffizienz-Subtypen. J. Clin. Epidemiol. 66, 398–407. https://doi.org/10.1016/j.jclinepi.2012.11.008 (2013).

Artikel PubMed PubMed Central Google Scholar

Thabtah, F., Abdelhamid, N. & Peebles, D. Eine Autismusklassifizierung durch maschinelles Lernen basierend auf logistischer Regressionsanalyse. Gesundheitsinf. Wissenschaft. Syst.https://doi.org/10.1007/s13755-019-0073-5 (2019).

Artikel PubMed PubMed Central Google Scholar

Nusinovici, S. et al. Die logistische Regression war für die Vorhersage schwerwiegender chronischer Krankheiten ebenso gut wie maschinelles Lernen. J. Clin. Epidemiol. 122, 56–69. https://doi.org/10.1016/j.jclinepi.2020.03.002 (2020).

Artikel PubMed Google Scholar

Friedman, JH Greedy-Funktionsnäherung: Eine Gradientenverstärkungsmaschine. Ann. Stat. 29, 1189–1232. https://doi.org/10.1214/aos/1013203451 (2001).

Artikel MathSciNet MATH Google Scholar

Ogunleye, A. & Wang, Q.-G. XGBoost-Modell zur Diagnose chronischer Nierenerkrankungen. IEEE/ACM-Trans. Berechnen. Biol. Bioinform. 17, 2131–2140. https://doi.org/10.1109/TCBB.2019.2911071 (2020).

Artikel PubMed Google Scholar

Referenzen herunterladen

Diese Studie wurde durch den von der koreanischen Regierung finanzierten Zuschuss der National Research Foundation of Korea (NRF) (MSIT) (2021R1F1A106153511) und durch den von der koreanischen Regierung finanzierten Zuschuss des Korea Medical Device Development Fund (Ministerium für Wissenschaft und IKT, Handelsministerium) unterstützt , Industrie und Energie, Ministerium für Gesundheit und Soziales, Ministerium für Lebensmittel- und Arzneimittelsicherheit) (202011B08-02, KMDF_PR_20200901_0014-2021-02), durch das Technology Innovation Program (20014111), finanziert vom Ministerium für Handel, Industrie und Energie (MOTIE). , Korea) und vom Future Medicine 20*30 Project des Samsung Medical Center (SMX1210791). Die Geldgeber unterstützten einige Autoren in Form von Gehältern, waren jedoch nicht zusätzlich am Studiendesign, der Datenerhebung und -analyse, der Entscheidung zur Veröffentlichung oder der Erstellung des Manuskripts beteiligt. Die spezifischen Rollen der Autoren werden im entsprechenden Abschnitt angegeben.

Diese Autoren haben gleichermaßen beigetragen: Joomee Song und Juyoung Hahm.

Zentrum für Abteilung für Neurologie und Neurowissenschaften, Samsung Medical Center, Medizinische Fakultät der Sungkyunkwan-Universität, Seoul, Republik Korea

Das Beste aus Joomee-Songs, Jinyoung Youn, Jin Whan Cho und Jong Hyeon Ahn

Medical AI Research Center, Forschungsinstitut für zukünftige Medizin, Samsung Medical Center, Seoul, Republik Korea

Juyoung Hahm, Jisoo Lee, Chae Yeon Lim, Myung Jin Chung und Kyungsu Kim

Abteilung für Biostatistik, Columbia University

Juyoung Hahm

Fakultät für Elektrotechnik und Informationstechnik, University of Maryland, College Park, MD, USA

Jisoo Lee

Abteilung für Medizingerätemanagement und -forschung, SAIHST, Sungkyunkwan-Universität, Seoul, Republik Korea

Chae Yeon Lim

Abteilung für Radiologie, Samsung Medical Center, Sungkyunkwan University School of Medicine, Seoul, Republik Korea

Myung Jin Chung

Abteilung für Datenkonvergenz und zukünftige Medizin, Medizinische Fakultät der Sungkyunkwan-Universität, Seoul, Republik Korea

Myung Jin Chung & Kyungsu Kim

Abteilung für Radiologie, Massachusetts General Brigham und Harvard Medical School, Boston, MA, USA

Kyungsu Kim

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

(1) Forschungsprojekt: A. Konzeption und Design, B. Datenerfassung, C. Analyse und Interpretation von Daten. (2) Manuskript: A. Verfassen des ersten Entwurfs, B. Rezension und Kritik. (3) Sonstiges: A. Statistische Analyse, B. Beschaffung von Fördermitteln, C. Technische Unterstützung, D. Studienüberwachung, E. Überwachung der Datenerhebung. JS: 1A, 1B, 1C, 2A, 2B, JH: 1C, 2A, 2B, 3A, 3C, JL: 2B, 3A, 3C, CYL: 3C, MJC: 3B, 3C, JY: 1B, 2B, JWC: 1B, 2C, 3E, JHA: : 1B, 1C, 2B, 3D, 3E, KK: 1A, 1C, 2A, 2B, 3A, 3C, 3D.

Korrespondenz mit Jong Hyeon Ahn oder Kyungsu Kim.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Die ursprüngliche Online-Version dieses Artikels wurde überarbeitet: In der Originalversion dieses Artikels wurde die ergänzende Datei, die der ursprünglichen Einreichung beigefügt war, im Abschnitt „Ergänzende Informationen“ weggelassen. Die korrekte Zusatzinformationsdatei liegt jetzt dem Originalartikel bei.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Song, J., Hahm, J., Lee, J. et al. Vergleichende Validierung von KI- und Nicht-KI-Methoden in der MRT-Volumetrie zur Diagnose von Parkinson-Syndromen. Sci Rep 13, 3439 (2023). https://doi.org/10.1038/s41598-023-30381-w

Zitat herunterladen

Eingegangen: 15. Oktober 2022

Angenommen: 21. Februar 2023

Veröffentlicht: 01. März 2023

DOI: https://doi.org/10.1038/s41598-023-30381-w

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.

AKTIE