banner

Nachricht

Sep 13, 2023

Erklärbarkeit des maschinellen Lernens beim Überleben von Nasopharynxkrebs mithilfe von LIME und SHAP

Wissenschaftliche Berichte Band 13, Artikelnummer: 8984 (2023) Diesen Artikel zitieren

274 Zugriffe

3 Altmetrisch

Details zu den Metriken

Nasopharynxkrebs (NPC) weist im Vergleich zu anderen Kopf- und Halskrebsarten eine einzigartige Histopathologie auf. Einzelne NPC-Patienten können unterschiedliche Ergebnisse erzielen. Diese Studie zielt darauf ab, ein Prognosesystem aufzubauen, indem ein hochpräzises Modell des maschinellen Lernens (ML) mit erklärbarer künstlicher Intelligenz kombiniert wird, um NPC-Patienten in Gruppen mit geringer und hoher Überlebenschance einzuteilen. Die Erklärbarkeit wird mithilfe der Techniken Local Interpretable Model Agnostic Explanations (LIME) und SHapley Additive ExPlanations (SHAP) bereitgestellt. Insgesamt 1094 NPC-Patienten wurden aus der SEER-Datenbank (Surveillance, Epidemiology, and End Results) für das Modelltraining und die interne Validierung abgerufen. Wir haben fünf verschiedene ML-Algorithmen kombiniert, um einen einzigartig gestapelten Algorithmus zu bilden. Die Vorhersageleistung des gestapelten Algorithmus wurde mit einem hochmodernen Algorithmus – Extreme Gradient Boosting (XGBoost) – verglichen, um die NPC-Patienten in Gruppen mit Überlebenschancen einzuteilen. Wir haben unser Modell mit zeitlicher Validierung (n = 547) und geografischer externer Validierung (NPC-Kohorte des Helsinki University Hospital, n = 60) validiert. Das entwickelte gestapelte prädiktive ML-Modell zeigte eine Genauigkeit von 85,9 %, während das XGBoost nach der Trainings- und Testphase 84,5 % aufwies. Dies zeigte, dass sowohl XGBoost als auch das gestapelte Modell eine vergleichbare Leistung zeigten. Die externe geografische Validierung des XGBoost-Modells ergab einen C-Index von 0,74, eine Genauigkeit von 76,7 % und eine Fläche unter der Kurve von 0,76. Die SHAP-Technik ergab, dass das Alter des Patienten bei der Diagnose, das T-Stadium, die ethnische Zugehörigkeit, das M-Stadium, der Familienstand und die Klasse zu den wichtigsten Eingabevariablen in absteigender Reihenfolge ihrer Bedeutung für das Gesamtüberleben von NPC-Patienten gehörten. LIME zeigte den Grad der Zuverlässigkeit der vom Modell gemachten Vorhersage. Darüber hinaus zeigten beide Techniken, wie jedes Merkmal zur Vorhersage des Modells beitrug. LIME- und SHAP-Techniken lieferten personalisierte Schutz- und Risikofaktoren für jeden NPC-Patienten und enthüllten einige neuartige nichtlineare Beziehungen zwischen Eingabemerkmalen und Überlebenschancen. Der untersuchte ML-Ansatz zeigte die Fähigkeit, die Chance auf das Gesamtüberleben von NPC-Patienten vorherzusagen. Dies ist wichtig für eine effektive Behandlungsplanung und fundierte klinische Entscheidungen. Um die Ergebnisergebnisse, einschließlich des Überlebens bei NPC, zu verbessern, kann ML bei der Planung einer individuellen Therapie für diese Patientengruppe hilfreich sein.

Das Nasopharynxkarzinom (NPC) ist ein seltener Krebs mit einer ausgeprägten Epidemiologie und Histopathologie, die sich von anderen Kopf- und Halskrebsarten unterscheidet1,2,3. Es kommt endemisch in den geografischen Gebieten Südchina und Südostasien vor, wo es sich bei einem erheblichen Anteil der Tumoren um undifferenzierte und nicht keratinisierende Karzinome handelt4,5,6. Aber an nicht endemischen geografischen Standorten kann NPC entweder keratinisierend oder nicht keratinisierend sein6,7. Bemerkenswert ist, dass NPC seinen Ursprung in der Epithelauskleidung des Nasopharynx und damit im oberen Teil des Rachenraums hat8.

Aufgrund der deutlich gestiegenen Inzidenz- und Mortalitätsraten hat NPC in jüngster Zeit als globales Gesundheitsproblem große Aufmerksamkeit erhalten9. Darüber hinaus ist die Sterblichkeitsrate von NPC unabhängig von einer frühen Diagnose unabhängig vom geografischen Standort – endemisch oder nicht endemisch – beträchtlich hoch10. Dies kann auf eine falsche Behandlungsplanung zurückzuführen sein, die zu suboptimalen Behandlungsergebnissen führt11. Daher ist eine genaue Einschätzung der Prognose von NPC-Patienten wichtig für eine wirksame Behandlung der Krankheit, da die Zunahme der Zahl von Krebspatienten mit schlechten Prognosen die Gesamtkrebslast in der Gesellschaft erhöhen wird1,12.

Das Tumor-Knoten-Metastasen-Stadieneinteilungsschema (TNM) bleibt der Eckpfeiler der Prognose und Risikostratifizierung für NPC-Patienten1. Dennoch wächst die Kritik am TNM-Stadium, da Patienten im gleichen Stadium eine erhebliche klinische Heterogenität und einzigartige onkologische Ergebnisse aufweisen können13. Ebenso wurde berichtet, dass der Plasma-DNA-Titer des Epstein-Barr-Virus (EBV) ein nützlicher Biomarker für Patienten mit NPC ist14,15. Allerdings stellen die finanziellen und wirtschaftlichen Auswirkungen der Untersuchung der EBV-DNA und die Variabilität zwischen Labors erhebliche Faktoren dar, die die Integration dieses Biomarkers in die tägliche klinische Praxis behindern16. Daher gibt es eine anhaltende Diskussion über die Einbeziehung nichtanatomischer Prognosefaktoren, die zusätzlich zu den TNM-Parametern das biologische Tumorverhalten widerspiegeln würden, um eine verbesserte Risikostratifizierung zu erreichen8,17. Ein aufschlussreicher möglicher Ansatz zur Berücksichtigung anderer Faktoren zusätzlich zum TNM-Stufenschema ist der Einsatz von maschinellem Lernen (ML), einem Teilgebiet der künstlichen Intelligenz18,19.

Mehrere Studien haben den Einsatz verschiedener individueller ML-Algorithmen bei der Prognose von Ergebnissen bei NPC18,20 untersucht. In dieser Studie wollen wir die Leistung von fünf verschiedenen Einzelalgorithmen – logistische Regression, naive Bayes-Algorithmen, k-nächste Nachbarn, Support-Vektor-Maschine und Entscheidungsbaumalgorithmen – nutzen, um einen einzigen eindeutigen ML-Algorithmus zu erstellen, der als gestapelter Algorithmus (Stacking Generalization) bekannt ist ). Darüber hinaus wollen wir die Leistung des gestapelten Algorithmus mit einem anderen hochmodernen Algorithmus namens Extreme Gradient Boosting (XGBoost) ML-Algorithmen vergleichen, um die Gesamtüberlebensergebnisse bei NPC-Krebspatienten zu prognostizieren. Die Wahl fiel auf die extreme Gradientenverstärkung, da sie in vielen klinischen Anwendungen vielversprechende Ergebnisse erzielt hat21. Wir lieferten eine Erklärung und Interpretation der Vorhersagen des XGBoost-Modells mithilfe der Techniken Local Interpretable Model Agnostic Explanations (LIME) und SHapley Additive ExPlanations (SHAP). Das resultierende erklärbare und interpretierbare Modell kann bei der Prognose hilfreich sein, indem es bei der individuellen Stratifizierung der Überlebenschancen der Patienten hilft. Somit kann eine angemessene Behandlungsintensität auf den Patienten zugeschnitten werden.

Die Genehmigung wurde von der Datenbank des National Cancer Institute (NCI) über das Surveillance, Epidemiology, and End Results (SEER) Program der Datenbank des National Institutes of Health (NIH) mit der Identifikationsnummer (#17247-Nov2020 [alabir]/SAR0058552 [2023] eingeholt ]). Für alle Teilnehmer wurde eine schriftliche Einverständniserklärung über die elektronische Forschungsverwaltung (eRA) für SEER und NIH eingeholt. Diese öffentlich zugängliche Datenbank wurde ausgewählt, weil sie qualitativ hochwertige Fälle verschiedener Krebsarten in einem nicht identifizierbaren Format enthält22,23. Alle Methoden wurden gemäß der Helsinki-Erklärung durchgeführt. Darüber hinaus folgten alle in dieser Studie verwendeten Methoden den SEER-Richtlinien.

Das SEER-Programm der Datenbank des National Cancer Institute wurde nach Einreichungen vom November 2020 [2000–2018] durchsucht (Abb. 1). Die ausgewählten klinisch-pathologischen Variablen für Nasopharynxkarzinome waren das Stadieneinstufungsschema für Tumorknotenmetastasen (TNM) des American Joint Committee on Cancer (AJCC) der 7. Auflage, Alter bei Diagnose, Rasse, Familienstand, Geschlecht und Grad. Zu den behandlungsbezogenen Parametern gehörten Operation, Strahlentherapie (RT), Chemoradiotherapie (CRT) und Chemotherapie (CT) (Tabelle 1). Außerdem wurden die Überlebenszeit (in Monaten) und der Gesamtüberlebensstatus der Patienten erfasst.

Extraktionsprozess aus der SEER-Datenbank.

Aus diesem Extraktionsprozess (Abb. 1) ergab sich, dass insgesamt 1641 Fälle für die Aufnahme in diese Studie geeignet waren (Tabelle 1). Von diesen 1641 wurden insgesamt 1094 Fälle in der ML-Analyse für das Modelltraining und die interne Validierung verwendet.

Aufgrund der Seltenheit von NPC und dem daraus resultierenden Mangel an öffentlich verfügbaren Daten wurden die verbleibenden 547 Fälle weder für Training noch Tests während des Modelltrainings oder der internen Validierung verwendet, sondern für eine zeitlich begrenzte externe Validierung des entwickelten Modells reserviert („Externe Validierung, Leistungskennzahlen und Funktionsbedeutung"). Die zeitliche Form der externen Validierung wurde von Ramspek et al. betont, insbesondere in Ermangelung einer relativ großen unabhängigen geografischen externen Validierungskohorte24,25. Die detaillierte Beschreibung aller einbezogenen Variablen und Kategorisierungen ist in Tabelle 1 aufgeführt. Alle unbekannten Fälle wurden ausgeschlossen.

Eine detaillierte Beschreibung des ML-Prozesses ist in Abb. 2 dargestellt. Der Prozess beginnt mit der Datenverarbeitung, bei der die Daten für einen einfachen ML-Prozess in numerische Variablen umgewandelt werden. Die verarbeiteten Daten wurden in Eingabe- und Ausgabeparameter unterteilt.

Ein typischer ML-Trainingsprozess.

Von den in Tabelle 1 aufgeführten Parametern wurde das Gesamtüberleben (OS) als das in dieser Studie interessierende Ergebnis angesehen. Die Ausgabevariable ist relativ ausgeglichen, daher gab es keine Bedenken hinsichtlich eines signifikant unausgeglichenen Datensatzes. Um den abgesteckten Algorithmus zu erhalten, wurde jeder der fünf Algorithmen (logistische Regression, naive Bayes-Algorithmen, k-nächste Nachbarn, Support-Vektor-Maschine und Entscheidungsbaum-Algorithmen) mithilfe einer zehnfachen Kreuzvalidierung trainiert. Darüber hinaus wurden die notwendigen Hyperparameter abgestimmt, um sicherzustellen, dass eine vielversprechende Vorhersageleistung erzielt wurde. Anschließend wurden alle diese Algorithmen mit der logistischen Regression als Basisalgorithmus zusammengefügt. Der resultierende abgesteckte Algorithmus wurde für den gesamten Datensatz weiter trainiert. Die Leistung der einzelnen Algorithmen und des gestapelten Algorithmus wurde verglichen.

In ähnlicher Weise haben wir dieselben Daten verwendet, um einen anderen hochmodernen Algorithmus zu trainieren – Extreme Gradient Boosting (XGBoost). Hyperparameter wurden feinabgestimmt, um die Leistung des Modells zu maximieren (Abb. 2). Darüber hinaus haben wir die Leistung dieser beiden leistungsstarken Algorithmen (Stacked und XGBoost) hauptsächlich anhand der Genauigkeit verglichen. Der Algorithmus mit der besseren Leistungsgenauigkeit wurde einer externen Validierung unterzogen. Das ML-Training wurde mit Python Version 3.11.0 im Jupyter Notebook durchgeführt. Das trainierte Modell wurde verwendet, um die Patienten hinsichtlich der OS-Wahrscheinlichkeit in zwei Gruppen einzuteilen, d. h. geringe OS-Wahrscheinlichkeit oder hohe OS-Wahrscheinlichkeit. Zusätzlich zur Möglichkeit der OS-Vorhersage wurden lokal interpretierbare modellagnostische Erklärungen (LIME) und Shapley Additive ExPlanations (SHAP)-Techniken verwendet, um lokale (LIME) oder sowohl lokale als auch globale Erklärungen (SHAP) der Beiträge jeder Variablen bereitzustellen die Vorhersageleistung des Modells. Ausführliche Erläuterungen zu den LIME- und SHAP-Techniken finden Sie in „Lokale interpretierbare modellagnostische Erklärungen (LIME)“ bzw. „Shapley additive ExPlanations (SHAP)“.

LIME, das Akronym für Local Interpretable Model-Agnostic Exploitations26, ist eine modellunabhängige Technik, die auf ein bereits trainiertes Modell angewendet wird, um die Beziehung zwischen den Eingabeparametern und der Ausgabe, die durch das Modell dargestellt wird, zu untersuchen und zu analysieren27. Dabei handelt es sich um eine Technik zur Interpretierbarkeit lokaler Modelle, bei der die Eingabeparameter optimiert werden und gleichzeitig die Auswirkung dieser Optimierung auf die Ausgabe beobachtet wird28. Die Bedeutung der Optimierung hilft, den Grad der Genauigkeit der vom Modell getroffenen Vorhersage zu verstehen und zu untersuchen, welche der Eingabevariablen die Vorhersage einer Datenstichprobe verursacht haben.

Technisch gesehen generiert die LIME-Technik einen neuen Datensatz, der aus gestörten Stichproben und entsprechenden Vorhersagen aus dem ursprünglich trainierten Modell besteht. Anschließend wird von LIME ein interpretierbares Modell auf dem neu generierten Datensatz trainiert, indem die Nähe der abgetasteten Instanzen zur interessierenden Instanz (dh dem Massenzentrum der Trainingsdaten) gewichtet wird. Dies trägt dazu bei, eine gute Approximation der Modellvorhersagen lokal zu erreichen, d. h. für eine einzelne Vorhersageinstanz anstelle des gesamten Datensatzes. Die LIME-Technik unterscheidet sich von anderen Modellinterpretierbarkeitstechniken in dem Sinne, dass sie die Interpretierbarkeit von jedem Beispieldatenpunkt berücksichtigt, im Gegensatz zu anderen, die sie vom gesamten Datensatz berücksichtigen. Daher bietet LIME lokale Interpretierbarkeit. Diese Art der Näherung (Genauigkeit) wird als lokale Wiedergabetreue bezeichnet. Daher erfährt LIME einen Kompromiss zwischen Modelltreue und Komplexität. Die Einschränkung für die LIME-Technik ist wie folgt:

Dabei ist \({LIME}_{explanation} \left(x\right)\) die LIME-Erklärung für eine Instanz. \(\left(x\right). f\) ist das globale Modell (in diesem Fall der Entscheidungsbaum zur Gradientenverstärkung). Studie). \(f\) ist das \({\mathbb{R}}^{d}\to {\mathbb{R}}.g\) ist das lokale Ersatzmodell. G ist die Familie oder Reihe möglicher Erklärungen. Das heißt, eine Klasse potenziell interpretierbarer Modelle. \(g\in G\) ist die als Modell betrachtete Erklärung. L is the Loss misst die Nähe der Erklärung zur Vorhersage des globalen/ursprünglichen Modells. \({\pi }_{x }\left(z\right)\) ist das Näherungsmaß einer Instanz z von x. Das heißt, die Nähe misst, wie groß die Nachbarschaft um die Instanz \((x)\) ist, wobei der exponentielle Glättungskernel verwendet wird. \({\Omega }_{\left(g\right)}\) Ein Maß für die Komplexität der Erklärung \(g\in G.\) Das heißt, die Modellkomplexität, z. B. die Anzahl der Eingabemerkmale (die weniger, desto besser).

Basierend auf der Einschränkungsformel (1) besteht das Funktionsprinzip von LIME darin, L zu minimieren, ohne Annahmen über das globale Modell f zu treffen (da LIME modellunabhängig ist). Der Verlust (L) ist das Maß für die Untreue des lokalen Ersatzmodells (g) bei der Annäherung an das globale Modell (f) in der durch π(x) definierten Lokalität.

SHAP ist ein Akronym für Shapley Additive exPlanations, das 2017 von Lundberg und Lee eingeführt wurde29. Es nutzt das Prinzip der Spieltheorie, um lokale Erklärungen für Modellvorhersagen zu liefern29. Im Kontext der Spieltheorie wird das Modell als die Spielregeln betrachtet, während die Eingabemerkmale die potenziellen Spieler sind, die entweder am Spiel teilnehmen können (beobachtetes Merkmal) oder nicht (Merkmal kann nicht beobachtet werden). Daher berechnet die SHAP-Technik die Shapley-Werte, indem sie das Modell unter mehreren verschiedenen Kombinationen von Eingabemerkmalen bewertet und den durchschnittlichen Unterschied in der Ausgabe (Vorhersage) berechnet, wenn ein Merkmal vorhanden ist, verglichen mit dem Fall, wenn es nicht vorhanden ist30. Dieser Unterschied wird als Shapley-Wert bezeichnet und stellt den Beitrag des Merkmals zur Vorhersage des Modells dar30. Daher quantifizieren die Shapley-Werte den Beitrag jedes Merkmals zur Vorhersage eines Modells für eine gegebene Eingabe28,30.

Technisch gesehen gibt die SHAP-Technik Shapley-Werte zurück, die Modellvorhersagen als lineare Kombinationen binärer Variablen ausdrücken, die beschreiben, ob jede Kovariate im Modell vorhanden ist oder nicht27. Intuitiv approximiert es jede Vorhersage \(f\left(x\right)\) mit \(g ({x}^{^{\prime}})\), wobei eine lineare Funktion der binären Variablen (\({ z}^{^{\prime}} \in {\left\{0, 1\right\}}^{M})\) wie im Klassifikationsproblem und der Größen \({\varnothing }_{i} \in {\mathbb{R}}\) wird durch die in (2)27 angegebenen additiven Merkmalsattributionsmethoden definiert:

Die Methode der additiven Merkmalszuordnung sollte die wesentlichen Eigenschaften lokaler Genauigkeit, Fehlen und Konsistenz erfüllen, damit sie eine aussagekräftige Erklärung einer einzelnen Vorhersage liefern kann. Daher wird die additive Methode, die diese Eigenschaften erfüllt, wie folgt angegeben:

Dabei ist \(f\) das zu erklärende ursprüngliche Vorhersagemodell, \(g\) das Erklärungsmodell und \(x\) die verfügbaren Variablen. \({x}^{^{\prime}}\) ist die ausgewählte Variable, M ist die Anzahl der vereinfachten Eingabemerkmale, \({f}_{x }\left({z}^{^{\prime }}\right)- {f}_{x} ({z}^{^{\prime}}\backslash i)\) ist die Größe, die für jede einzelne Vorhersage die Abweichung der Shapley-Werte von ihrem Mittelwert ausdrückt: der Beitrag der \(i\)-ten Variablen.

Daher verwendet die SHAP-Technik Shapley-Werte als erklärendes Modell, das sich lokal an das ursprüngliche Modell annähert, und zwar für einen gegebenen Variablenwert \(x\) (lokale Genauigkeit), sodass immer dann, wenn eine Variable gleich Null ist (Shapley-Wert, d. h. Fehlen). ). Wenn der Beitrag einer Variablen in einem anderen Modell höher ist, ist auch der entsprechende Shapley-Wert höher (Konsistenz)27.

Zur Interpretierbarkeit und Erklärbarkeit mit LIME haben wir den LimeTabularExplainer in Python Version 3.10.0 verwendet, um die Trainingsdaten des globalen Modells anzupassen (extreme Gradient Boosting [XGBoost] in dieser Studie). Dadurch wird ein neuer Datensatz generiert, der aus permutierten Stichproben der Trainingsdaten und den entsprechenden Vorhersagen aus dem globalen Modell besteht. LIME trainiert dann ein interpretierbares Modell (lokales Ersatzmodell) basierend auf den gestörten Daten, die aus den ursprünglichen Trainingsdaten generiert wurden, das durch die Nähe der abgetasteten Instanzen zur interessierenden Instanz gewichtet wird. Das erlernte Modell (dh das lokale Ersatzmodell) sollte eine gute Annäherung an die Modellvorhersagen vor Ort sein (lokale Genauigkeit), ohne unbedingt eine gute globale Annäherung zu sein. Daher ist das interpretierbare und erklärbare Modell für eine Instanz x (8. Instanz in dieser Studie) das lokale Ersatzmodell (g in 1), das die Verlustfunktion (L in 1) minimiert. Es misst die Nähe der Erklärung zur Vorhersage des globalen Modells bei Vorhandensein möglicher Erklärungen (G in 1), während die Modellkomplexität \({\Omega }_{\left(g\right)}\) niedrig gehalten wird (z. B. bevorzugen Sie weniger Funktionen). In dieser Studie haben wir alle Eingabemerkmale verwendet, da wir weniger Eingabemerkmale hatten (n = 11). Daher untersuchten wir die Erklärungen der Beiträge jedes Prognoseparameters zur vorhergesagten Ausgabe einer bestimmten Vorhersageinstanz (8. Instanz in den Trainingsdaten) (Abb. 4).

In ähnlicher Weise berechnet die SHAP-Technik die Beiträge jedes Merkmals zur endgültigen Vorhersage einer Entscheidung unseres XGBoost-Modells (d. h. baumbasiertes Modell) für jede Instanz \({x}_{i}\). Insbesondere wird TreeSHAP verwendet, um die Shapley-Werte von Features im Modell zu schätzen. Diese Shapley-Werte bieten eine Möglichkeit, den Beitrag jedes Merkmals zur Vorhersage des Modells zu quantifizieren (Abb. 5). Die Shapley-Werte werden berechnet, indem man mit einem Nullmodell ohne unabhängige Variablen beginnt und dann den durchschnittlichen Grenzbeitrag berechnet, wenn jede Variable in einer Sequenz zu diesem Modell hinzugefügt wird, also über alle möglichen Sequenzen gemittelt wird. Die additive Attributionsmethode (2) wurde verwendet, um die SHAP-Werte für den gesamten Datensatz zu berechnen und anzunähern (Abb. 5).

Daher basiert es darauf, wie viele Trainingsbeispiele Pfade im Baum mit einer Rechenkomplexität von \(O({TLD}^{2})\) durchlaufen haben, wobei T die Anzahl der Bäume und L die maximale Anzahl der Blätter ist in jedem Baum und D die maximale Tiefe eines beliebigen Baumes. Dadurch werden die Rohvorhersagen aus den Blattknoten der Bäume erklärt. Das heißt, die Auswirkung jedes Merkmals an jedem Knoten wird berechnet, indem der Baum rekursiv vom Wurzelknoten zu einem Blattknoten durchlaufen wird und der Beitrag jedes Merkmals bei jeder Teilung auf dem Weg berechnet wird. Der Beitrag wird dann mit der Anzahl der Trainingsbeispiele gewichtet, die diese Aufteilung durchlaufen, und der Shapley-Wert des Features wird als Summe der gewichteten Beiträge über alle Pfade geschätzt, die das Feature enthalten. Ebenso wurde der spezifische Beitrag des Eingabemerkmals zu einer bestimmten Vorhersage untersucht (Abb. 6, 7). Sowohl die LIME- als auch die SHAP-Technik wurden auf dem mit XGBoost trainierten Modell implementiert.

Aufgrund der Seltenheit von NPCs haben wir eine Kombination aus zeitlichen und geografischen externen Validierungen verwendet. Die zeitliche Validierung liegt zwischen interner und externer Validierung24. Wir haben die zeitliche Validierung durch eine vollständig unabhängige geografische externe Validierung ergänzt. Die zeitliche externe Validierung erfolgte anhand reservierter Fälle (n = 547), die weder beim Training noch beim Testen des Modells verwendet wurden. Um den Prozess der zeitlichen Validierung zu ergänzen, verwendeten wir einen Datensatz (n = 60), der vom Helsinki University Hospital (HUS) (Forschungsgenehmigungsnummer: Dnro THL/1197/5.05.00/2012) für die geografische externe Validierung gesammelt wurde (Tabelle 2). .

Die Ergebnisse der geografischen externen Validierung geben die Goldstandardleistung des Modells an (Tabelle 3). Die Leistung des externen Validierungsprozesses wurde im Hinblick auf Konkordanzindex (c-Index), Fläche unter der Kurve (AUC), Sensitivität, Spezifität, positiver Vorhersagewert (PPV), negativer Vorhersagewert (NPV), F1-Score und Genauigkeit bewertet und Mathews Korrelationskoeffizient (Tabelle 3).

Die Studienkohorte für die ML-Modellentwicklung umfasste 1094 Patienten mit Nasopharynxkrebs; 756 Männer und 338 Frauen in einem Verhältnis von Männern zu Frauen von 2,2:1. Das Durchschnittsalter bei der Diagnose betrug 55,1 (SD \(\pm\) 15,1: Bereich 7–85) und das Durchschnittsalter betrug 55,0 Jahre. Bezüglich des Tumorstadiums zeigte das 7. TNM-Stadieneinteilungsschema des AJCC, dass 393 (35,9 %) Patienten das Stadium T1, 206 (18,8 %) das Stadium T2, 222 (20,3 %) Patienten das Stadium T3 und 273 (25,0 %) das Stadium T4 hatten . Ebenso waren für den Knotenparameter 242 (31,3 %) N0, 389 (35,6 %) N1, 361 (33,0 %) N2 und 2 (0,2 %) N3; während 1001 (91,5 %) für M0 und 93 (8,5 %) für M1 waren. Bezüglich der histologischen Einstufung waren 34 (3,1 %) Tumoren gut differenziert, 148 (13,5 %) waren mäßig differenziert, 440 (40,2 %) waren schlecht differenziert und 472 (43,1 %) waren undifferenziert. Die Nachbeobachtungszeit lag zwischen 0 und 107 Monaten (Mittelwert 50,2; Median 51,5; SD \(\pm\) 30,9). Andere wichtige Parameter wie die ethnische Zugehörigkeit: 462 (42,2 %) waren weißer Herkunft, 89 (8,1 %) waren Schwarze und 543 (49,6 %) waren anderer Herkunft, darunter Indianer/AK-Ureinwohner und Bewohner asiatischer/pazifischer Inseln. Unter Berücksichtigung des Familienstands waren 697 (63,7 %) zum Zeitpunkt der Diagnose verheiratet, während 338 (30,9 %) als unverheiratet (ledig, geschieden, verwitwet oder getrennt lebend) galten (Tabelle 1). Die Strahlentherapie war in dieser Serie die häufigste Bestrahlungsart. Die klinisch-pathologischen Merkmale sind in Tabelle 1 kurz zusammengefasst.

Das Durchschnittsalter der Kohorte für die zeitliche Form der externen Validierung (n = 547) zum Zeitpunkt der Diagnose betrug 55,1 Jahre (Median: 57; SD \(\pm 14,8;\) Bereich 9–85). Das Verhältnis von Männern zu Frauen betrug 2,5:1, wobei 390 Männer und 157 Frauen waren. In Bezug auf die ethnische Zugehörigkeit waren 392 (62,0 %) weißer Herkunft, 100 (18,3 %) waren Schwarze und 108 (19,7 %) waren anderer Herkunft, darunter Indianer/AK-Ureinwohner und Bewohner asiatischer/pazifischer Inseln. Unter Berücksichtigung des Familienstands waren 314 (57,4 %) zum Zeitpunkt der Diagnose verheiratet, während 233 (42,6 %) als unverheiratet (ledig, geschieden, verwitwet oder getrennt lebend) galten (Tabelle 2). Das AJCC TNM-Tumorstadium zeigte, dass 183 (33,5 %) Patienten das Stadium T1, 108 (19,7 %) das Stadium T2, 123 (22,5 %) Patienten das Stadium T3 und 133 (24,3 %) das Stadium T4 hatten. Ebenso waren für den Knotenparameter 177 (32,4 %) N0, 215 (39,3 %) N1, 154 (28,2 %) N2 und 1 (0,2 %) N3; während 497 (90,6 %) für M0 und 50 (9,1 %) für M1 waren. Hinsichtlich der Einstufung waren 27 (4,9 %) Tumoren gut differenziert, 93 (17,0 %) mäßig differenziert, 225 (46,6 %) schlecht differenziert und 172 (31,4 %) undifferenziert. Die Nachbeobachtungszeit lag zwischen 0 und 107 Monaten (Mittelwert 43,8; Median 43,0; SD \(\pm\) 28,6).

Die HUS-Kohorte für die Entwicklung der geografischen externen Validierung umfasste 60 überwiegend kaukasische Patienten mit NPC. Von diesen 60 Patienten waren 378 (69,1 %) älter als 40 Jahre mit einem Durchschnittsalter bei Diagnose von 56,9 Jahren (Median 57: SD \(\pm\) 11,9: Bereich 30–82). Das Verhältnis von Männern zu Frauen betrug 1,9:1, wobei 39 (65,0 %) der Patienten männlich und 21 (35,0 %) weiblich waren. Hinsichtlich der Einstufung waren 2 (3,3 %) Tumoren gut differenziert, 16 (26,7 %) waren mäßig differenziert, 41 (68,3 %) waren schlecht differenziert und 1 (1,7 %) war undifferenziert (Tabelle 2). Im Hinblick auf das AJCC-TNM-Tumorstadium hatten 20 (33,3 %) Patienten das Stadium T1, 10 (16,7 %) das Stadium T2 und jeweils 15 (25,5 %) der Patienten im Stadium T3 und T4. Ebenso waren für den Knotenparameter 24 (40,0 %) N0, 12 (20,0 %) N1, 23 (38,3 %) N2 und 1 (1,7 %) N3; 59 (98,3 %) waren M0 und 1 (1,7 %) waren M1 (Tabelle 2). Die Nachbeobachtungszeit lag zwischen 0 und 215 Monaten (Mittelwert 64,1; Median 49,0; SD \(\pm\) 57,5). Eine Operation war für die HUS-Kohorte keine bevorzugte Behandlungsoption (Tabelle 2). Daher erhielten alle Patienten dieser Kohorte eine endgültige (Chemo-)Strahlentherapie.

Die Leistungsgenauigkeit der einzelnen Algorithmen betrug 85,4 %, 83,0 %, 85,2 %, 85,3 % und 85,9 % für logistische Regression, naive Bayes-Algorithmen, k-nächste Nachbarn, Support-Vektor-Maschine und Entscheidungsbaum-Algorithmen (Abb. 3). Zusammengestapelt ergab sich für den gestapelten Algorithmus eine resultierende Genauigkeit von 85,9 % (Abb. 3). Daher zeigte das Stapeln dieser Algorithmen keine signifikanten Verbesserungen der Genauigkeit des Modells.

Trainingsleistung des einzelnen Algorithmus und des gestapelten Algorithmus.

Ebenso ergab der hochmoderne XGBoost-Algorithmus eine Leistungsgenauigkeit von 84,5 %. Dies weist darauf hin, dass XGBoost und der in dieser Studie untersuchte gestapelte Algorithmus eine vergleichbare Leistung zeigten. Dieses Ergebnis zeigte weiter, dass der XGBoost möglicherweise in der Lage ist, eine Vorhersageleistung zu erzielen, die mit der Kombination von fünf verschiedenen Einzelalgorithmen vergleichbar ist. Als Ergebnis führten wir eine Mischung aus zeitlichen und geografischen externen Validierungen für den XGBoost-Algorithmus durch (Tabelle 3). Die Leistungsmetriken des XGBoost mit geografischer externer Validierung wurden in dieser Studie als Goldstandardleistung angegeben (Tabelle 3).

Die zeitliche externe Validierung von XGBoost ergab eine Genauigkeit von 85,9 % und einen C-Index von 0,87. Ebenso wurde die Leistungsgenauigkeit von XGBoost extern mit einer geografischen Kohorte von HUS validiert, was eine Genauigkeit von 76,7 % und einen C-Index von 0,74 ergab. Die Spezifität sowohl für die zeitliche als auch für die externe geografische Kohorte betrug 0,89. In Bezug auf Präzision (positiver Vorhersagewert) und negativer Vorhersagewert zeigte der XGBoost eine Präzision von 0,93 für die zeitliche Validierung und 0,78 für die externe geografische Validierung. Der negative Vorhersagewert betrug 0,77 für die zeitliche Validierung und 0,76 für die externe geografische Validierung. Weitere Leistungsmetriken aus dem Hybridvalidierungsansatz sind in Tabelle 3 aufgeführt.

Die LIME-Technik erklärt und interpretiert die Vorhersage einer Instanz (dh für einen einzelnen Patienten) weiter (Abb. 4).

LIME-Erklärbarkeit einer einzelnen Instanz.

Die Ergebnisvorhersage der in Abb. 4 gezeigten Patienten zeigt beispielsweise, dass bei diesem bestimmten Patienten die Wahrscheinlichkeit eines OS aufgrund von NPC mit einer Vorhersagesicherheit von 54,0 % gering ist. Darüber hinaus wird die Begründung für die Vorhersage weiter erläutert, indem angegeben wird, wie die Eingabemerkmale sind (z. B. T-Stadium = fortgeschrittenes Stadium, M-Stadium = in andere Teile metastasiert, Tumorgrad = schlecht differenziert, ethnische Zugehörigkeit = weiße Herkunft und Geschlecht). = männlich) haben zum vorhergesagten Ergebnis beigetragen (geringe Wahrscheinlichkeit eines OS).

In ähnlicher Weise liefert die SHAP-Technik eine Erklärung für die Vorhersage eines Ergebnisses, indem sie den Beitrag jedes Merkmals zur Vorhersage berechnet [lokale und globale Erklärungen] (Abb. 5, 6). Aus Abb. 5 (lokale Vorhersage – individuelle Vorhersagen des Modells) geht hervor, dass der Vorhersagewahrscheinlichkeitswert \([f(x)]\) des Modells jeweils − 1,90, 0,99 und 2,20 für die NPC-Patienten 1–3 betrug. Wie in Tabelle 1 gezeigt, gab die Bezeichnung des Zielergebnisses an, dass 0 eine hohe Überlebenschance und 1 eine niedrige Überlebenschance bedeutet. Daher war die Vorhersagewahrscheinlichkeit des Modells für den ersten Patienten eine hohe Überlebenschance, während für den zweiten und dritten Patienten eine niedrige Überlebenschance vorhergesagt wurde (Abb. 5a – c).

SHAP-Kraftdiagramm, das (a) eine hohe Überlebenschance (b, c) ein niedriges Überlebensrisiko zeigt.

Gesamtbeitrag jedes Features zur Vorhersage.

Die Zahlen auf den Diagrammpfeilen geben den Wert des Eingabemerkmals für jeden Patienten an (Abb. 5). Je größer der Pfeil, desto größer ist der Einfluss der Funktion auf die Ausgabe. Daher gilt für den ersten Patienten mit \(\left[f\left(x\right)\right]= -1,90\), Familienstand (unverheiratet), Grad (mäßig differenziert), ethnische Zugehörigkeit (kaukasisch), Alter des Patienten (65 Jahre) und das T-Stadium (T3) haben einen negativen Beitrag (Abb. 6a) zur Vorhersage, dass der Patient eine hohe Überlebenschance hat, während andere Eingabemerkmale einen positiven Beitrag zum vorhergesagten Ergebnis haben. Bemerkenswert ist, dass sowohl der Familienstand als auch das T-Stadium nahezu gleiche positive Beiträge leisten, da beide die gleiche Pfeilgröße haben, während das Alter des Patienten, die Klasse und die ethnische Zugehörigkeit ebenfalls gleiche Beiträge zur Vorhersage des Modells leisten, da sie fast die gleiche Pfeilgröße haben (Abb. 5).

Ebenso gilt für den zweiten Patienten mit \(\left[f\left(x\right)\right]= +0,99\), Bestrahlung (keine Strahlenbehandlung), Geschlecht (männlich), Grad (gut differenziert), Alter des Patienten Patient (62 Jahre) und T-Stadium (T3) haben einen positiven Beitrag (Abb. 5b) zur Vorhersage, dass der Patient eine geringe Überlebenschance hat, während andere Eingabemerkmale einen negativen Beitrag zum vorhergesagten Ergebnis haben. Ähnliches gilt für den dritten Patienten mit \(\left[f\left(x\right)\right]= +2,20\), Bestrahlung (keine Strahlentherapie gegeben), N-Stadium (keine Fernmetastasierung), Familienstand (unverheiratet) , Grad (mäßig differenziert), Alter des Patienten (62 Jahre) und T-Stadium (T4) tragen positiv dazu bei (Abb. 5c), dass der Patient eine geringe Überlebenschance hat. Der globale Beitrag jeder Variablen zur gesamten Vorhersagefähigkeit des Modells wird in einem SHAP-Bienenwarmdiagramm dargestellt (Unterabschnitt „Erklärbarkeit und Interpretierbarkeit des XGBoost-Modells“).

Die Merkmalsbedeutung der auf der SHAP-Technik basierenden Eingabevariablen zeigte, dass in absteigender Reihenfolge der Signifikanz das Alter der Patienten, das T-Stadium, die ethnische Zugehörigkeit, das M-Stadium, der Familienstand und der Grad des Tumors als relevant ermittelt wurden Eingabevariablen, die einen signifikanten Einfluss auf die Leistung des Modells hatten, um die Wahrscheinlichkeit eines OS bei NPC-Patienten vorherzusagen (Abb. 6). Ebenso ist der detaillierte Beitrag dieser Variablen zur Überlebenswahrscheinlichkeit von NPC in Abb. 7 dargestellt.

SHAP-Beeswarm-Zusammenfassungsdiagramm zum Einfluss von Eingabevariablen auf die Vorhersagefähigkeit des XGBoost-Modells.

Das SHAP-Bienenschwarmdiagramm bietet darüber hinaus detaillierte Erläuterungen dazu, wie die in den einzelnen Variablen enthaltenen Parameter zum interessierenden Ergebnis beitragen (globale Erklärung und Interpretation).

Wie in Abb. 7 dargestellt, kann das erwartete Ergebnis entweder eine hohe Überlebenschance (negative Seite auf der x-Achse) oder eine niedrige Überlebenschance (positive Seite auf der x-Achse) sein. Daher wurden die Einzelheiten der Wirkung jedes einzelnen Prognoseparameters in Abb. 7 dargestellt. Daher wurde festgestellt, dass niedrigeres Alter, niedrigeres T- und M-Stadium (Tumor und Fernmetastasierung), verheiratet, asiatische ethnische Zugehörigkeit, Geschlecht (weiblich) und nicht-chirurgische Behandlung (Chemotherapie und Strahlentherapie) waren mit einer höheren Wahrscheinlichkeit eines OS von NPC verbunden (Abb. 7).

Wir haben die vielversprechende Vorhersageleistung von fünf verschiedenen Einzelalgorithmen genutzt, indem wir sie zu einem einzigen und einzigartigen Algorithmus (gestapelter Algorithmus) kombiniert haben, der eine hohe Vorhersagegenauigkeit aufweist. Der gestapelte Algorithmus wurde verwendet, um ein maschinelles Lernsystem (ML) zur Vorhersage der Überlebenschancen von Patienten mit Nasopharynxkarzinom (NPC) zu entwickeln. Angesichts der zunehmenden Anwendung des Extreme Gradient Boosting (XGBoost)-Algorithmus in vielen klinischen Anwendungen aufgrund seiner herausragenden Leistung haben wir die Vorhersageleistung des gestapelten Algorithmus mit einem anderen Modell verglichen, das mit dem XGBoost-Algorithmus entwickelt wurde. Der Vergleich basierte auf einer unabhängigen geografischen externen Validierungskohorte des Helsinki University Hospital (HUS). Wir fanden heraus, dass sowohl der gestapelte Algorithmus als auch der XGBoost-Algorithmus bei der Stratifizierung der Überlebenschancen von NPC-Patienten vergleichbare Ergebnisse erzielten.

Aufgrund der anhaltenden Kritik an ML-Modellen, weil ihre Vorhersagen oft intransparent und nicht interpretierbar sind, haben wir außerdem Erklärbarkeit und Interpretierbarkeit in die Vorhersagen des XGBoost-Modells mithilfe von LIME- und SHAP-Techniken integriert. Diese Techniken heben patientenspezifische Informationen darüber hervor, wie jede Variable zur vom Modell vorhergesagten OS-Wahrscheinlichkeit beigetragen hat (lokale Interpretation), zum Grad der Genauigkeit der vorhergesagten OS-Wahrscheinlichkeit (lokale Erklärung) für einen bestimmten Patienten und wie jede dieser Variablen trug zur vorhergesagten Leistung des Modells bei (globale Erklärung und Interpretation). Dieser Ansatz ist auf die personalisierte Behandlung von NPC-Krebs ausgerichtet.

In der Vergangenheit wurden mehrere ML-Algorithmen zur Prognose der Ergebnisse bei verschiedenen Unterarten von Kopf- und Halskrebs eingesetzt18,20,31,32,33,34,35. Es gibt jedoch einen wachsenden Trend, das Potenzial von ML bei der Bewertung von Prognosen zu untersuchen, insbesondere bei Nasopharynxkrebs18,20. Beispielsweise zeigt die Studie von Oei et al. Verglich den ML-Ansatz speziell mit herkömmlichen Statistiken und stellte fest, dass ML diese übertrifft20. Ebenso die Studie von Akcay et al. verglichen verschiedene einzelne ML-Algorithmen bei der Prognose der Ergebnisse bei NPC-Patienten18. Diese Studien verwendeten jedoch eine relativ kleine Anzahl von Fällen. Darüber hinaus waren die entwickelten Modelle weder extern validiert noch erklärbar. Wir haben uns auf diese Forschungslücke konzentriert, indem wir das Potenzial eines gestapelten ML-Algorithmus untersucht haben, der fünf einzelne ML-Algorithmen zur Prognose des OS bei NPC anhand einer relativ großen Anzahl von Fällen kombiniert. Basierend auf den vielversprechenden Ergebnissen in diesem Forschungsbereich wurden verschiedene Modifikationen an den zugrunde liegenden ML-Algorithmen vorgenommen, um die Leistung zu verbessern. Ein Beispiel für diese Modifikationen ist die effektive Implementierung des Gradient Boosting Ensemble-Paradigmas, um den Extreme Gradient Boosting ML-Algorithmus oder kurz XGBoost zu erreichen36. Wir untersuchten daher die Verwendung dieses leistungsstarken Algorithmus zur Prognose des OS bei NPC-Patienten. Darüber hinaus nutzte diese Studie das Potenzial der LIME- und SHAP-Techniken, um Erklärungen und Interpretationen der vom Modell gemachten Vorhersagen zu liefern. Insbesondere ist die SHAP-Technik bereit, weitere Erklärungen zur Bedeutung jeder Eingabevariablen für die OS-Chance-Stratifizierungsleistung des XGBoost-Modells zu liefern.

Trotz der Kombination mehrerer Algorithmen zur Bildung des gestapelten Modells erbrachte das XGBoost-Modell allein eine vergleichbare Leistung. Dies liegt daran, dass der Algorithmus so konzipiert wurde, dass er eine Reihe iterativ konstruierter Baummodelle generiert, bei denen die Bäume einzeln zum Ensemble hinzugefügt und angepasst werden, sodass die Vorhersagefehler der vorherigen Modelle angemessen korrigiert werden36,37. Diese Architektur (Boosting-Ansatz) verbessert die Modellleistung36,37. Daher handelt es sich um einen recheneffizienten (d. h. schnell auszuführenden) ML-Algorithmus, der auf einer skalierbaren End-to-End-Baum-Boosting-Systemarchitektur36 basiert. Angesichts der anhaltenden Verbreitung medizinischer Daten und des Strebens nach personalisierter und präziser Medizin bietet der Extreme Gradient Boosting-Algorithmus das Potenzial, das ML der Wahl zu sein, da er eine bemerkenswert schnelle Ausführungsgeschwindigkeit und Modellleistung bieten kann36.

Die vom trainierten ML-Modell gezeigte Vorhersagegenauigkeit soll den Klinikern ein genaues, objektives und kostengünstigeres Hilfsmittel bieten18. Dieses Modell kann den Ärzten eine verbesserte Meinung liefern und das TNM-Stufensystem bei der Überlebensprognose durch die Einbeziehung mehrerer Parameter ergänzen. Eine solche Strategie ist wichtig, um eine individuelle Behandlungsplanung für NPC-Patienten zu ermöglichen. Neben der Vorhersageleistung des XGBoost-Modells liefern sowohl die Local Interpretable Model Agnostic Explanations (LIME) als auch die SHapley Additive ExPlanations (SHAP)-Techniken die Begründung für die vorhergesagten Ergebnisse des Modells.

Die LIME- und SHAP-Techniken sind beide modellunabhängige Techniken zur Bereitstellung von Erklärungen für die Vorhersage eines ML-Modells27,29. Diese Techniken können die komplexen Beziehungen zwischen den Eingabemerkmalen und dem Zielergebnis interpretieren. Der LIME-Ansatz zeigt beispielsweise den Grad der Wahrscheinlichkeit der Richtigkeit der Vorhersage und wie jeder Faktor zu den möglichen Ergebnissen beigetragen hat (Abb. 4). Diese durch die LIME-Technik bereitgestellte zusätzliche Funktionalität soll ein transparentes ML-Modell bereitstellen, insbesondere im Hinblick auf das vorhergesagte Ergebnis. Folglich haben Kliniker als Entscheidungsträger und andere Interessenvertreter eine größere Sichtbarkeit, ein besseres Verständnis und mehr Vertrauen in die Erklärungen der Entscheidungen, die zum Ergebnis des Modells führen. Die SHAP-Technik hingegen bietet Erklärbarkeit und Interpretierbarkeit wie LIME, jedoch auf detailliertere und kompaktere Weise unter Verwendung der theoretisch optimalen Shapley-Werte des Spiels.

Der Hauptunterschied zwischen LIME- und SHAP-Techniken besteht darin, dass LIME nur eine Erklärung und Interpretation für eine einzelne Vorhersage des ML-Modells bereitstellt (lokale Interpretation), während SHAP den Beitrag jeder Eingabevariablen zur Vorhersage des Modells bereitstellt (lokale Erklärungen und). Interpretationen) (Abb. 5, 7). Darüber hinaus untersucht die SHAP-Technik den Beitrag jeder Eingabevariablen zur gesamten Vorhersagefähigkeit des Modells (globale Erklärungen und Interpretationen) (Abb. 6). Im Gegensatz zur herkömmlichen Merkmalsbedeutung, die einen allgemeinen Überblick über die Eingabevariablen bietet, zeigt die SHAP-basierte Merkmalsbedeutung darüber hinaus, wie die in jeder Variablen enthaltenen Parameter zur gesamten Vorhersagefähigkeit des Modells beigetragen haben (Abb. 5).

Die Bedeutung der Eingabevariablen für die OS-Vorhersage mithilfe der SHAP-Technik zeigte, dass Alter, T-Stadium, ethnische Zugehörigkeit, M-Stadium, Familienstand und Klasse in absteigender Reihenfolge ihrer Signifikanz zu den wichtigsten Prognosefaktoren gehörten (Abb. 6). . Insbesondere waren niedrigeres Alter, niedrigeres T- und M-Stadium (Tumor und Fernmetastasierung), verheiratet, asiatische ethnische Zugehörigkeit, Geschlecht (weiblich) und nicht-chirurgische Behandlung (Chemotherapie und Strahlentherapie) mit einer höheren Wahrscheinlichkeit eines OS von NPC verbunden (Abb. 7). Diese Beobachtung wurde durch mehrere Studien bestätigt und hervorgehoben12,38,39, zum Beispiel die Studie von Zhu et al., die die prognostische Rolle des Alters bei einer Serie von 469 NPC-Patienten12 zeigt. Das Vorkommen von NPC nimmt mit zunehmendem Alter stetig zu und die höchste Inzidenz tritt in verschiedenen Altersstufen auf, normalerweise jedoch im Alter zwischen 40 und 59 Jahren12,40,41,42. Daher sollten verschiedene Organisationen Anstrengungen unternehmen, um den Schwellenwert für die Einteilung der Patienten in junge oder alte NPC-Patienten festzulegen und Behandlungsrichtlinien für beide Gruppen bereitzustellen18. Aufgrund der Identifizierung des Alters durch das evaluierte ML-Modell als wichtigen Faktor in dieser Studie ist es von großer Bedeutung, altersspezifische Unterschiede bei NPC im Hinblick auf gezielte Behandlungsmodalitäten zu erkennen12.

Unser ML-Modell identifizierte die ethnische Zugehörigkeit als einen der wichtigen Überlebensfaktoren. Dies wird durch die Tatsache bestätigt, dass NPC in Südchina und Südostasien endemisch ist43,44,45. Fernmetastasen wurden von unserer SHAP-Technik als wichtig für die Prognose des OS bei NPC-Patienten erachtet. Es wurde berichtet, dass es der wichtigste negative Prognosefaktor bei Nasopharynxkrebs ist46,47,48, da eine fortgeschrittene Fernmetastasierung mit einem deutlich schlechteren krankheitsfreien Überleben und OS verbunden war44,49,50. Dieses Ergebnis wurde durch andere Studien gestützt, die darauf hinwiesen, dass Rezidive und Fernmetastasen derzeit die Hauptgründe für suboptimale Behandlungsergebnisse bei NPC51,52 sind. Da NPC außerdem in der Nähe eines Bereichs mit reichlich vorhandenem Lymphsystem entstehen, neigt es häufiger zur Metastasierung als Karzinome aus anderen Teilbereichen des Kopfes und Halses10,53.

Bemerkenswerterweise unterscheidet sich die Prognose von Patienten mit Fernmetastasen zum Zeitpunkt der Diagnose von denen von Patienten, die nach der Behandlung Fernmetastasen entwickelten54,55,56,57,58,59. Gleichzeitig scheint das Stadieneinstufungsschema des AJCC keine aufschlussreiche Lösung für den oben erwähnten Unterschied in der Prognose von Patienten mit Fernmetastasen zu bieten, da das Stadieneinteilungsschema Patienten mit Fernmetastasen als eine einzige Gruppe betrachtet54,60,61. Daher ist die Anwendung des ML-Modells als Überlebenschance-Stratifizierungssystem, das die Vorhersage des OS bei NPC-Patienten bereits bei der Diagnose ermöglicht, sowohl für die therapeutische Entscheidungsfindung als auch für die Forschung wertvoll.

Bei NPC stellt die Strahlentherapie die Behandlung der Wahl dar46,47,48,54,62,63 und die systemische Chemotherapie bleibt eine wichtige adjuvante Modalität54. Keine dieser primären Behandlungsmodalitäten wurde jedoch durch die SHAP-Technik als eine der bedeutsamsten für die Vorhersage des OS bei NPC hervorgehoben. Stattdessen scheint eine kombinierte Behandlungsstrategie mit Strahlentherapie und Chemotherapie für das OS bei NPC am nützlichsten zu sein64,65. Der Einsatz einer intensitätsmodulierten Strahlentherapie bietet einen wirksamen Behandlungsansatz zur Verbesserung der OS-Raten bei NPC66,67,68.

Zusammenfassend lässt sich sagen, dass der Einsatz disruptiver Technologien wie der ML-Algorithmen zur Schätzung der NPC-Prognose geeignet ist, die Unterschiede im TNM-Stufenschema des AJCC und die heterogenen Behandlungsergebnisse bei NPC-Patienten mit Fernmetastasen zu beseitigen. Dies liegt daran, dass der ML-Ansatz eine genaue Prognose für das Ergebnis einer gezielten Behandlungsplanung liefern kann. Das ML-Paradigma kann die komplexen Beziehungen zwischen diesen Variablen untersuchen. Darüber hinaus ist es in der Lage zu analysieren, wie ähnliche Patienten in der Vergangenheit reagiert haben, und so auch das Ergebnis des betreffenden neuen Patienten vorherzusagen. Die Prognose des Ergebnisses dieser komplexen und heterogenen Gruppe von Krankheiten ist wichtig, um die Behandlungsplanung entsprechend zu steuern. Daher bietet die Kombination hochpräziser und modernster ML-Modelle mit Erklärbarkeit und Interpretierbarkeit einen vielversprechenden Weg zur Stratifizierung der Überlebenschancen von NPC-Patienten.

Unsere Studie weist einige Einschränkungen auf. Zunächst wurde unser Modell anhand von Daten entwickelt, die aus der SEER-Datenbank stammen, einer der größten öffentlich zugänglichen Krebsdatenbanken für die Bevölkerung der Vereinigten Staaten. Daher sind die aus dieser Datenbank erhaltenen Daten nicht direkt auf den EBV-assoziierten endemischen NPC anwendbar, der in Südchina und Südostasien beobachtet wird. Bemerkenswerterweise gehört die EBV-Variante bei NPC zum WHO-Klassifikationstyp 3, im Gegensatz zu den anderen Typen, die bei sporadischen NPC auftreten. Daher kann das in dieser Studie vorgeschlagene Modell aufgrund der inhärenten Unterschiede im NPC nicht direkt mit einem asiatischen NPC-Datensatz in Verbindung gebracht werden. Zweitens wurde das ML-Modell auf der Grundlage retrospektiver Daten entwickelt. Drittens wurde das entwickelte Modell extern mit einer Mischung aus zeitlichen und geografischen externen Validierungsparadigmen validiert. Eine weitere geografische externe Validierung ist bei einer relativ großen Anzahl von Fällen erforderlich. Die insgesamt durchgeführten Metriken des Modells zeigten, dass das Modell mit einem ausgewogeneren Datensatz neu trainiert werden kann. Trotz dieser Mängel zeigte das ML-Modell immer noch eine signifikante Vorhersagefähigkeit. Eine weitere Validierung in anderen Populationen, einschließlich asiatischer Patientengruppen, ist wichtig und prospektive Studien sind gerechtfertigt. In Bezug auf asiatische Patientengruppen wurde veröffentlicht, dass die Integration der Plasma-EBV-DNA in das TNM-Staging die prognostischen Auswirkungen weiter unterscheiden wird. Daher können in zukünftigen Studien KI-Modelle anhand solcher Daten entwickelt werden. Solche Modelle können als Hilfsinstrumente zur Stratifizierung der Überlebenschancen und zur Managementberatung dienen. Die Modellleistung kann in Zukunft durch föderiertes Lernen verbessert werden.

Die aus der aktuellen Studie generierten Datensätze sind auf begründete Anfrage beim entsprechenden Autor erhältlich.

Chiang, CL et al. Prognostische Faktoren für das Gesamtüberleben bei Nasopharynxkarzinomen und Auswirkungen auf das TNM-Stadieneinteilung nach UICC: Eine systematische Überprüfung der Literatur. Vorderseite. Oncol. 11, (2021).

Torre, LA et al. Globale Krebsstatistik, 2012: Globale Krebsstatistik, 2012. CA Cancer J. Clin. 65, 87–108 (2015).

Artikel PubMed Google Scholar

Wei, K., Xu, Y., Liu, J., Zhang, W. & Liang, Z. Histopathologische Klassifikation des Nasopharynxkarzinoms. Asiatischer Pac. J. Krebs Vorher. 12, 1141–1147 (2011).

PubMed Google Scholar

El-Naggar, AK, Chan, JKC, Takata, T., Grandis, JR & Slootweg, PJ Die vierte Ausgabe des Kopf-Hals-Bluebooks der Weltgesundheitsorganisation: Perspektiven der Herausgeber. Summen. Pathol. 66, 10–12 (2017).

Huang, WB, Chan, JYW & Liu, DL Humanes Papillomavirus und Nasopharynxkarzinom Typ III der Weltgesundheitsorganisation: Multizentrische Studie aus einem Endemiegebiet in Südchina: Humanes Papillomavirus und NPC. Krebs 124, 530–536 (2018).

Artikel PubMed Google Scholar

Almangush, A. et al. Tumorinfiltrierende Lymphozyten stehen im Zusammenhang mit dem Ergebnis bei nichtendemischem Nasopharynxkarzinom: Eine multizentrische Studie. Summen. Pathol. 81, 211–219 (2018).

Artikel CAS PubMed Google Scholar

Ruuskanen, M. et al. Ergebnisse des Nasopharynxkarzinoms in Finnland: Eine landesweite Studie. Acta Oncol. 57, 251–256 (2018).

Artikel PubMed Google Scholar

Guo, R. et al. Die Entwicklung des Nasopharynxkarzinom-Stadiums. BJR 92, 20190244 (2019).

Artikel PubMed PubMed Central Google Scholar

Ferlay, J. et al. Globales Krebsobservatorium: Krebs heute (2018). (2020).

Lee, AWM et al. Der Kampf gegen Nasopharynxkrebs. Radiother. Oncol. 104, 272–278 (2012).

Artikel PubMed Google Scholar

Kernohan, MD, Clark, JR, Gao, K., Ebrahimi, A. & Milross, CG Vorhersage der Prognose eines oralen Plattenepithelkarzinoms nach dem ersten Rezidiv. Bogen. Otolaryngol. Kopf-Hals-Chirurgie. 136, 1235 (2010).

Artikel PubMed Google Scholar

Zhu, Y., Song, X., Li, R., Quan, H. & Yan, L. Beurteilung von Nasopharynxkrebs bei jungen Patienten im Alter ≤ 30 Jahre. Vorderseite. Oncol. 9, (2019).

Lee, AWM et al. Die Stärken/Schwächen des AJCC/UICC-Stufensystems (7. Auflage) für Nasopharynxkrebs und Vorschläge für zukünftige Verbesserungen. Orale Onkol. 48, 1007–1013 (2012).

Lin, J.-C. et al. Quantifizierung der Plasma-Epstein-Barr-Virus-DNA bei Patienten mit fortgeschrittenem Nasopharynxkarzinom. N. engl. J. Med. 350, 2461–2470 (2004).

Artikel CAS PubMed Google Scholar

Wang, W.-Y. et al. Langzeitüberlebensanalyse von Nasopharynxkarzinomen anhand der DNA-Spiegel des Epstein-Barr-Virus im Plasma. Krebs 119, 963–970 (2013).

Artikel CAS PubMed Google Scholar

Le, Q.-T. et al. Eine internationale Zusammenarbeit zur Harmonisierung des quantitativen Plasma-Epstein-Barr-Virus-DNA-Assays für zukünftige Biomarker-gesteuerte Studien bei Nasopharynxkarzinomen. Klin. Krebs Res. 19, 2208–2215 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Pan, X.-X. et al. Eine vereinfachte T-Klassifizierung basierend auf der 8. Ausgabe des UICC/AJCC-Stufensystems für Nasopharynxkarzinome. CMAR 11, 3163–3169 (2019).

Akcay, M., Etiz, D., Celik, O. & Ozen, A. Bewertung der Prognose bei Nasopharynxkrebs mittels maschinellem Lernen. Technol. Krebs Res. Behandeln. 19, 153303382090982 (2020).

Artikel Google Scholar

Alabi, RO, Elmusrati, M., Leivo, I., Almangush, A. & Mäkitie, AA Plattenepithelkarzinom der Zunge im fortgeschrittenen Stadium: Ein Modell für maschinelles Lernen zur Risikostratifizierung und Behandlungsplanung. Acta Oto-Laryngol. (2023) https://doi.org/10.1080/00016489.2023.2172208.

Oei, RW et al. Vorhersage des progressionsfreien Überlebens bei Patienten mit Nasopharynxkarzinom nach intensitätsmodulierter Strahlentherapie: Maschinelles Lernen vs. traditionelle Statistik. J. Persönlich. Med. 11, 787 (2021).

Artikel Google Scholar

Chen, T. et al. Vorhersage und Risikostratifizierung der Nierenergebnisse bei IgA-Nephropathie. Bin. J. Nierendis. 74, 300–309 (2019).

Artikel PubMed Google Scholar

Li, Y. et al. Nomogramme zur Abschätzung des langfristigen Gesamtüberlebens und des Zungenkrebs-spezifischen Überlebens von Patienten mit Plattenepithelkarzinomen der Zunge. Krebsmed. 6, 1002–1013 (2017).

Artikel PubMed PubMed Central Google Scholar

SEER, Programm. Surveillance, Epidemiology, and End Results (SEER) Program (www.seer.cancer.gov) Forschungsdaten 1973–2009, National Cancer Institute, DCCPS, Surveillance Research Program, Surveillance Systems Branch, veröffentlicht im April 2012, basierend auf der Einreichung vom November 2011 (2012).

Ramspek, CL, Jager, KJ, Dekker, FW, Zoccali, C. & van Diepen, M. Externe Validierung prognostischer Modelle: Was, warum, wie, wann und wo?. Klin. Niere J. 14, 49–58 (2021).

Artikel PubMed Google Scholar

Omobolaji Alabi, R. et al. Anwendung künstlicher Intelligenz zur Stratifizierung des Gesamtüberlebensrisikos bei Oropharynxkarzinomen: Eine Validierung von ProgTOOL. Int. J. Med. Informieren. 175, 105064 (2023).

Artikel PubMed Google Scholar

Ribeiro, MT, Singh, S. & Guestrin, C. „Warum sollte ich Ihnen vertrauen?“: Erklären der Vorhersagen eines Klassifikators. arXiv:1602.04938 [cs, stat] (2016).

Gramegna, A. & Giudici, P. SHAP und LIME: Eine Bewertung der Unterscheidungskraft im Kreditrisiko. Vorderseite. Artif. Intel. 4, 752558 (2021).

Artikel PubMed PubMed Central Google Scholar

Alabi, R., Almangush, A., Elmusrati, M., Leivo, I. & Mäkitie, AA Ein interpretierbares Prognosesystem für maschinelles Lernen zur Risikostratifizierung bei Oropharynxkrebs. Int. J. Med. Informieren. 168, 104896 (2022).

Artikel Google Scholar

Lundberg, SM & Lee, S.-I. Ein einheitlicher Ansatz zur Interpretation von Modellvorhersagen. Auf der 31. Konferenz über neuronale Informationsverarbeitungssysteme (NIPS 2017), Long Beach, CA, USA. (2017).

Joseph, A. Parametrische Inferenz mit universellen Funktions-Approximatoren. (2019) https://doi.org/10.48550/ARXIV.1903.04209.

Alabi, RO et al. Vergleich überwachter Klassifikationstechniken des maschinellen Lernens bei der Vorhersage lokoregionaler Rezidive bei frühem Mundzungenkrebs. Int. J. Med. Informieren. https://doi.org/10.1016/j.ijmedinf.2019.104068 (2019).

Artikel PubMed Google Scholar

Alabi, RO et al. Anwendung für maschinelles Lernen zur Vorhersage lokoregionaler Rezidive bei frühem Mundzungenkrebs: Ein webbasiertes Prognosetool. Virchows-Bogen. 475, 489–497 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Bur, AM et al. Maschinelles Lernen zur Vorhersage okkulter Knotenmetastasen bei frühen oralen Plattenepithelkarzinomen. Orale Onkol. 92, 20–25 (2019).

Artikel PubMed Google Scholar

Karadaghy, OA, Shew, M., New, J. & Bur, AM Entwicklung und Bewertung eines maschinellen Lernmodells zur Vorhersage des Überlebens von Patienten mit oralem Plattenepithelkarzinom. JAMA Otolaryngol. Kopf-Hals-Chirurgie. 145, 1115 (2019).

Artikel PubMed PubMed Central Google Scholar

Karadaghy, OA, Kallogjeri, D. & Piccirillo, JF Entwicklung eines neuen Systems zur Einstufung des klinischen Schweregrads für Patienten mit nicht metastasiertem papillärem Schilddrüsenkarzinom. JAMA Otolaryngol. Kopf-Hals-Chirurgie. 143, 1173 (2017).

Artikel PubMed PubMed Central Google Scholar

Chen, T. & Guestrin, C. XGBoost: Ein skalierbares Baum-Boosting-System. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining 785–794 (ACM, 2016). https://doi.org/10.1145/2939672.2939785.

Chen, X. et al. Ein interpretierbares Prognosesystem für maschinelles Lernen für lokoregional fortgeschrittenes Nasopharynxkarzinom basierend auf Tumorlastmerkmalen. Orale Onkol. 118, 105335 (2021).

Artikel PubMed Google Scholar

Hamilton, SN et al. Asiatische versus nicht-asiatische Ergebnisse beim Nasopharynxkarzinom: Eine nordamerikanische bevölkerungsbasierte Analyse. Bin. J. Clin. Oncol. 39, 575–580 (2016).

Artikel PubMed Google Scholar

Li, W.-Z. et al. Altersabhängige Veränderungen der Geschlechterunterschiede beim Überleben von Nasopharynxkarzinomen. Biol. Geschlecht unterschiedlich. 12, 18 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Qiu, W.-Z. et al. Eine retrospektive Studie, in der die Ergebnisse und Toxizitäten der intensitätsmodulierten Strahlentherapie mit der zweidimensionalen konventionellen Strahlentherapie zur Behandlung von Nasopharynxkarzinomen bei Kindern und Jugendlichen verglichen werden. J. Cancer Res. Klin. Oncol. 143, 1563–1572 (2017).

Artikel PubMed PubMed Central Google Scholar

Li, Y. et al. Gleichzeitige Radiochemotherapie mit oder ohne Cetuximab bei Nasopharynxkarzinomen im Stadium II bis IVb: Eine Fall-Kontroll-Studie. BMC Cancer 17, 567 (2017).

Artikel PubMed PubMed Central Google Scholar

Wei, K. et al. Inzidenz und Mortalität von Nasopharynxkarzinomen in China im Jahr 2010. Chin. J. Krebs. 33, 381–387 (2014).

PubMed PubMed Central Google Scholar

Cao, S.-M., Simons, MJ & Qian, C.-N. Die Prävalenz und Prävention von Nasopharynxkarzinomen in China. Kinn. J. Cancer 30, 114–119 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Yeung, DCM, Yeung, Z., Wong, EWY, Vlantis, AC & Chan, JYK Halslymphknotenstatus beim Überleben eines regional rezidivierenden oder persistierenden Nasopharynxkarzinoms. Wissenschaft. Rep. 10, (2020).

Luo, J. et al. Weltliche Trends der Inzidenz von Nasopharynxkarzinomen in der chinesischen Bevölkerung von Singapur, Hongkong und Los Angeles, 1973–1997. EUR. J. Epidemiol. 22, 513–521 (2007).

Artikel PubMed Google Scholar

Yeh, S.-A., Tang, Y., Lui, C.-C. & Huang, E.-Y. Behandlungsergebnisse von Patienten mit Nasopharynxkarzinom im AJCC-Stadium IVC: Vorteile der primären Strahlentherapie. Jpn. J. Clin. Oncol. 36, 132–136 (2006).

Artikel PubMed Google Scholar

Lin, S. et al. Die Kombination aus hochdosierter Strahlentherapie und systemischer Chemotherapie verbessert das Überleben von Patienten mit neu diagnostiziertem metastasiertem Nasopharynxkrebs. Bin. J. Clin. Oncol. 35, 474–479 (2012).

Artikel ADS CAS PubMed Google Scholar

Chen, M.-Y. et al. Lokoregionäre Strahlentherapie bei Patienten mit Fernmetastasen eines Nasopharynxkarzinoms zum Zeitpunkt der Diagnose. Kinn. J. Cancer 32, 604–613 (2013).

Artikel PubMed PubMed Central Google Scholar

Chua, DTT, Sham, JST, Wei, WI, Ho, W.-K. & Au, GKH Der prädiktive Wert der Stadiumsklassifizierung des American Joint Committee on Cancer von 1997 bei der Bestimmung von Versagensmustern bei Nasopharynxkarzinomen. Krebs 92, 2845–2855 (2001).

3.0.CO;2-7" data-track-action="article reference" href="https://doi.org/10.1002%2F1097-0142%2820011201%2992%3A11%3C2845%3A%3AAID-CNCR10133%3E3.0.CO%3B2-7" aria-label="Article reference 49" data-doi="10.1002/1097-0142(20011201)92:113.0.CO;2-7">Artikel CAS PubMed Google Scholar

Lin, S. et al. Nasopharynxkarzinom behandelt mit volumenreduzierter intensitätsmodulierter Strahlentherapie: Bericht über das 3-Jahres-Ergebnis einer prospektiven Serie. Int. J. Radiat. Oncol. Biol. Physik. 75, 1071–1078 (2009).

Artikel PubMed Google Scholar

Sun, J., Huang, Z., Hu, Z. & Sun, R. Vorteile der lokalen Tumorentfernung und Pharyngektomie für das Überleben von Patienten mit Nasopharynxkarzinom: Eine retrospektive Beobachtungsstudie basierend auf der SEER-Datenbank. J. Übers. Med. 15, 116 (2017).

Artikel PubMed PubMed Central Google Scholar

Zhu, Q. et al. Eine Überexpression der Acylglycerinkinase ist mit einer schlechteren Prognose und einer Lymphknotenmetastasierung bei Nasopharynxkarzinomen verbunden. Tumorbiol. 37, 3349–3357 (2016).

Artikel CAS Google Scholar

Razak, ARA et al. Nasopharynxkarzinom: Die nächsten Herausforderungen. EUR. J. Cancer 46, 1967–1978 (2010).

Artikel PubMed Google Scholar

Tian, ​​Y. et al. Prognosemodell und optimale Behandlung für Patienten mit Nasopharynxkarzinom im Stadium IVc zum Zeitpunkt der Diagnose. Wissenschaft. Rep. 9, (2019).

Teo, PML, Kwan, WH, Lee, WY, Leung, SF & Johnson, PJ Prognostiker bestimmen das Überleben nach einer Fernmetastasierung eines Nasopharynxkarzinoms. Krebs 77, 2423–2431 (1996).

3.0.CO;2-N" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291097-0142%2819960615%2977%3A12%3C2423%3A%3AAID-CNCR2%3E3.0.CO%3B2-N" aria-label="Article reference 55" data-doi="10.1002/(SICI)1097-0142(19960615)77:123.0.CO;2-N">Artikel CAS PubMed Google Scholar

Ong, YK et al. Entwurf eines prognostischen Index-Scores für metastasiertes Nasopharynxkarzinom. EUR. J. Cancer 39, 1535–1541 (2003).

Artikel CAS PubMed Google Scholar

Fandi, A. et al. Langfristig krankheitsfreie Überlebende bei metastasiertem undifferenziertem Karzinom vom Nasopharynx-Typ. J. Clin. Oncol. 18, 1324–1330 (2000).

Artikel CAS PubMed Google Scholar

Khanfir, A., Frikha, M., Ghorbel, A., Drira, MM & Daoud, J. Prognosefaktoren beim metastasierten Nasopharynxkarzinom. Krebs/Radiothérapie 11, 461–464 (2007).

Artikel CAS PubMed Google Scholar

Jin, Y. et al. Aufbau eines prognostischen Score-Modells, das unverzichtbare Tumormarker für metastasiertes Nasopharynxkarzinom in einem Epidemiegebiet enthält. EUR. J. Cancer 48, 882–888 (2012).

Artikel CAS PubMed Google Scholar

Pan, C.-C. et al. Herausforderungen bei der Modifikation des M1-Stadiums des TNM-Stufensystems für Nasopharynxkarzinome: Eine Studie von 1027 Fällen und Überprüfung der Literatur. Exp. Dort. Med. 4, 334–338 (2012).

Artikel PubMed PubMed Central Google Scholar

AJCC Cancer Staging Handbook: Aus dem AJCC Cancer Staging Manual. (Springer, 2010).

Setton, J., Wolden, S., Caria, N. & Lee, N. Endgültige Behandlung des metastasierten Nasopharynxkarzinoms: Bericht über 5 Fälle mit Literaturübersicht. Kopf Hals 34, 753–757 (2012).

Artikel PubMed Google Scholar

Hu, S. et al. Eine systemische Chemotherapie, gefolgt von einer lokoregionären definitiven intensitätsmodulierten Strahlentherapie, führt zu einem verlängerten Überleben bei Nasopharynxkarzinompatienten mit Fernmetastasen bei der Erstdiagnose. Med. Oncol. 32, 224 (2015).

Artikel PubMed Google Scholar

Qiu, W.-Z. et al. Neoadjuvante Chemotherapie plus intensitätsmodulierte Strahlentherapie versus gleichzeitige Radiochemotherapie plus adjuvante Chemotherapie zur Behandlung von lokoregional fortgeschrittenem Nasopharynxkarzinom: Eine retrospektive kontrollierte Studie. Kinn. J. Krebs 35, (2016).

Sun, X.-S. et al. Der Zusammenhang zwischen der Entwicklung von Strahlentherapie, Bildtechnologie und Chemotherapie und dem Überleben von Patienten mit Nasopharynxkarzinom: Eine Kohortenstudie von 1990 bis 2012. Int. J. Radiat. Oncol. Biol. Physik. 105, 581–590 (2019).

Artikel CAS PubMed Google Scholar

Peng, G. et al. Eine prospektive, randomisierte Studie, in der Ergebnisse und Toxizitäten der intensitätsmodulierten Strahlentherapie mit der konventionellen zweidimensionalen Strahlentherapie zur Behandlung von Nasopharynxkarzinomen verglichen werden. Radiother. Oncol. 104, 286–293 (2012).

Artikel PubMed Google Scholar

Hui, EP et al. Randomisierte Phase-II-Studie zur gleichzeitigen Cisplatin-Strahlentherapie mit oder ohne neoadjuvantes Docetaxel und Cisplatin bei fortgeschrittenem Nasopharynxkarzinom. JCO 27, 242–249 (2009).

Artikel CAS Google Scholar

Du, T., Xiao, J., Qiu, Z. & Wu, K. Die Wirksamkeit der intensitätsmodulierten Strahlentherapie im Vergleich zu 2D-RT zur Behandlung von Nasopharynxkarzinomen: Eine systematische Überprüfung und Metaanalyse. PLoS ONE 14, e0219611 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Referenzen herunterladen

K. Albin Johassons Stiftelse (2022). Die Sigrid-Jusélius-Stiftung. Die Finnische Krebsgesellschaft. Finska Läkaresällskapet, Maritza und Reino Salonen Stiftung. Der Forschungsfonds des Universitätskrankenhauses Helsinki. Der Fonds des Universitätskrankenhauses Turku. Die Autoren danken Dr. Kenneth Quek für seine wertvolle Bearbeitung des Manuskripts in englischer Sprache.

Diese Autoren haben diese Arbeit gemeinsam betreut: Alhadi Almangush und Antti A. Mäkitie.

Forschungsprogramm in Systemonkologie, Medizinische Fakultät, Universität Helsinki, Helsinki, Finnland

Rasheed Omobolaji Alabi, Alhadi Almangush und Antti A. Mäkitie

Abteilung für industrielle Digitalisierung, School of Technology and Innovations, Universität Vaasa, Vaasa, Finnland

Rasheed Omobolaji Alabi & Mohammed Elmusrati

Institut für Biomedizin, Pathologie, Universität Turku, Turku, Finnland

Ilmo Leivo

Abteilung für Pathologie, Universität Helsinki, Helsinki, Finnland

Alhadi Almangusch

Fakultät für Zahnmedizin, Universität Misurata, Misurata, Libyen

Alhadi Almangush

Abteilung für Hals-Nasen-Ohren-Heilkunde, Kopf- und Halschirurgie, Universität Helsinki und Universitätsklinikum Helsinki, Helsinki, Finnland

Antti A. Mäkitie

Abteilung für Hals-Nasen-Ohren-Erkrankungen, Abteilung für klinische Wissenschaften, Intervention und Technologie, Karolinska-Institut und Karolinska-Universitätskrankenhaus, Stockholm, Schweden

Antti A. Mäkitie

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Studienkonzepte und Studiendesign: ROA, AAM, AA Datenextraktion: ROA Datenqualität: ROA Datenanalyse und -interpretation: ROA, ME, AA, AAM Manuskripterstellung: ROA, AA, AAM Manuskriptprüfung: AAM, ME, MA Manuskriptbearbeitung: AA, AAM, IL Institutionsleiter: ME, AAM, IL Alle Autoren haben das endgültige Manuskript zur Einreichung freigegeben.

Korrespondenz mit Rasheed Omobolaji Alabi.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Alabi, RO, Elmusrati, M., Leivo, I. et al. Erklärbarkeit des maschinellen Lernens beim Überleben von Nasopharynxkrebs mithilfe von LIME und SHAP. Sci Rep 13, 8984 (2023). https://doi.org/10.1038/s41598-023-35795-0

Zitat herunterladen

Eingegangen: 14. November 2022

Angenommen: 24. Mai 2023

Veröffentlicht: 02. Juni 2023

DOI: https://doi.org/10.1038/s41598-023-35795-0

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.

AKTIE