key: cord-0019830-x96gzjkk authors: Haider, Stefan P.; Sharaf, Kariem; Baumeister, Philipp; Reichel, Christoph A. title: Künstliche Intelligenz in der Hals-Nasen-Ohren-Heilkunde date: 2021-08-10 journal: HNO DOI: 10.1007/s00106-021-01095-0 sha: 10c0c35be239118b4eedc1717de281f24a22fa22 doc_id: 19830 cord_uid: x96gzjkk BACKGROUND: The continued advancement of digitalization increasingly allows deployment of artificial intelligence (AI) algorithms, leveraging profound effects on society and medicine. OBJECTIVE: This article aims to provide an overview of current developments and futures perspectives of AI in otorhinolaryngology. MATERIALS AND METHODS: Scientific studies and expert analyses were evaluated and discussed. RESULTS: AI can increase the value of current diagnostic tools in otorhinolaryngology and enhance surgical precision in head and neck surgery. CONCLUSION: AI has the potential to further improve diagnostic and therapeutic procedures in otorhinolaryngology. This technology, however, is associated with challenges, for example in the domain of privacy and data security. den" zur "kognitiven" Informatik die Welt noch schneller und umfassender verändern wird als die bisherige digitale Revolution: Zusätzlich zu vorprogrammierten Abläufen ermöglicht KI zur Problemlösung eine zunehmende Lernfähigkeit ("Machine-Learning", s. unten), Selbstständigkeit und Interaktivität digitaler Systeme und Maschinen. Es wird deshalb erwartet, dass diese Technologie tiefgreifenden Einfluss auf unsere Gesellschaft nimmt und damit neben großen Möglichkeiten auch ernstzunehmende Herausforderungen verbunden sind. Aus diesem Grund hat der Deutsche Bundestag im Juni 2018 mit der Einsetzung der Enquete-Kommission "Künstliche Intelligenz -Gesellschaftliche Verantwor-tung und wirtschaftliche, soziale und ökologische Potenziale" dieses zentrale Thema unserer Zeit aufgegriffen. Nach knapp zweijähriger Arbeit wurde nun der achthundert Seiten lange Abschlussbericht der Kommission veröffentlicht [8] . In intensiver Zusammenarbeit der Parlamentarier mit Sachverständigen aus Wissenschaft und Technik wurden darin verschiedenste Teilbereiche der KI erörtert und Handlungsempfehlungen ausgesprochen. In deren Zentrum steht, diese Technologie auf Wohl und Würde des Menschen auszurichten und zum gesellschaftlichen Nutzen einzusetzen. Zur Vermeidung von Risiken automatisierter Entscheidungen durch KI müssten die der Entscheidungsfindung zugrunde liegenden Prozesse jedoch transparent, nachvollziehbar und durch den Menschen überprüfbar sein. So sollte es gelingen, das enorme Potenzial von KI für unsere Gesellschaft gewinnbringend auszuschöpfen. In HNO [7, 9] . Unter KI fallen dagegen auch Systeme, die "lediglich" vorprogrammierte, von Experten festgelegte Funktionalität umsetzen, ohne die für ML charakteristische "Lernfähigkeit". KI und ML werden in zunehmendem Maße auch in der Hals-Nasen-Ohren-Heilkunde eingesetzt (s. unten). Mit dem stetigen Anstieg an verfügbarer Computerrechenleistung erlangte in den vergangenen Jahren dabei insbesondere die ML-Algorithmusklasse der sog. künstlichen neuronalen Netzwerke (KNN, "artificial neural networks", ANN) eine herausragende Stellung. KNN sind Modelle der Informationsverarbeitung, welche in ihrer Struktur, in ihrer elementaren Vernetzung und im weitesten Sinne in ihrer Funktionalität biologischen Neuronennetzwerken nachempfunden sind (. Abb. 2; [20] ). Besonders hervorzuheben ist das sog. mehrschichtige oder tiefe Lernen (Deep Learning), welches eine Untergruppe von KNN bildet und sich durch eine besonders komplexe Modellarchitektur auszeichnet. Diese Architektur erlaubt es, analytisch multidimensionale Sachverhalte zu erfassen und somit nahezu jeden Hypothesenraum abzubilden. Mehrschichtiges Lernen ist rechenleistungsintensiver und unter bestimmten Umständen leistungsstärker als normale KNN [7, 8, 20] . Dennoch wird "konventionelles" ML, welches in Abgrenzung zum Deep Learning manchmal als "Shallow Learning" bezeichnet wird, auch heute noch häufig zur Analyse medizinischer Daten eingesetzt; nämlich insbesondere dann, wenn die Komplexität der Daten oder die Größe des Datensatzes das Training eines Deep Learning-Modells nicht erfordert bzw. erschwert. Konventionelle Algorithmen arbeiten mit vordefinierten Eigenschaften ("Features") während Deep Learning-Modelle Features erlernen können (s. Beispiel unten). Gebräuchliche "konventionelle" ML-Algorithmen sind etwa "Random-Forest-", "Xgboost-" und "Support Vector Machine-Algorithmen" [7] . Bildgebende Verfahren bieten ein besonders großes Potenzial für KI-Anwendungen. In radiologischen Untersuchungen werden deshalb zunehmend sog. Radiomics-Analysen durchgeführt, welche die herkömmliche qualitativ-visuelle Interpretation der Bildgebung durch eine möglichst umfassende Extraktion zahlreicher quantitativer Marker ergänzt [9] . Erfasst werden hierbei unter anderem Form, Intensität und Textur eines definierten Bildareals, wie z. B. eines Tumors. Mithilfe dieser sog. Radiomics-Features erfolgen dann die (ML-)Analysen. Eine Weiterentwicklung dieser konventionellen Radiomics-Analysen sind "explorative" Radiomics-Analysen, in welchen unterschiedlichste Radiomics-Features durch KNN in den vorliegenden Bilddaten direkt "erlernt" und anschließend ausgewertet werden [20] . Die folgenden Abschnitte unseres Artikels bieten einen Überblick zum Einsatz von KI in verschiedenen Teilbereichen der Hals-Nasen-Ohren-Heilkunde. Hierbei werden schwerpunktmäßig Arbeiten mit potenzieller Bedeutung für unsere tägliche klinische Arbeit vorgestellt. Für eine umfangreiche Auflistung sämtlicher ML-und KI-Arbeiten mit Relevanz für die Hals-Nasen-Ohren-Heilkunde sei auf die englischsprachige Übersichtsarbeit unter Referenz [29] verwiesen, welche unter anderem auch (experimentelle) Arbeiten zu KI-Analyse und -Verarbeitung von elektrischen Biosignalen (EEG, EMG) und "-omics"-Daten (Genomics, Transcriptomics) beinhaltet [29] . [23] . Darüber hinaus werden derzeit ML-Modelle entwickelt, welche -basierend auf verschiedenen audiologischen Variablendas Hörergebnis nach einem akuten Hörsturz (Remission vs. dauerhafte Hörminderung) vorhersagen sollen [3] . Im neurootologischen Bereich wurden KI-Systeme zur Nystagmus-Detektion bei der Lagerungsprobe eingesetzt. Dies erlaubte beispielsweise beim benignen paroxysmalen Lagerungsschwindel eine Deep-Learninggestützte Identifikation des betroffenen Bogengangs [22] . Eine große Herausforderung bei der Entwicklung und Anpassung von Hörgeräten ist die suffiziente Verbesserung des Sprachverstehens in Hörumgebungen mit Störgeräuschen. Ein neuartiger Deep-Learning-basierter Sprachfilter wurde an 640.000 Stimuli trainiert und anhand zehn Normalhörender und zehn Personen mit sensorineuralem Hörverlust getestet. Durch diese Technik konnte bei beiden Gruppen eine signifikante Verbesserung des Sprachverstehens in störgeräuschbehafteten Testsequenzen nachgewiesen werden [4] . Insbesondere in neuen, unbekannten Hörumgebungen erscheint die Deep-Learning-Technologie gegenüber herkömmlichen Störgeräusch-Filtern vorteilhaft. Die ersten Studien zu KI in der Kopf-Hals-Onkologie beschäftigten sich zunächst mit dem Einsatz von Radiomics zur radiologischen Bestimmung histopathologischer Eigenschaften von Tumoren des oberen Luft-Speise-Wegs. Unter Beteiligung der Autoren dieses Artikels wurden in diesem Zusammenhang ML-Modelle zur Einschätzung der Vergesellschaftung von oropharyngealen Plattenepithelkarzinomen mit einer Humanes-Papillomavirus(HPV)-Infektion entwickelt [10] . Diese Radiomics-Analysen . Folglich könnten derartige KI-Strategien das Potenzial zur nichtinvasiven Bestimmung der HPV-Assoziation oropharyngealer Plattenepithelkarzinome besitzen. Auf ähnliche Art und Weise wurde gezeigt, dass auch Magnetresonanztomographie (MRT)-Radiomics- [28] und DWI-MRT-Marker [24] als HPV-Assoziations-Prädiktoren fungieren können. Des Weiteren konnte die Arbeitsgruppe um Chen [5] einen Zusammenhang zwischen PET-Radiomics-Features und der Expression des Immuncheckpoint-Moleküls "programmed death-ligand 1" (PD-L1) in Kopf-Hals-Plattenepithelkarzinomen nachweisen. Schließlich deuten Ergebnisse einer explorativen Radiomics-Analyse von Dual-Energy-CT-Untersuchungen darauf hin, dass solche KI-Algorithmen (auf Basis von Random-Forest-ML-Modellen) sogar eine präoperative Einschätzung der histopathologischen Entität von Ohrspeicheldrüsentumoren zulassen könnten [1] . Neben radiologischen Diagnoseverfahren erzeugen auch endoskopische Untersuchungen (dynamische) Bilddaten, welche durch KI-Systeme (sogar in Echtzeit) ausgewertet werden können. In einer aktuellen Studie wurden 19 [25] . Das Vorliegen eines kapselüberschreitenden Tumorwachstums bei Lymphknotenmetastasen ("extranodal extension", ENE) kann radiologisch oftmals nicht mit ausreichender Sicherheit diagnostiziert werden. Mithilfe explorativer Deep-Learning-basierter Radiomics-Analysen wurden 655 zervikale Lymphknoten eines CT-Datensatzes in drei verschiedene Kategorien (benigne, metastatisch ENE-positiv, metastatisch ENE-negativ) klassifiziert [16] . Eine Validierungsstudie [17] erzielte unter Benutzung dieses KI-Algorithmus AUC-Werte von bis zu 0,90 (Sensitivität von 0,82, Spezifität von 0,91) für die ENE-Detektion. Bei der Detektion von Metastasen wurde eine AUC von 0,91 erreicht (Sensitivität von 0,84, positiver prädiktiver Wert von 0,88) [16] . Die computergestützte Analyse der CT-Befunde war damit präziser als die Auswertungen durch den Menschen [17] . Ähnliche Ergebnisse konnten in Radiomics-Texturanalysen von Dual-Energy-CT-Untersuchungen hinsichtlich der Differenzierung von Normalbefunden, Plattenepithelkarzinommetastasen, Lymphombefall oder entzündlicher Veränderung zervikaler Lymphknoten erzielt werden [27] . Mit Abstand am meisten Beachtung fanden bisher KI-Anwendungen aus dem Bereich der Kopf-Hals-Onkologie, welche sich mit der Prognostik des Krankheitsverlaufs bzw. der Prädiktion des Therapieansprechens beschäftigen. Als Datengrundlage dienen bei diesen Studien neben klinischen Befunden v. a. radiologische Untersuchungsergebnisse (CT, MRT oder PET-CT) [9, 18] . Die Ergebnisse dieser Arbeiten deuten darauf hin, dass die zusätzliche Verwendung von KI der gegenwärtigen diagnostischen Aufarbeitung oro-, naso-und hypopharyngealer sowie oraler und laryngealer Karzinome hinsichtlich Prognostik bzw. Prädiktion der jeweiligen Studienendpunkte überlegen ist [11, 12, 18] . Im Speziellen belegen kürzlich veröffentlichte Untersuchungen der Autoren dieses Artikels einen additiven Nut-zen im Hinzuziehen von PET-CT-Radiomics-Markern im Vergleich zur alleinigen Zuhilfenahme der UICC-Staging-Klassifikation bezüglich der Prognostik von Gesamtüberleben, progressionsfreiem Überleben [12] und lokoregionärer Tumorprogression [11] bei Patient*innen mit HPV-assoziierten und nicht-HPV-assoziierten Oropharynxkarzinomen. Da das UICC-Staging auf ärztlicher Einschätzung beruht, ist für solche und ähnlich KI-Systeme "menschlicher Input" notwendig ("human in the loop AI"). Eine häufig bei der Behandlung von Kopf-Hals-Karzinomen auftretende Nebenwirkung ist die strahlentherapieinduzierte Schädigung der Kopfspeicheldrüsen. Auf Grundlage prätherapeutischer Radiomics-Marker von Ohr-und Unterkieferspeicheldrüsen in der CT-Bildgebung lässt sich nun auch eine Vorhersage zur Ausprägung der posttherapeutischen Xerostomie treffen [30] . Mithilfe derartiger KI-Applikationen könnte folglich eine weitere Individualisierung radiotherapeutischer Maßnahmen möglich werden. Auch für den Bereich Nase und Nasennebenhöhlen (NNH) befinden sich radiologisch-diagnostische KI-Applikationen in der Entwicklung. In ersten Studien wurden Deep-Learning-Algorithmen zunächst zur Diagnostik der Sinusitis maxillaris anhand konventioneller Röntgenaufnahmen in okzipitomentaler Projektion erprobt. Die Leistungsfähigkeit von KI wurde dabei mit der Befundung der Untersuchungen durch fünf Radiolog*innen verglichen [19] . Dabei erzielte der Deep-Learning-Algorithmus mit AUC-Werten von 0,88-0,93 (Sensitivität von 0,56-0,77, Spezifität von 0,94-0,99) eine leichtgradig signifikant bessere diagnostische Genauigkeit als die menschlichen Expert*innen mit AUC-Werten von 0,83-0,89 (Sensitivität von 0,52-0,82, Spezifität von 0,80-0,99). Eine weitere Studie konnte zeigen, dass Deep-Learning-Algorithmen Okklusionen des osteomeatalen Komplexes bei Patient*innen mit chronischer Rhinosinusitis auf koronaren NNH-CT-Schnitten detektieren können [6] . Zudem wurde in einer anderen Arbeit ein Deep-Learning-Modell zur vollautomatisierten, volumetrischen Quantifikation von NNH-Verschattungen in NNH-CT als Surrogatparameter für das Vorliegen bzw. die Aktivität der chronischen Rhinosinusitis entwickelt [15] . Derartige Algorithmen könnten in Zukunft eine präzisere und objektivere diagnostische Erfassung und Verlaufsbeurteilung von NNH-Pathologien ermöglichen. Eine automatisierte Befundung bzw. Prädiktion des Therapieansprechens erscheint in Anlehnung an die bereits vorgestellten Arbeiten in der Kopf-Hals-Onkologie als der nächste Schritt in der Weiterentwicklung dieser Technologie. Neben ihrer Anwendung in Diagnostik und Prognosestellung bei Erkrankungen des Kopf-Hals-Bereichs wird KI auch im Rahmen therapeutischer Maßnahmen eingesetzt. So werden Deep-Learning-Ansätze in Studien bereits für die Operationsvorbereitung genutzt: Anhand von Fotomaterial kann beispielsweise eine KI-gestützte Planung von chirurgischen Inzisionen beim Verschluss von Lippen-Kiefer-Gaumen-Spalten durchgeführt werden, welche eine Optimierung des funktionellen und kosmetischen Ergebnisses erbringen soll [21] . Besonders vielversprechend scheint darüber hinaus der Einsatz KI-gestützter intraoperativer Bildgebungsverfahren zu sein, welche die visuelle und taktile bzw. haptische Orientierung des Chirurgen im Operationsfeld im Sinne einer erweiterten Realität (Augmented Reality, AR) ergänzen. Auf diese Weise kann für den Operateur insbesondere die Unterscheidung von erkranktem und gesundem Gewebe im Sinne einer Image-guided Surgery erleichtert werden [2] . In diesem Zusammenhang könnte sich v. a. der Einsatz von Operationsrobotersystemen als besonders nützlich erweisen: Hier liefern Kamerasysteme hochauflösendes Bildmaterial, welches zusammen mit radiologischen Daten eine mehrdimensionale Kartierung des Operationsfelds ermöglicht. Die zusätzliche Integration von Messdaten robotischer Sensoren und Aktuatoren könnte dabei sogar eine vom Operateur kontrollierte (Semi-)Automatisierung einzelner Operationsschritte erlauben. Darüber hinaus könnte beispielsweise die Implementierung KI-gestützter op-tischer Verfahren wie Immunfluoreszenzmikroskopie, optische Kohärenztomographieoder Hyperspektralmikroskopieinsolche "intelligenten Operationssysteme" Tumorgrenzen noch präziser beurteilen lassen, wodurch onkologische Sicherheit und Funktionserhalt bei der chirurgischen Behandlung von Kopf-Hals-Malignomen weiter gesteigert würden [13] . [14] . Derartige Zwischenfälle rücken Fragen nach rechtlicher und moralischer Verantwortlichkeit in den Fokus: Fehlerhafte KI-Entscheidungen, insbesondere im Bereich Diagnostik und Therapieplanung, könnten ernsthafte, mitunter lebensbedrohliche Folgen für unsere Patient*innen haben. Aktuell ist nicht pauschal zu beantworten, wer in solchen Fällen haftet -der KI-Entwickler, die Ärzt*innen als Anwender oder aufgeklärte Patient*innen selbst? Insofern ist es unabdingbar, dass Transparenz, Nachvollziehbarkeit und Überprüfbarkeit von KI-gestützten medizinischen Entscheidungen von uns Ärzt*innen engmaschig überwacht werden. Gerade in diesem Bereich lassen sich jedoch beträchtliche Herausforderungen ausmachen. Da die steigende Leistungsfähigkeit moderner ML-Algorithmen nicht zuletzt durch höhere Modellkomplexität und Nutzung umfangreicher Datengrundlagen erreicht wurde, litt die Nachvollziehbarkeit -eine Problematik, die in der einschlägigen Literatur gerne mit der "Black-Box-Metapher" umschrieben wird: ein dem Behaviorismus entlehntes Sinnbild für fehlende Einsicht in die "Denkprozesse" der KI. Zwar existieren zahlreiche Ansätze zur Interpretation dieser "Denkprozesse" im Sinne einer "explainable AI"; anerkannte Richtlinien und Mindeststandards zur Gewährleistung derartiger Transparenz und Überprüfbarkeit in der Medizin fehlen aber bislang. Nur mit adäquater ärztlicher Supervision wird es möglich sein, diese neuartigen Technologien im Sinne der Patient*innen gewinnbringend einzusetzen. Spectral multi-energy CT texture analysis with machine learning for tissue classification: an investigation using classification of benign parotid tumours as a testing paradigm Emerging intraoperative imaging modalities to improve surgical precision Predicting the hearing outcome in sudden sensorineural hearing loss via machine learning models Largescale training to increase speech intelligibility for hearing-impairedlistenersinnovelnoises Associations of tumor PD-1 ligands, immunohistochemical studies, and textural features in (18)F-FDG PET in squamous cell carcinoma of the head and neck Automated classification of osteomeatal complex inflammation on computed tomography using convolutional neural networks Current applications and future impact of machine learning in radiology Bericht der Enquete-Kommission Künstliche Intelligenz -Gesellschaftliche Verantwortung und wirtschaftliche Applications of radiomics in precision diagnosis, prognostication and treatment planning of head and neck squamous cell carcinomas PET/CT radiomics signature of human papilloma virus association in oropharyngeal squamous cell carcinoma Prediction of post-radiotherapy locoregional progression in HPV-associated oropharyngeal squamous cell carcinoma using machine-learning analysis of baseline PET/CT radiomics Potential added value of PET/CT radiomics for survival prognostication beyond AJCC 8th edition staging in oropharyngeal squamous cell carcinoma Hyperspectral imaging of head and neck squamous cell carcinoma for cancer margin detection in surgical specimens from 102 patients using deep learning Algorithms are deciding who gets the first vaccines. Should we trust them? The Washington Post Volumetric assessment of paranasal sinus opacification on computed tomography can be automated using a convolutional neural network Pretreatment identification of head and neck cancer nodal metastasis and extranodal extension using deep learning neural networks Multi-institutional validation of deep learning for pretreatment identification of extranodal extension in head and neck squamous cell carcinoma Development and assessment of a machine learning model to help predict survival among patients with oral squamous cell carcinoma Deeplearningin diagnosis of maxillary sinusitis using conventional radiography Overview of machine learning: part 2: deep learning for medical image analysis CLPnet: cleft lip and palate surgery support with deep learning Developing a diagnostic decision support system for benign paroxysmal positional vertigo using a deeplearning model Otoscopic diagnosis using computer vision: an automated machine learning approach Quantitative diffusion magnetic resonance imaging for prediction of human papillomavirus status in head and neck squamouscell carcinoma: a systematic review and metaanalysis Automatic recognition of laryngoscopic images using a deeplearning technique Big data in head and neck cancer Dualenergy CT texture analysis with machine learning for the evaluation and characterization of cervical lymphadenopathy Machine learning based radiomic HPV phenotyping of oropharyngeal SCC: a feasibility study using MRI Recent advances in the application of artificial intelligence in otorhinolaryngology -head and neck surgery CT image biomarkers to improve patient-specific prediction of radiation-induced xerostomia and sticky saliva Deep learning in automated region proposal and diagnosis of chronic otitis media based on computed tomography Interessenkonflikt. S.P. Haider