key: cord-0030632-3dfnamd8 authors: Kaczmarczyk, Robert; Sitaru, Sebastian; Wecker, Hannah; Zink, Alexander title: Netzwerkanalysen als nützliche Ergänzung konventioneller Statistik date: 2022-04-28 journal: Hautarzt DOI: 10.1007/s00105-022-04998-3 sha: ec29eda80e512d7eb1493d961141338bc78a32e9 doc_id: 30632 cord_uid: 3dfnamd8 nan Netzwerkanalysenbezeichnen klassischerweise eine Reihe von Methoden zur Visualisierung und Erforschung von Datensätzen, die Interaktionen in sozialen Netzwerken abbilden. In den letzten Jahrzehnten hat sich ihre Anwendung auf weitere Fachgebiete außerhalb der Sozialwissenschaften ausgeweitet. Mit der folgenden Übersicht sollen ein grundlegendes Verständnis für Netzwerke und deren Analyseverfahren übermittelt sowie praktische medizinische Anwendungsbeispiele aufgezeigt werden. In der konventionellen Statistik werden Hypothesen aufgestellt, die unter anderem mithilfe von Signifikanztests auf ihre Richtigkeit untersucht werden. Dies ist jedoch nur dann sinnhaft möglich, wenn der Untersucher ein grundlegendes Verständnis des zu untersuchenden Sachverstandes besitzt. Empirische Beobachtungen oder auch die deskriptive und explorative Statistik können dafür bei einfachen Datensätzen von Nutzen sein. In einem einfachen Beispiel bei der Untersuchung von Körpergewicht und -größe könnte die Hypothese, dass größere Menschen generell mehr wiegen, nach empirischer Durchsicht von Patientendaten oder Erfahrungswerten aus der persönlichen Umwelt des Wissenschaftlers aufgekommen sein (. Abb. 1a). Im Zuge der "Big Data"-Bewegung und der damit verbundenen Aufzeichnung von immer größer werdenden multidimensionalen Datensätzen in einer wachsenden Anzahl an Fachgebieten zeigt sich immer mehr die Notwendigkeit für eine ergänzende, unkonventionelle Analyse, da darunterliegende, komplexe Interaktionen auch nach tabellarischer Durchsicht nur schwer zu erahnen sind (. Abb. 1b). "Big Data" beschreibt sehr große, unübersichtliche oder schnelllebige Datensätze, die nur sehr schwer mit traditionellen Methoden zu analysieren sind. Verfahren des maschinellen Lernens nutzen "Big Data" zum Trainieren von Modellen, um anschließend in neuen, zuvor ungesehenen Daten Vorhersagen zu treffen (. Abb. 2). Die Vorteile des maschinellen Lernens im Vergleich zur konventionellen Statistik sind zum einen die Möglichkeit des Einspeisens von beliebigen Datensätzen (Größe, Variablentypen etc.), und zum anderen müssen vorher keine grundlegenden Annahmen und Hypothesen formuliert werden, da die Heuristiken aus den Daten "erlernt" werden. Lediglich die grundlegende Struktur des maschinellen Algorithmus, z. B. in Form eines neuronalen Netzes, muss zuvor definiert werden. Das maschinelle Lernen führt jedoch ein neues Problem ein: Die erlernten Heuristiken stellen häufig eine "Black box" dar und können für Menschen meist nicht verständlich dargestellt werden [1] . Der Be-Der Hautarzt 1 a b Abb. 1 8 Vereinfachter Vergleich der Prinzipien und Datensätze in der konventionellen (a) gegenüber einer unkonventionellen (b) Statistik. a Hypothese am Anfang der konventionellen Analyse (z. B. lineare Regression) → "Je größer der Patient, desto mehr wiegt er." b Datenexploration am Anfang der unkonventionellen Analyse (z. B. Netzwerkanalyse) →Agnostische Datenanalyse griff "Black box" beschreibt dabei ein System, in dem nur die Ein-und Ausgaben, nicht jedoch die innere Funktionsweise betrachtet werden kann. Die Anwendung von maschinellem Lernen schließt die konventionelle Statistik keinesfalls aus, sondern sollte eher als Erweiterung des Werkzeugkoffers angesehen werden. Sie kann im zweiten Schritt dazu genutzt werden, neue Hypothesen aufzustellen oder Vorhersagen zu treffen, die im klinischen Alltag erprobt oder mit der konventionellen Statistik überprüft werden können. Eine Lösung für das beschriebene Grenzgebiet zwischen konventioneller Statistik und maschinellem Lernen können Verfahren wie die Netzwerkanalyse sein. Im Allgemeinen beschreiben Netzwerke Beziehungen und Abhängigkeiten zwischen einzelnen Akteuren. Die Verbindungen mitsamt Akteuren können in einem sog. Netzwerkgraphen dargestellt werden. Je nach verwendetem Layout lassen sich auch Gruppen von eng miteinander in Verbindung stehenden Datenpunkten intuitiv identifizieren, da diese in räumlicher Nähe zueinander dargestellt und farblich kodiert werden können. Die Netzwerkanalyse umfasst dabei die Gesamtheit der mathematischen und visuellen Methoden für die Beschreibung und das Verständnis dieser Netzwerke. Netzwerke können überall dort genutzt werden, wo sich Zusammenhänge zwischen Datenpunkten zeigen. Auf diese Weise können nicht nur menschliche Beziehungen, sondern auch Datensätze aus unterschiedlichen Bereichen von der Genomanalyse über Proteininteraktionen bis zu Themenschwerpunkten medizinischer Kongresse analysiert werden. Die soziale Netzwerkanalyse, die ursprünglich als "soziale Physik" nach Comte im 19. Jahrhundert beschrieben und für die empirische Sozialforschung zur Erfassung von menschlichen Beziehungen in den 1930er-Jahren weiterentwickelt wurde, zeigte ihre Renaissance in den 1970er-Jahren in den Sozialwissenschaften mit neuen Möglichkeiten einer systematischen und quantitativen Analyse von Netzwerken [2] . Heutzutage stellen Netzwerkanalysen auch außerhalb der modernen Soziologie ein häufig verwendetes Werkzeug dar. Am Beispiel der frei verfügbaren PubMedgelisteten COVID-19-Publikationen und den kooperierenden Städten lässt sich der Nutzen der Netzwerkgraphen leicht ver-Abb. 2 Auf dieselbe Weise konnten Netzwerkanalysen und -graphen auch dazu genutzt werden, um Themenschwerpunkte automatisiert aus über 100 Seiten langen Programmheften dermatologischer Fachkongresse herauszuarbeiten [3] [4] [5] [6] . Dies bringt potenziellen Kongressinteressenten den Vorteil, Themengebiete schon vor der Kongressanmeldung überblicken zu können. Als Knotenpunkte dienten dabei unter anderem Autoren, Städte, Schlüsselwörter und die Titel der Beiträge (Poster, freie Vorträge etc.). In den letzten Jahren erschienen auch in weiteren medizinischen Fachdisziplinen vermehrt wissenschaftliche Arbeiten zu Netzwerkanalysen, die z. B. zu einem besseren Krankheitsverständnis bei psychischen Erkrankungsbildern und assoziierten Komorbiditäten geführt haben, welche mit konventioneller Methodik nur schwer einzuordnen gewesen wären [7] . So konnten zuvor unbekannte Persönlichkeitsstörungen aufgedeckt werden. Aber auchinder Corona-Pandemiewurden zahlreiche neue Anwendungsgebiete für Netzwerkanalysen erschlossen. Das komplexe Geschehen um mRNA-Impfungen [9] oder SARS-CoV-2-Genomanalysen [10] konnten so verständlich aufgeschlüsselt werden. Eine Autorenanalyse in der kardiovaskulären Forschung zeigte durch geschickte Kombination von Netzwerkanalysen und Algorithmen des maschinellen Lernens Kooperationsnetzwerke auf, die für die Planung zukünftiger Kollaborationen genutzt werden können [8] . Weiter profitiert die Domäne der künstlichen Intelligenz beim sog. Natural Language Processing von Netzwerkanalysen [11] , also der Anwendung von maschinellem Lernen bei der Verarbeitung von natürlicher Sprache. Zukünftig werden maschinelle Algorithmen in der Lage sein, relevante Informationen aus Arztbriefen oder Audioaufnahmen von Patientengesprächen zu extrahieren und für Diagnostik-und Therapieempfehlungen zu verwenden. Auch ist ein praktischer Nutzen durch Therapieempfehlungen in der Präzisionsmedizin der Krebstherapie denkbar [12] . Da Artificial intelligence and black-box medical decisions: accuracy versus explainability Network analysis in the social sciences What's driving dermatology? Contribution title analysis of the largest German Dermatology Congress Visualising the past to plan the future: a network analysis of the largest European dermatology conference A network analysis of the EADV 2019 conference Trends and perspectives for dermatologicalresearchinEurope: anabstracttitle analysis of ESDR and IID congresses The study of psychopathology from the network analysis perspective: a systematic review Co-authorship network analysis in cardiovascular research utilizing machine learning A network analysis of COVID-19 mRNA vaccine patents Phylogenetic network analysis of SARS-CoV-2 genomes Combining natural language processing and network analysis to examine how advocacy organizations stimulate conversation on social media The emerging potential for network analysis to informprecisioncancermedicine