key: cord-0070476-ta8rxze6 authors: Ziegler, Johann; Liers, Henrik; Chanove, Albine; Drees, Ludwig title: Systematischer Ansatz zur objektiven Bewertung von Verkehrsunfalldatenbanken date: 2021-11-26 journal: ATZ Automobiltech Z DOI: 10.1007/s35148-021-0776-1 sha: 54d068d8078873a3a295412f97106b09d5737039 doc_id: 70476 cord_uid: ta8rxze6 nan Zur Berücksichtigung von Sicherheitsaspekten bei der Fahrzeugentwicklung sind umfangreiche Verkehrsunfalldatenquellen unabdingbar. Weltweit existieren zahlreiche Quellen rund um Straßenverkehrsunfälle, die für die Entwicklung, Absicherung und Feldbeobachtung neuer Sicherheitssysteme herangezogen werden. Es ist jedoch nicht immer offensichtlich, welche Datenquelle für welche Art von Forschungsfrage oder Entwicklungsansatz geeignet ist, da es derzeit keine objektive Inventarisierung und Bewertung dieser Datensammlungen gibt. Neben einer inhaltlichen Bestandsaufnahme sind daher auch die Nutzbarkeit für Forschungs-und Entwicklungsaktivitäten, der enthaltene Detaillierungsgrad sowie methodische und organisatorische Charakteristika von Bedeutung. Der Abgleich der verfügbaren Inhalte mit einem spezifischen Fragenkatalog ermöglicht eine objektive Bewertung der Datenquellen. Eine Metadatenbank, die sich erweitern und anpassen lässt für zukünftige Inhalte, erleichtert Forschern und Forscherinnen, geeignete Datenbanken auch für zukünftige Forschungsfragen zu identifizieren. Vom Arbeitskreis 3 der Forschungsvereinigung Automobiltechnik (FAT e. V.) wurde ein Projekt initiiert, in dem eine Metadatenbank entsteht [1] , die auf der Datenbankstruktur der interdisziplinären German In-Depth Accident Study (Gidas) [2] Es werden sowohl nationale Quellen als auch tiefergehende Unfalldatenquellen (In-Depth) recherchiert. Erstere basieren auf den Daten der polizeilichen Unfallerhebungen, enthalten meist sehr hohe Unfallzahlen und bieten Anwendern die Möglichkeit der makroskopischen Sicht auf das Unfallgeschehen. Für das Unfallgeschehen mit Personenschaden stellen sie mit Ausnahme des Dunkelfelds nicht gemeldeter Unfälle eine Vollerhebung dar und gelten als repräsentativ für das jeweilige Land. Schwerpunkte der polizeilichen Erfassung sind die Erhebung unfallbezogener Daten zur Beweissicherung und Beobachtung des allgemeinen Unfallgeschehens. In-Depth-Datenerhebungen verfolgen dagegen einen anderen, meist interdisziplinär geprägten und wissenschaftlich motivierten Ansatz. Sie zeichnen sich im Vergleich zu nationalen Datenquellen durch eine deutlich geringere Fallanzahl, aber einen signifikant höheren Detaillierungsgrad aus. Dies ermöglicht mikroskopische Analysen des Unfallgeschehens. Im laufenden Projekt wird neben der Konzeption und Umsetzung der Metadatenbank auch die detaillierte Recherche für die in TABELLE 1 aufgeführten Länder durchgeführt. Dabei wird unterschieden zwischen vollständig recherchierten Datenquellen und solchen, deren Existenz bekannt ist, zu denen jedoch bisher keine weiteren Angaben extrahiert werden. Ein zentrales Anliegen des Projektes ist die objektivierte Bewertung der Qualität der zahlreich existierenden Datenquellen. Zur Bewertung der Metrik wird -auch mit Blick auf eine praxistaugliche Anwendung der Metadatenbank -die Eignung der Datenquellen für die Beantwortung aktueller und zukünftiger Forschungsfragen überprüft. Für deren Zusammenstellung wurden Mitgliedsunternehmen der FAT aufgerufen, für sie relevante Fragestellungen aus dem Bereich der Konzeption, Entwicklung und Bewertung von Verkehrssicherheitsmaßnahmen zusammenzutragen und den Forschungsnehmern zur Verfügung zu stellen. Auf diesem Weg entstand ein interdisziplinärer Fragenkatalog mit mehr als 190 Fragen, von denen 120 inhaltlich geprägte Forschungsfragen und die restlichen Fragen zu den Charakteristika und Metadaten der recherchierten Datenquellen sind. Die Forschungsfragen werden semantisch analysiert, um eine Zuordnung der mit der Fragestellung verknüpften Inhalte zu den Parametern der Metadatenbank zu bewirken. Für jede Frage sind somit die Anforderungen an die Datenquelleninhalte definiert. Zur vereinfachten prozessualen Behandlung werden diese Anforderungen an die Existenz entsprechender Inhalte in Binärcodes auf Parameterebene abgelegt. Anschließend gleicht ein automatisiert durchführbarer Matching-Prozess die frageseitigen Anforderungen mit der Existenz von Datenquelleninhalten ab und speichert das Ergebnis in einer Ergebnismatrix ab. Der Inhalt dieser Matrix gibt schließlich für jede Datenquelle den Anteil an Variablen an, die mit den zur Beantwortung der jeweiligen Forschungsfrage notwendigen Variablen übereinstimmen. BILD 1 zeigt im Quervergleich von fünf ausgewählten Datenquellen, wie viele der 120 Forschungsfragen vollständig beziehungsweise zu welchem Prozentsatz beantwortet werden können. Mit der Datenquelle aus "EU-Land I" können beispielsweise 115 der im Katalog inkludierten Fragen vollständig beantwortet werden. Ergänzend ist anzumerken, dass keine Einschätzung zur Vollständigkeit und Plausibilität der tatsächlichen (Unfall-)Daten statt-findet. Diese Qualitätsprüfung sowie die Entscheidung, ob eine Datenquelle auch bei einem geringeren Prozentwert an beantworteten Fragen und damit fehlenden Informationen für eine Analyse herangezogen wird, obliegen den Anwendern. In der Konzeptionsphase neuer Sicherheitssysteme, Verbraucherschutz-und legislatorischer Vorgaben gehören retrospektive und zunehmend auch prospektive Analysen von Verkehrsunfalldatenquellen zu den Standardwerkzeugen. Dabei Objective assessment of database quality for use in the automotive research and development process Online: www.gidas.org Test now for 30 days free of charge