Forschungsdatenmanagement – Eine Einführung

Was sind Metadatenstandards und warum sind sie wichtig?

Ein schon eingangs erwähnter und sehr wichtiger Aspekt von Metadaten ist die Lesbarkeit durch Mensch und Maschine. Die Vielzahl an verschiedenen Metadaten, die zur Beschreibung von Forschungsdaten benötigt werden, kann dabei mit Blick auf die zusätzlich große Menge an verschiedenen wissenschaftlichen Communities mit jeweils eigenen Bedürfnissen zu einem Problem werden. So gibt es einerseits Metadaten, die fachübergreifend notwendig sind (z.B. Name des Urhebers, Titel, Erstellungsdatum usw.), andererseits aber auch fachspezifische Metadaten, die abhängig vom Forschungsbereich oder sogar dem Forschungsgegenstand sind.

Stellen Sie sich vor, Forschungsgruppe 1 hat über mehrere Experimente der gleichen Art mit unterschiedlicher Raumtemperatur eine Vielzahl an Forschungsdaten erstellt. Forschungsgruppe 2 hat das gleiche Experiment mit den gleichen Stoffen bei gleichbleibender Raumtemperatur und verschieden hohen Sauerstoffgehalt in der Luft durchgeführt und ebenfalls Forschungsdaten erstellt. Forschungsgruppe 1 bezeichnet in ihren Metadaten den Parameter „Raumtemperatur“ als „rtemp“, Forschungsgruppe 2 jedoch lediglich als „temp“. Woher wissen die Forschenden der Forschungsgruppe 1 und woher weiß ein Computersystem, dass es sich bei dem Wert „temp“ der Forschungsgruppe 2 um den Wert „rtemp“ der Forschungsgruppe 1 handelt? Dies ist nicht ohne weiteres möglich und reduziert damit den Nutzen der Daten.

Wie kann also sichergestellt werden, dass beide Forschungsgruppen das gleiche Vokabular bei der Beschreibung ihrer Metadaten verwenden, damit diese am Ende nicht nur lesbar, sondern auch interpretierbar sind? Für solche Fälle wurden und werden von den verschiedenen Forschungs-Communities Metadatenstandards entwickelt, die sicherstellen, dass alle Forschenden einer Wissenschaftsdisziplin das gleiche Beschreibungsvokabular verwenden. So wird eine Interoperabilität zwischen den Forschungsdaten sichergestellt, die für die Erkenntniserweiterung bei der Arbeit mit den Daten eine ausschlaggebende Rolle spielt (für mehr Informationen zu „Interoperabilität“ s. hier im Abschnitt „Interoperability“ im Kapitel „FAIR-Prinzipien und CARE-Prinzipien“).

Metadatenstandards ermöglichen also eine gleichförmige Ausgestaltung von Metadaten. Sie sind eine formale auf Konventionen einer Forschungs-Community beruhende Festlegung, wie Metadaten erhoben und erfasst werden sollen. Trotz dieses Anspruchs repräsentieren Metadatenstandards kein statisches Regelsammelsurium zur Erhebung von Metadaten. Sie sind dynamisch und an einzelne Bedürfnisse anpassbar. Das ist vor allem deswegen notwendig, weil Forschungsdaten bei Projekten mit neuartigen Forschungsmethoden sehr stark projektspezifisch sein können und deshalb an ihre Metadaten ebenso stark projektspezifische Ansprüche gestellt werden.

In der folgenden Tabelle sind beispielhaft einige Metadatenstandards verschiedener Disziplinen aufgeführt. Ist Ihre Wissenschaftsdisziplin nicht aufgeführt, kann meist die Auflistung des Digital Curation Centres (DCC) Aufschluss darüber geben, welche Standards für Ihren Wissenschaftsbereich in Frage kommen.

Tab. 4.1: Einige Metadatenstandards sortiert nach Wissenschaftsdisziplin

Wissenschaftsdisziplin

Name des/der Standards

fachübergreifende Standards

DataCite Schema, Dublin Core, MARC21, RADAR

Geisteswissenschaften

EAD, TEI P5, TEI Lex0

Geowissenschaften

AgMES, CSDGM, ISO 19115

Klimawissenschaften

CF Conventions

Kunst- und Kulturwissenschaften

CDWA, MIDAS-Heritage

Naturwissenschaften

CIF, CSMD, Darwin Core, EML, ICAT Schema

Röntgenstrahlen-, Neutronen- und Myonenforschung

NeXus

Sozial- und Wirtschaftswissenschaften

DDI

Fachübergreifende Standards sind Metadatenstandards, die Objekte auf eine allgemeine Art und Weise beschreiben. Der weiter oben teilweise beschriebene Dublin Core-Standard zählt zu dieser Art von Standards. Der Standard EAD wird zur Beschreibung von archivischen Findmitteln wie beispielsweise Findbüchern verwendet. TEI P5 bietet Standards zur Annotation von Texten und Handschriften. TEI Lex0 ist ein neu entwickelter Standard auf Basis von TEI P5 zur Beschreibung lexikographischer Daten. AgMES dient zur Beschreibung von Informationen aus dem landwirtschaftlichen Bereich. CSDGM ist ein Standard zur Beschreibung von digitalen raumbezogenen Daten, der zwar immer noch verwendet wird, aber auf lange Zeit durch den ISO 19115-Standard ersetzt werden soll. Das Federal Geographic Data Committee (FGDC), die Entwickler des CSDGM-Standards, ermutigen daher alle Interessierten den ISO 19115-Standard für die Beschreibung digitaler raumbezogener Daten zu nutzen. Die CF Conventions bieten Metadaten zur Beschreibung von Klima- und Wetterinformationen. Der CDWA-Standard bietet Möglichkeiten zur Beschreibung von Kunst, Architektur und anderen kulturellen Werken. MIDAS-Heritage ist ein Standard zur Beschreibung von Kulturerben. Dazu zählen Gebäude, Denkmäler, Ausgrabungsstätten, Schiffswracks, Schlachtfelder, Artefakte usw. CIF bietet Standards für die Forschung in der Kristallographie. CSMD bietet Beschreibungsmöglichkeiten für wissenschaftliche Studien in Wissenschaftsdisziplinen, die systematische experimentelle Analysen an Stoffen durchführen (z.B. Materialwissenschaften, Chemie, Biochemie). Das ICAT Schema basiert auf CSMD und dient demselben Zweck, bietet aber noch genauere Beschreibungsmöglichkeiten. Darwin Core dient der Beschreibung biologischer Diversität bzw. der biologischen Vielfalt wie beispielsweise Lebewesen. EML ist ein Standard, der ausschließlich im Bereich der Ökologie verwendet wird. Der DDI-Standard dient zur Beschreibung von Daten, die durch Umfragen oder andere beobachtende Forschungsmethoden in den Sozial- und Wirtschaftswissenschaften sowie der Verhaltensforschung erhoben werden.

Einige Verlage haben eigene Metadatenstandards, die bei Publikationen dort berücksichtigt werden müssen. Prüfen Sie spezifische Vorgaben am besten zu Beginn Ihres Projektes, wenn Sie schon ein Journal für die Veröffentlichung im Kopf haben. Auch einige Forschungsdatenarchive haben eigene Metadatenstandards, z.B. GenBank.



No comment has been posted yet.