Forschungsdatenmanagement – Eine Einführung
Wie erstelle ich meine Metadaten?
Metadaten können händisch oder mithilfe von Programmen erstellt werden. Programme, auch für fachspezifische Metadaten, gibt es im Internet. Viele sind frei verfügbar. Informieren Sie sich trotzdem zuerst bei Ihrer Institution, ob bereits Erfahrungen gesammelt wurden und eventuell Lizenzen für in Ihrem Forschungsbereich gängige, proprietäre Software vorhanden sind. Die folgende Liste von Programmen zur Erstellung von Metadaten stellt nur eine Auswahl dar und erhebt keinen Anspruch auf Vollständigkeit.
Sollten Sie mit Metadatenstandards überhaupt keine Erfahrung haben, kann zur Erstellung von Metadaten vorerst der in Windows integrierte Editor verwendet werden. Das ist sinnvoll, um später überhaupt Eckdaten zu den jeweiligen Untersuchungen zu haben und diese auch abrufen zu können. Speichern Sie die einzelnen Textdateien am besten in einzelnen Ordnern pro Untersuchung ab.
Nicht für alle Metadatenstandards gibt es Programme mit einfachen grafischen Benutzeroberflächen. Wollen oder müssen Sie daher direkt mit einem vorhandenen XML-Metadatenstandard arbeiten, sollten Sie entweder auf die freien Editoren Notepad++ oder Atom oder auf die kostenpflichtige Software oXygen zurückgreifen, falls Lizenzen an Ihrer Institution vorhanden sind. Alle drei Editoren bieten bessere Nutzungs- und Darstellungsmöglichkeiten, um Inhalt und Elementbezeichnungen getrennt voneinander sichtbar zu machen. So werden Elemente beispielsweise wie in Abb. 4.2 blau dargestellt, der eigentliche Inhalt schwarz.
Das Open Source-Online-Tool CEDAR Workbench erlaubt es, Online-Templates auf Basis von Metadatenstandards über eine grafische Benutzeroberfläche zu erstellen, diese auszufüllen und auch mit anderen Nutzern zu teilen. Zeitgleich können auch Templates, die von anderen Nutzern erstellt wurden, für die eigene Forschung genutzt werden. Zur Benutzung ist lediglich eine kostenlose Registrierung nötig.
Zur Annotation biomedizinischer Untersuchung und den sich daraus ergebenden Resultaten eignet sich das Tool Annotare. Es arbeitet nach dem Qualitätsstandard MIAME (Minimum Information About a Microarray Experiment) für Microarrays und erzeugt Daten im MAGE-TAB-Format (MicroArray Gene Expression Tabular). Die Metadaten werden in einfache Eingabefelder im Programm eingegeben. Eine genaue Kenntnis des Metadatenstandards ist demnach nicht zwangsläufig notwendig.
Ebenfalls für die Beschreibung biomedizinischer Untersuchungen, aber auch für Experimente in den Lebenswissenschaften und der Umweltforschung eignet sich das ISA Framework. Dieses ist Open Source und besteht aus mehreren Programmen, die bei der Verwaltung von Experimenten von der Planung, der Durchführung bis hin zur abschließenden Beschreibung helfen können. Begonnen werden kann mit dem ISA Creator, welches zur Erstellung von Dateien im ISA-TAB-Format verwendet wird. Dieses Format wird beispielsweise vom Journal Scientific Data des Nature-Verlags explizit verlangt.
Zur Erstellung von Metadaten im Metadatenstandard EML sollte das Programm Morpho verwendet werden. Es erlaubt die Speicherung von Daten und Metadaten in einer einzigen Datei, was die Archivierung erleichtert. Es steht außerdem in direkter Verbindung mit dem Knowledge Network for Biocomplexity (KNB), einem internationalen fachspezifischen Repositorium für ökologische Forschung und Umweltforschung. Daten können so direkt in das Repositorium hochgeladen und für andere nutzbar gemacht werden.
Für die Metadatenerfassung in den Geowissenschaften gemäß ISO 19115 eignet sich das Programm CatMDEdit. Die erstellten Metadaten sind auch konform mit dem Dublin Core-Standard. Informationen zur Benutzung finden sie hier.
Welche Programme für Ihre Metadaten in Frage kommen, hängt stark von dem Typ der Forschungsdaten und Ihren Nutzungswünschen ab. Es lohnt sich daher, sich im Vorhinein mit anderen Forschenden auszutauschen, um den für sich besten Weg zur Erstellung von Metadaten zu finden. Die händische Erstellung von Metadaten im Editor ohne einen Metadatenstandard als Basis ist zwar für Anfänger die einfachste und schnellste Methode, ein Einlesen in den für sich relevanten Metadatenstandard und die Suche nach Programmen, die diesen Standard bedienen, kann aber mit Blick auf die automatische Verarbeitung der Daten und einer späteren Veröffentlichung einen Vorteil mit sich bringen. Zumindest die Nutzung eines einfachen, fachunabhängigen Metadatenstandards wie Dublin Core sollte berücksichtigt werden.