Forschungsdatenmanagement – Eine Einführung
Dateibenennung
Nicht nur Ihre Speicherstruktur, sondern auch Ihre Benennung sollte logisch nachvollziehbar sein. Dazu bieten Ihnen die folgenden Hinweise zu Dateinamen und Schreibweisen eine Orientierung.
Dateiname:
Der Dateiname sollte objektiv und intuitiv sowie personenunabhängig nachvollziehbar sein. Die Benennung und die Kennzeichnung können nach den folgenden drei Kriterien erfolgen:
System:
Wichtig für den späteren Zugriff und Abruf der Daten ist die Berücksichtigung des Systems, unter dem die Datei gespeichert wird.
Kontext:
Der Dateiname beinhaltet inhaltsspezifische oder deskriptive Informationen, damit unabhängig vom Speicherort klar bleibt, zu welchem Kontext die Datei gehört, z. B. „Zeitplan.pdf“ oder „ZeitplanProjektname.pdf“.
Konsistenz:
Wählen Sie die Namenskonvention vorab, um sicher zu stellen, dass sie systematisch befolgt werden kann und die gleichen Informationen (wie z.B. Datum und Zeit) in derselben Reihenfolge beinhaltet (z.B. JJJJ-MM-TT oder JJJJMMTT). Dateinamen sollten so lang wie nötig und so kurz wie möglich sein, um übersichtlich zu bleiben und unter jedem Betriebssystem lesbar zu sein. Für eine einheitliche Namensgebung kann man auf die folgenden Namensbestandteile zurückgreifen:
- Inhalt
- Ersteller
- Erstellungsdatum
- Bearbeitungsdatum
- Bezeichnung der Arbeitsgruppe
- Publikationsdatum
- Projektnummer
- Versionsnummer
Schreibweise:
Für die Benennung von Dateien gibt es unterschiedliche Schreibweisen. Wichtig bei der Namensgebung sind folgende Punkte:
Vermeidung von Sonderzeichen und co.:
Sonderzeichen (wie { } [ ] < > ( ) * % # ‘ ; “ , : ? ! & @ $ ~), Leerzeichen und Punkte sollten vermieden werden, da sie unter verschiedenen Systemen unterschiedlich interpretiert werden und dies zu Fehlern führen kann. Verzichten Sie auch auf Umlaute (ä, ö, ü). Bei den meisten Betriebssystemen kann man Leerzeichen mit Unterstrichen ersetzen oder den Anfangsbuchstaben von Wörtern großschreiben. Die Schreibweise mit Großbuchstaben wird in der Fachsprache in Anlehnung an die Höcker eines Kamels auch Camel Case genannt (s. Abb. 7.2 unten). Die Schreibweise mit Unterstrichen nennt sich Snake Case (s. Abb. 7.3 unten), selten auch Pothole Case, da die Unterstriche an kleine Schlangen bzw. an Schlaglöcher in einer Straße erinnern.
Datumsangabe an den Anfang:
Um eine chronologische Sortierung zu ermöglichen, empfiehlt es sich, den Namen mit Datumsangabe zu beginnen, zum Beispiel JJMMTTName oder JJJJMMTT_Name:
- 20181123CamelCase.txt
- 20181130_snake_case.txt
Weitere Beispiele für einheitliche Namensgebung sind:
- 20160512_Klimamessung1_original.jpg
- 20160522_Klimamessung1_MHU_Ausschnitt.jpg
- 20160523_Klimamessung1_MHU_Ausschnitt_bearbeitet_Farbe.jpg
Vermeidung automatisch generierter Namen:
Automatisch generierte Namen (z.B. von der Digitalkamera) sollten vermieden werden, da sie zu Konflikten durch Wiederholung führen können. Lassen Sie bei der Entscheidung der Namenskonvention die Skalierbarkeit nicht außer Acht: z.B. bei der Wahl einer zweistelligen Dateinummer beschränkt man die Daten auf 00-99 Dateien.
Festhalten von Namenskonventionen in einer ReadMe-Datei:
Nicht nur bei größeren Projekten, sondern auch bei kleineren Forschungsvorhaben, ist es lohnenswert, die gewählten Namenskonventionen schriftlich festzuhalten. Erläutern Sie insbesondere gewählte Abkürzungen in einem Datenmanagementplan oder einer ReadMe-Datei. Eine Rekonstruktion dieser Konventionen ist nach Jahren oft nur schwer möglich.
Nutzung von IDs zur Identifizierung:
Falls Sie eine ID (s. auch Abschnitt „Wie sehen Metadaten aus?“) oder Studiennummer haben, sollten Sie diese beifügen, um die Daten zweifelsfrei zu einer Studie und einem Forschenden zuordnen zu können (insbesondere, wenn mehrere Forschende an einem Projekt arbeiten).
Nutzung sinnvoller Kürzel:
Vermerken Sie durch Kürzel, um welchen Datentyp es sich handelt (z.B. Fragebogen, Experiment, Exzerpt, Audiodatei etc.).
Umbenennung:
Für die Umbenennung bestehender Dateinamen gibt es in Windows mehrere Alternativen. Mittels Rechtsklick und Auswahl des Kontextpunktes ist ein Umbenennen einfach möglich. Weiterhin kann nach Markieren der jeweiligen Datei die Taste F2 auf der Tastatur genutzt werden.
Zudem kann es vorkommen, dass mehrere Dateien gleichzeitig umbenannt werden sollen. Dies ist in vielen Situationen nützlich, z. B. ...
- ...um die automatisch generierten Namen von der Digitalkamera oder anderer Software in einem Arbeitsschritt zu ändern.
- ...um Leerzeichen oder andere Sonderzeichen aus mehreren Dateinamen in einem Arbeitsschritt zu entfernen bzw. sie zu ersetzen.
Möchten Sie mehrere Dateien gleichzeitig nach bestimmten Konventionen umbenennen, benötigen Sie dafür eine geeignete Software. Diese existiert für die meisten Betriebssysteme.
Windows:
Ant-Renamer
Bulk Rename Utility
Rename-IT
Mac:
Name Changer
Renamer
Linux:
GNOME Commander
GPRename
rename-Kommando unter Unix über reguläre Ausdrücke