Springe direkt zu Inhalt

Durchführung

Allgemeine Hinweise zum Umgang mit Forschungsdaten während des gesamten Forschungsprozesses. Für spezifische Fragen wenden Sie sich gern an unser Team.

Ein einheitliches, systematisches Bezeichnungssystem gewährleistet die Übersichtlichkeit und Verständlichkeit Ihrer Daten. Datei-, Ordner- und Variablennamen sowie die Bezeichnung von Tabellen-Spalten und -Zeilen sind möglichst aussagekräftig, eindeutig und kurz zu formulieren. Informationen, die auf sämtliche Daten in einem Ordner zutreffen, können in der Ordner-Bezeichnung formuliert und müssen nicht im Dateinamen wiederholt werden. Modelle für Bezeichnungen:

  • Datum als JJJJ-MM-TT oder JJJJMMTT
  • Personenkürzel der bearbeitenden Person
  • Ortsangabe (bei Erhebungen vor Ort; Feldforschung)
  • Versionierung (z. B. v01, v02; die Null ist aus Sortierungsgründen in Listenansicht voranzustellen)
  • Für Dateinamen geeignet: A-Z a-z 0-9 Bindestrich (-) Unterstrich (_) (Gilt für Benennungen in lateinischer Schrift)
  • Umlaute, Leerzeichen und andere als die oben genannten Sonderzeichen sind zu vermeiden
Zu bevorzugen Zu vermeiden
website-texte-2020-05-v15.docx Website-Texte-Mai-finalFinal2_new.docx

Digitalisat_XY-ZZ_E-1_M-296778.tiff

Digitalisat_XY-ZZ_E-2_HT-493887.tiff

Digitalisat_XY-ZZ_M-5_LS-345-c.tiff

(Schema Digitalisat_Archivsigel_Bestandssignatur_Archivaliensignatur.tiff)

Bild0001.tiff

Bild0002.tiff

Bild0003.tiff

Survey_OpenAccess_Cleaned_v04.csv OA-Results-clean-4.csv

Für die langfristige Aufbewahrung und Verwendung über längere Zeiträume sind „offene“ Formate, die unbeschränkt gelesen, geöffnet und genutzt werden können, besonders geeignet. 

Formatempfehlungen für die Langzeitarchivierung

Dateiformat

Empfehlung

Vermeiden

Tabellen

CSV, TSV, SPSS portable, XLSX

XLS

Text

TXT, HTML, RTF, PDF/A, DOCX

DOC, PPT, PDF

Multimedia

Container: MPEG4, MKV

Codec: Theora, Dirac, FLAC

QuickTime, Flash

Bilder

TIFF, JPEG2000, PNG

GIF, JPG

(aus Dolzycka, Dominika, Biernacka, Katarzyna, Helbig, Kerstin, & Buchholz, Petra. (2019). Train-the-Trainer Konzept zum Thema Forschungsdatenmanagement (Version 2.0). Zenodo. http://doi.org/10.5281/zenodo.2581292 , S. 84)

Weitere Informationen: Formate erhalten auf forschungsdaten.info.

Zu wählen ist eine knappe Bezeichnung, die auf den Inhalt schließen lässt. Informationen (z. B. das Erhebungsjahr), die auf alle enthaltenen Daten zutreffen, können, um die Einzeltitel kurzzuhalten, bereits hier formuliert werden. Als gängige Ordnerstrukturen bieten sich z. B. Erhebungszeitraum, Ort, Dateiformat oder Bearbeitungsstatus an. Übersichtlich ist i. d. R. eine Ordnerhierarchie mit nicht mehr als drei Ebenen.

Metadaten sind zusätzliche strukturierte Informationen, die die eigentlichen (Forschungs-) Daten beschreiben. Sie werden verwendet, um Daten zu publizieren, auffindbar zu machen und zu zitieren. Metadaten für Forschungsdaten enthalten i. d. R.  technische, rechtliche und administrative Informationen wie etwa Angaben zu Datenvolumen, Datenformat und Lizenzen, aber auch deskriptive und fachliche Informationen wie Datenautorin oder Datenautor, Titel, Thema, Kurzbeschreibung und Schlagworte. Bei der Beschreibung kann auf kontrollierte Vokabulare und Thesauri zurückgegriffen werden, die eine bessere Auffindbarkeit gewährleisten. Fachspezifische Vokabulare lassen sich auf Bartoc.org recherchieren.

Einige Fachdisziplinen haben spezifische Dokumentations- und Metadatenstandards etabliert (siehe z. B. die Übersichten der Research Data Alliance und des Digital Curation Centre). Sind diese nicht oder nicht ausreichend vorhanden, bieten sich generische Standards wie etwa der DataCite Metadata Standard an.

Das Repositorium der Freien Universität Berlin Refubium ermöglicht neben umfangreichen freiwilligen Angaben folgende Metadatenfelder zu Ihren Forschungsdaten: Urheber*in der Daten, Haupttitel, Erscheinungsjahr, Fachbereich/Einrichtung, Sprache, Ressourcentyp, Abstract, Dewey Decimal Classification sowie freie Schlagwörter.

Diese strukturierte Datenbeschreibung wird während des Forschungsprozesses in der Regel als zusätzliche Datei in einer Tabelle bzw. in einer Datenbank angelegt oder – wenn möglich – innerhalb der zu beschreibenden Daten selbst eingefügt (z. B. TEI-XML, TIFF).

Neben der deutschsprachigen empfiehlt sich auch die Formulierung englischsprachiger Metadaten, sodass die Daten bei Veröffentlichung international gefunden, verstanden und nachgenutzt werden können. Liegen die Daten selbst in einer weiteren Sprache vor, so sollte auch diese Sprache in den Metadaten verwendet werden.

Links zum Thema

Die Dokumentation liefert gemeinsam mit den Metadaten sämtliche Informationen, die die Nachvollziehbarkeit, Interpretation und eventuelle Reproduktion der Forschungsdaten bzw. Forschungsergebnisse gewährleisten. Sie gibt Auskunft darüber, was von wem, wie, womit, warum/wofür, wann, wo und in welchem Kontext erhoben, gesammelt oder bearbeitet wurde.

Die Dokumentation umfasst die genaue Beschreibung der Datengenerierung, -aufbereitung und -erschließung sowie der relevanten Methoden und Werkzeuge (Software). Diese können in Form von Codebüchern, (digitalen) Laborbüchern, der Beschreibung des Forschungsdesigns, Editionsrichtlinien oder weiterer beschreibenden Dokumenten vorliegen.

Eine schnelle und einfache Methode für eine Datendokumentation liefert eine README-Datei in Markdown oder einfachem Text, die gemeinsam mit den Daten abgelegt wird. 

Die ZEDAT bietet mit dem Sync & Share Service die Möglichkeit, Daten in der Cloud (Box.FU) zu speichern und über einen Link auch mit Externen zu teilen.

Das in die Box.FU integrierte OnlyOffice ermöglicht die gemeinsame Online-Bearbeitung von Dateien wie Textdokumenten, Tabellenkalkulationen und Präsentationen. Ein zusätzlich integrierter Rich-Text-Editor erlaubt das gemeinsame Erstellen von Protokollen und Notizen. 

Die Box.FU ist nicht für sensible oder schützenswerte Daten geeignet (siehe Richtlinie zur Auslagerung von Daten in die Cloud der Arbeitsgruppe IT-Sicherheit).

Empfehlungen für die Sicherheit von Forschungsdaten

  • Verwenden Sie die Benutzerverwaltung Ihres jeweiligen Betriebssystems.
  • Sperren Sie bei Abwesenheit Ihren Bildschirm.
  • Halten Sie Betriebssystem und Anwendungen auf einem aktuellen Stand.
  • Verwenden Sie Sicherheitsmaßnahmen, wie ggf. Antivirenprogramme und Firewalls.
  • Verwenden Sie sichere Passwörter.
  • Verwenden Sie gesicherte Kommunikationswege (z. B. über digitale Zertifikate für die sichere E-Mail-Kommunikation).
  • Prüfen Sie Datenschutzbestimmungen von verwendeten Services, insbesondere bei der Erhebung und Verarbeitung sensibler Daten.
  • Achten Sie auf Serverstandorte bei internationalen oder kommerziellen Anbietern von Services (siehe auch Richtlinie zur Auslagerung von Daten in die Cloud).
  • Prüfen Sie Systeme und Speichermedien auf Verschlüsselbarkeit (bspw. mit Tools wie VeraCrypt)

Weitere Informationen: IT-Sicherheitsrichtlinie der Freien Universität Berlin

Um das Risiko eines Datenverlusts durch Software- und Hardwareversagen, Virenbefall oder Hacking sowie menschliche Fehler zu reduzieren, sollten regelmäßige Datensicherungen durchgeführt werden. Die von der ZEDAT angebotenen Netzlaufwerke schließen automatisierte Verfahren ein. Darüber hinaus stehen spezielle Backup-Software sowie die Sicherungsoptionen der jeweiligen Betriebssysteme zur Verfügung. Kopien von Datensicherungen sollten an mehreren Orten gespeichert werden.

Links zum Thema

Für das kollaborative Arbeiten ebenso wie für die mehrstufige oder iterative Datengenerierung, -veränderung und -prozessierung bietet sich der Einsatz eines Versionskontrollsystems an, das Änderungen an Dateien mit Zeitstempel, Angaben zu Autorin oder Autor sowie einer Änderungsnotiz sichert. Frühere Versionen können somit leicht wiederhergestellt, Änderungshistorien dokumentiert und visualisiert werden. 

Ein etabliertes System zur Versionskontrolle ist z. B. Git. Für die kollaborative Arbeit in Gruppen bzw. in Projektkontexten sowie für das zentrale Verwalten von Projekten bieten sich Lösungen wie GitLab oder GitHub an. Verschiedene Fachbereiche der Freien Universität verfügen derzeit über eigene GitLab-Instanzen.

Creative Commons License

Zuletzt geändert 02.05.2022. Soweit nicht anders gekennzeichnet, ist dieses Werk unter einer Creative Commons Namensnennung 4.0 International Lizenz lizenziert.