Bartlomiej Marzec

Bachelorarbeit: Zusammenfassung

Veröffentlicht am: 4 April 2014

Einleitung

Im Rahmen eines Sonderforschungsbereiches 1002 wird eine Langzeitarchivierungsinfrastruktur aufgebaut (INF-Projekt), wo am Projekt teilnehmenden Wissenschaftler ihre Daten in einem Repository, nach Vorgaben der guten wissenschaftlichen Praxis ablegen können. Die Eingabe der Daten soll über ein Webportal erfolgen. Als Teil des INF-Projektes wurde für drei ausgewählte Doktoranden ein ELN zur Verfügung gestellt. Die Daten aus dem ELN sollen aber zukünftig, genau wie die Daten, die über das Webportal hochgeladen wurden, ebenfalls im Repository gespeichert werden, damit diese anderen Projektteilnehmer zur Verfügung gestellt werden können. Um dieses jedoch zu realisieren muss erstmal ein Konzept und ein Export-Tool entwickelt, das die Daten aus dem ELN in das Repository exportiert. Dabei besteht die Schwierigkeit, dass die Daten in einer nachnutzbaren Weise exportiert werden müssen. Diese Arbeit beschreibt ein Konzept, wie das realisiert werden kann und setzt dieses pilothaft um.

Methoden

Um das Konzept zu entwickeln wurden zuerst die Anforderungen, die bei der Entwicklung eines Konzeptes beachtet werden müssen ermittelt. Dazu wurden die Doktoranden interviewed, das Quell- und Zielsystem analysiert und anschließend eine Literaturrecherche zur Ermittlung der Standards für die Speicherung der ELN-Inhalte durchgeführt. Anhand der Anforderungen wurde dann das Konzept entwickelt, und mithilfe einer s.g. Extract-Transform-Load-Software und einer Datenbank umgesetzt.

Ergebnisse

Das Resultat der Interviews war, dass es sich bei Daten der Doktoranden um unterschiedliche Experimente handelt, die eine komplexe Struktur haben können. Weiterhin soll die im ELN erstellte Ordner-/Dateistruktur mitexportiert werden. Die Analyse des ELNs ergab, dass die Einträge unstrukturierte Inhalte beinhalten können. Dazu erlaubt das ELN eine freie Strukturierung der Daten. Aus den vielen in der Literaturrecherche gefundenen Standards wurde entschieden den Standard ISA-TAB für die Entwicklung des Konzeptes zu verwenden.

Das Konzept ist eine hybride Lösung aus einer „Eins-zu-Eins“-Abbildung der Daten und gleichzeitigen Aufbau der ISA-Struktur im Repository. Dabei werden alle Versionen eines ELN-Eintrages gespeichert und die Ordner-/Dateistruktur aus dem ELN abgebildet. Über die Entwicklung eines Export-Tools, wurde das Konzept mithilfe von Talend Open Studio pilothaft Umgesetzt.

Diskussion

Das Konzept hat alle gestellten Anforderungen erfüllt, die Daten konnten jedoch nicht nach ISA-TAB-Standard exportiert werden, da sonst die im ELN verwendete Strukturen nicht abgebildet würden und entsprechende Funktionalität im ELN fehlte. Es konnte über die Umsetzung gezeigt werden, dass es möglich ist, zum einen alle Daten aus dem ELN auf unterschiedliche Weise zu exportieren, zum anderen, dass es sogar für jeden Eintragstyp möglich ist, ein anderes Vorgehen beim Export zu definieren. Das Konzept und die Umsetzung muss weiter entwickelt werden und die Einzelheiten mit den Doktoranden ausdiskutiert werden.