Forschung braucht IT

08.03.2022

Im September 2021 hat die Universität Wien erstmals eine Policy zum Forschungsdatenmanagement beschlossen. Sie definiert einen Rahmen, wie Forscher*innen beim Erheben, Auswerten, Speichern und gegebenenfalls Löschen ihrer Daten vorgehen sollen. Dafür braucht es passende IT-Services – diese bereitzustellen ist Aufgabe der neuen Abteilung IT Support for Research des ZID.

Forschungsdaten gehören zu den wertvollsten Ressourcen der Universität Wien und des Forschungsstandorts Österreich überhaupt. Was Wissenschaftler*innen in oft jahrelanger Arbeit und unter Einsatz von hohen Kosten und Mühen herausfinden, muss langfristig verfüg- und verwendbar sein. Förderstellen verlangen entsprechende Datenmanagementpläne, um überhaupt finanzielle Unterstützung zu gewähren, und auch für die Nachvollziehbarkeit von Forschungsergebnissen ist der Zugriff auf die (Roh-)Daten unverzichtbar. 

Genau hier kommen Raman Ganguly und sein Team der Abteilung IT Support for Research des ZID ins Spiel. Sie arbeiten eng mit Forscher*innen aller Fachrichtungen zusammen, beraten gemeinsam mit der DLE Universitätsbibliothek (UB) bei der Erstellung des Datenmanagementplans und entwickeln in Abstimmung mit ihnen die IT-Infrastruktur, die sie brauchen. Bis vor Kurzem taten sie dies noch als Stabsstelle Software Design & Development, jetzt unter neuem Namen und zur eigenen Abteilung aufgewertet, als Zeichen für die gestiegene Bedeutung, die die Universität Wien ihr zumisst.

Eine ihrer Aufgaben ist der Aufbau einer zentralen IT-Infrastruktur, die allen Wissenschaftler*innen an der Universität Wien für das Verwalten von Forschungsdaten zur Verfügung steht. Teile davon gibt es bereits seit längerem, etwa das Repositorium PHAIDRA zum Archivieren von Dateien, das Digital Asset Management System oder GitLab für Software-Quellcode. Für andere Arten von Daten muss eine zentrale Lösung erst entwickelt werden. Das betrifft etwa – von Forscher*innen besonders oft nachgefragt – funktionsfähige Datenbanken oder lauffähige Software, die im Rahmen der guten wissenschaftlichen Praxis 10 Jahre in Betrieb gehalten werden muss. Wo liegen da die Schwierigkeiten? „Software ist wie ein kleines Kind“, sagt Ganguly: „Du kannst sie nicht unbeaufsichtigt lassen. Die zugrundeliegenden Systeme werden ständig weiterentwickelt, diese Änderungen müssen in der Software nachgezogen werden, sonst funktioniert sie nicht mehr. Nach Ende der Projektlaufzeit ist aber oft niemand mehr da, der oder die das tun könnte.“ Sein Team prüft derzeit mehrere mögliche Lösungswege für dieses Problem. 

Noch ist nicht einmal klar, welche Komponenten die zentrale Infrastruktur überhaupt umfassen muss, sagt Ganguly: "Wir wissen, wie viele Forschungsprojekte an der Uni Wien laufen, aber wir kennen deren Anforderungen zumeist nicht. Mit jedem Projekt, das wir durchführen, lernen wir dazu. Wir versuchen, Muster zu erkennen und aufgrund von diesen Mustern die Infrastruktur dementsprechend aufzubauen. Damit möglichst viele Forschungsprojekte diese Infrastruktur nutzen können."

Doch nicht jede Anforderung mündet in eine zentrale Infrastruktur. Dezentrale IT-Services für das Forschungsdatenmanagement zu entwickeln, die auf ganz spezielle Bedürfnisse von Forschungsgruppen zugeschnitten sind, ist ebenfalls eine Aufgabe von Gangulys Abteilung. Ein Beispiel dafür ist die Software zur Auswertung der an der Universität Wien durchgeführten Covid-Tests. Dabei muss zu Beginn eines Projektes erst einmal ein wechselseitiges Verständnis für die Anforderungen und Arbeitsweisen der jeweils anderen Seite hergestellt werden: Was ist die Forschungsfrage? Mit welcher Art von Daten arbeiten die Wissenschaftler*innen? Welche IT-Werkzeuge benötigen sie dafür? Idealerweise gäbe es im Forschungsteam eine*n oder mehrere Data Stewards, die sich mit genau diesen Fragen beschäftigen und als Schnittstelle zur IT fungieren können. Doch dieses Berufsbild ist an der Universität Wien erst in einigen Pilotprojekten etabliert.

Umgekehrt muss sich auch Gangulys Team verständlich machen und vermitteln, was die IT leisten kann und was nicht. Auch hier ist Flexibilität gefragt, denn die Forschungsteams bringen ganz unterschiedliche technische Vorkenntnisse mit. Das wirkt sich dann auch auf die Gestaltung der IT aus: "Wir brauchen Zugänge für Menschen, die selbst programmieren, aber auch für jene, die nicht mehr als eine Webanwendung bedienen können."

Wie die Zusammenarbeit dann konkret abläuft, schildert Claudia Feigl, Sammlungsbeauftragte in der Universitätsbibliothek (UB). Sie hat bereits mehrere Projekte mit Ganguly und seinen Mitarbeiter*innen durchgeführt. „Digitalisierung beschäftigt uns in den Sammlungen sehr“, sagt sie. „Der Druck der Forscher*innen ist groß und die Ansprüche sind zum Teil sehr hoch, weil man davon ausgeht, dass ohnehin alles technisch möglich ist. Oft muss man aufklären, warum etwas nicht funktioniert und was realistische Zeitläufe sind.“

Sehr gut funktioniert die Zusammenarbeit mit dem Department für Botanik und Biodiversitätsforschung, das gemeinsam mit der UB und dem ZID alte Herbarbögen digitalisiert. Mehr als eine Million Pflanzen liegen hier gepresst und auf Kartonbögen montiert vor, die meisten von ihnen sind unersetzbare Unikate. Für internationale Forschungstätigkeit mussten diese Bögen bisher verschickt werden – ein hohes Risiko für Schäden. „Dieser Leihverkehr hat durch die Digitalisierung drastisch abgenommen“, sagt Feigl. „Wenn man gut digitalisiert, muss man die Pflanze für die Forschungsarbeit nicht unbedingt vor sich haben.“

Zu diesem Zweck bereitet das Department die Herbarbögen so auf, dass sie digitalisiert werden können: Die gepressten Pflanzen werden geprüft, kleinere Schäden werden repariert, dann werden QR-Codes auf Bögen, Mappen und Kisten geklebt und die Bögen in ihren Kisten verpackt. Diese Kisten werden an die Bibliothek geliefert und dort in die Digitalisierungsstation übernommen. Jeder Bogen wird nach internationalen Standards fotografiert und der entstandene Datensatz auf einem Share des ZID gespeichert. Diese Bilddaten werden mit den nötigen Metadaten verbunden und abschließend zur langfristigen Speicherung in die PHAIDRA-Infrastruktur übernommen.

Verknüpft sind diese Daten mit JACQ, der führenden internationalen Datenbank für Herbarien. Sie stehen somit Forschenden auf der ganzen Welt zur Verfügung – ein Musterbeispiel dafür, wie Forschungsdaten im Zeitalter der Digitalisierung verwendet werden können. 

Kontakt und mehr Information über Forschungsdatenmanagement an der Universität Wien:

rdm@univie.ac.at

Research Data Management an der Universität Wien rdm.univie.ac.at

RDM Policy

Herbarbogen einer Kohlpalme. Das Blatt wurde 1927 im Zuge einer Brasilien-Expedition aufgesammelt und ist ab Juni im Rahmen einer Brasilien-Ausstellung in Naturhistorischen Museum zu sehen. Abrufbar in der Herbarien-Datenbank JACQ, die Langzeitarchivierung dieser Bilddaten verantwortet der ZID im Rahmen einer zentralen Infrastruktur.