Überblick

Vier Universitäten, die im Cluster Forschungsdaten in den Bereichen Forschungsinformationen, Forschungsdaten, Forschungsinfrastrukturen und Forschungsservices kooperieren, präsentieren hier ihre Überlegungen zu Digitalisierungsthemen und geben Einblick in die Entwicklung ihrer Aktivitäten und Projekte.

Basierend auf Erkenntnissen und Ergebnissen bereits laufender Digitalisierungsprojekte, haben die Universitäten des Clusters Forschungsdaten im September 2022 sieben weitere, miteinander vernetze Projektvorhaben zum Aufbau von digitalen Forschungsinfrastrukturen und zur Beförderung der digitalen Transformation der österreichischen Forschungslandschaft beim BMBWF eingereicht.

Erfahren Sie mehr über diese Projekte und verfolgen Sie die Vision des Clusters Forschungsdaten, die wir in diesem Rahmen entsprechend der iterativen Arbeitsweise des Clusters Forschungsdaten Schritt für Schritt vorstellen.

Szenario-Ueberblick

ARI&Snet - Austrian Research Information & Service Network

Im Rahmen des Projektes wird ein institutionalisiertes österr. Netzwerk für Infrastruktur zu Koordination, Planung und Management von Forschungsfacilities, Services, Forschungsinformationen, -daten und Wissen aufgebaut. Orientiert an nationalen wie internationalen Strategien und Standards werden von ARI&Snet österr. Agenden im Kontext von digitalem Forschungssupport nachhaltig gestärkt und der Betrieb von bereits entwickelten und neuen Services langfristig ermöglicht. Diese Shared Services fungieren als Enabler für Open Science sowie einem zukunftsgerichteten Forschungsstandort Österreich und darüber hinaus als Basis einer konstruktiven Informations- & Serviceplattform für österreichische Forschung.

ARI&Snet erzeugt nachhaltige Synergieeffekte zwischen Digitalisierungsprojekten, österr. Universitäten und Forschungseinrichtungen, dem BMBWF und Digitalisierungsinitiativen (u.a. EOSC) und einen maßgeblichen Mehrwert für die digitale und soziale Transformation in der Hochschulbildung.

Szenario-Arisnet

Arbeitspakete ARI&Snet:

ARISnet-Arbeitspakete

DataLife – Dateninfrastruktur für Life Sciences

In diesem Projekt wird digitale Infrastruktur für Institute des Vienna Biocenter und Partnerinstituten errichtet, mit denen Hochdurchsatzdaten effizient und schnell bereitgestellt und verarbeitet werden können. Dabei werden bestehende High-Performance Computing Cluster eingebunden sowie die langfristige Sicherstellung der Datenintegrität und die öffentliche Bereitstellung der Daten ermöglicht.

Szenario-DataLife

DiDIAS - Digital Data Infrastructure of the Austrian Society

Die Digitale Dateninfrastruktur der österreichischen Gesellschaft (DiDIAS) stellt aufbauend auf integrierten technischen Daten- und Prozesskomponenten eine neue digitale Forschungsinfrastrukturdrehscheibe für wissenschaftliches Know-how über neue Techniken, Verfahren und Anwendungen im zukunftsorientierten Bereich der Datenproduktion, -modellierung und -visualisierung auf Basis von Individualdaten dar. DiDIAS fungiert als wichtige Daten- und Prozessmaschinerie für methodisch neuartig konzipierte empirische Erkenntnisse zu gesellschaftlichen Themen in Gesundheit, Politik etc. DiDIAS wird von einer Reihe von Wissenschaftsdisziplinen, wie Sozialwissenschaften, Psychologie, Rechtswissenschaften, Informatik, Mathematik und Data Sciences, entwickelt und genutzt.

FRANK - FAIRes Digital Asset Management für heterogene Daten

Ziel dieses Antrags ist es, den gesamten digitalen Arbeitsprozess von der Erstellung bis zur Wiederverwendung und Analyse von Forschungsdaten erheblich zu vereinfachen. Offene Wissensmanagementsysteme werden in die Lage versetzt, mit der zunehmenden Heterogenität von Daten aus den Natur-, Sozial-, und Geisteswissenschaften umzugehen, und zugehörige Metadaten werden semantisch angereichert, wodurch ihre FAIRness optimiert wird. Dies gilt besonders im Bereich geografischer Identifikatoren (z.B. Ortsnamen), die zunehmend über verschiedene Disziplinen hinweg verwendet werden. Mit Hilfe meso-skaliger GPU-Workstations, die direkt an die Daten angebunden sind, werden bestehende Infrastrukturlücken geschlossen und damit Forschung und Anwendungen der Data Science vereinfacht. Im Sinn der Synergiemaximierung und künftiger Kostensenkung liegt der Fokus auf den Repositorien PHAIDRA und InvenioRDM, die bereits durch strategische Forschungsinfrastruktur-Investitionen finanziert wurden.

Szenario-Frank

GEO(redundant) D(ata)E(nvironment) Austria – Bereitstellung einer georedundanten, inter-universitären Dateninfrastruktur 

Die zunehmende Komplexität der IT-Infrastrukturen, steigende Kosten und Fachkräftemangel, stellen wachsende Herausforderungen an Erhalt und Betrieb moderner IT-Landschaften. Gleichzeitig steigen durch die laufende digitale Transformation der Gesellschaft die Anforderungen an omnipräsente digitale Services. Die Menge der zu verarbeitenden Daten wächst exponentiell (derzeit Verdoppelung alle 18-20 Monate) und es ist zukünftig noch mit einer Beschleunigung zu rechnen.

Um diesen steigenden Anforderungen gerecht zu werden, müssen universitäre Einrichtungen ihren Fokus auf gemeinschaftliche Lösungen setzen. Ziele dieses Projektes sind die Schaffung einer universitätsübergreifenden Dateninfrastruktur, die Definition und Implementation gemeinsamer Schnittstellen, begleitender Sicherheitsaspekte, sowie Konzepte zur Erhaltung der Datenintegrität (Bitstream Integrity), als zukunftssichere und nachhaltige Datenverarbeitungsgrundlage für alle Wissenschaftsdisziplinen und Fachrichtungen.

Szenario-GEODE

MUSICA-High Memory Extension

Projektziel der Multi-Site-Computer Austria - HighMem-Extension (MUSICA-HME) ist die Erweiterung der nationalen universitären Hochleistungsrechnerinfrastruktur um High Memory Knoten; diese weisen besonders große Arbeitsspeichermengen und Bandbreiten auf.

Spitzenforschung in hochinnovativen Forschungsfeldern wie Genetik und Quantenchemie ist ohne diese spezialisierte Ressource ungleich erschwert. Zu bearbeitende, besonders große Datenmengen – beispielsweise aus DNA Sequenzierungen – verlangen solcherart adäquate Architekturen. Darüber hinaus befördern High Memory Knoten die interaktive, niederschwellige Nutzung der Infrastruktur. Massiv parallele Systeme wie der MUSICA Basisausbau, effizient bei anderen Problemstellungen, stoßen hierbei an inhärente Leistungsgrenzen.

Nahtlos in die entstehende MUSICA-Infrastruktur integrierbar, hat MUSICA-HME das Potential, Hochleistungsrechnen in Österreich einer entscheidend verbreiterten Nutzer:innenbasis aus Forschung und Anwendung zu erschließen.

Szenario-MUSICA

Shared RDM Services & Infrastructure

Das Forschungsdatenmanagement (FDM) wird für Forschende immer wichtiger und erfordert eine Vielzahl von unterstützenden Tools, die während des gesamten Lebenszyklus von Forschungsdaten genutzt werden können. In den letzten Jahren wurden bereits technische und organisatorische Entwicklungen vorangetrieben, die in verschiedenen Forschungsbereichen eingesetzt werden (z.B. Repositorien für Forschungsdaten, Analyseplattformen, elektronische Laborbücher, Data Stewardship Programme).

Ziel des Projektes ist es, einen Rahmen zu schaffen, um ausgewählte Tools und Infrastrukturen im Bereich FDM als Shared Services für österreichische Universitäten und Forschungseinrichtungen anzubieten. Diese Bündelung von unterschiedlichen Expertisen schafft einen sinnvollen Einsatz von Ressourcen und fördert Interoperabilität, Standardisierung und die Anbindung an internationale Initiativen. Das Projekt wird im Sinne der EOSC Initiative durchgeführt und trägt damit zu einer noch zuverlässigeren und einfacheren Nachnutzung von Forschungsoutput sowie zu einer vertrauenswürdigen Kooperation mit der Industrie bei.

Szenario-SharedRDM

Cloud4GEO - Eine Gemeinschaftliche Cloud Infrastruktur für Geowissenschaftliche Daten und Services

Ziel des Cloud4GEO Projekts ist die Entwicklung einer in die European Open Science Cloud (EOSC) eingebundenen föderalen Cloud Infrastruktur für die fächerübergreifende Nutzung von geowissenschaftlichen Daten in Forschung und Lehre. Das Projekt wird bestehende Speicher- und Datenverarbeitungskapazitäten am Erdbeobachtungsdatenzentrum (EODC GmbH), der Geosphere Austria, und dem Vienna Scientific Cluster mit Computersystemen der beteiligten Universitäten verknüpfen und entsprechend eines Konzepts für die gemeinschaftliche Nutzung von Satellitendaten, Bodenbeobachtungen und Computersimulationen erweitern. Der Zugang zu den Daten und deren Nutzung wird durch ein Single Sign-On Verfahren und neuen Open Source Software Lösungen deutlich vereinfacht; eine Anbindung an Standards der internationalen EGI Föderation wird eruiert. Dadurch werden Wissenschaftler_innen und Studierende in die Lage versetzt, mit großen Datenmengen interdisziplinär zu arbeiten. Dies ist die Basis für exzellente Forschung und Ausbildung in so wichtigen Querschnittsthemen wie dem Klimawandel und der Energiewende.