Über Austrian DataLAB - Cluster Forschungsdaten

Überblick
Produkt Vision
Warum glauben wir an diese Vision?

ÜBERBLICK

Das Projekt ADLS – Austrian DataLAB and Services wurde ins Leben gerufen, um kollaboratives Arbeiten zwischen Universitäten, im speziellen in den Bereichen Data Science und High Performance Computing (HPC), zu fördern und zu vereinfachen. Es soll ein einfacher Zugang zu einem landesweiten Netzwerk von Anwendungen in einem föderalen Opt-in-Modell ermöglicht werden. Dabei liegt der Fokus im Besonderen auf der Erhöhung der Benutzerfreundlichkeit sowie Zeitersparnis für Forschende, Lehrende und Studierende im Zuge der Nutzung von Rechenressourcen.

Dazu sollen die Nutzer*innen in der Lage sein:

eigene, unter Umständen rechenintensive Anwendungen zu betreiben
auf bestehende Anwendungen zurückzugreifen
keine Konfiguration der benötigten Umgebung vornehmen zu müssen

Das Projekt beschäftigt sich mit der Erweiterung und Integration digitaler Services (Anwendungsprogramme, welche die Bearbeitung und Analyse verschiedener Arten von Daten ermöglichen) sowie der Bereitstellung von Vorlagen für zukünftige digitale Services und Plattformen – aufbauend auf existierender Infrastruktur. Der Zugang zu diesen Services soll über grafische Benutzeroberflächen und interaktive Plattformen bereitgestellt werden. Im Hintergrund greifen diese Anwendungsprogramme auf föderierte Ressourcen zur Bearbeitung und Speicherung von Daten zu.

Das Ziel des Projektes ist es dieses Service einer breiten Anwender*innen Gruppe zur Verfügung zu stellen, weshalb verschiedene Anwendungsbereiche und Use Cases definiert wurden, welche sich in der Umsetzung widerspiegeln werden.

PRODUCT VISION

Der Schwerpunkt des bereitgestellten Produkts liegt auf Benutzerfreundlichkeit, Self-Service und einfacher Bedienung. Forschende aus den unterschiedlichsten Bereichen werden in inter-universitäre Data-Sharing-Prozesse involviert. Es ist notwendig, Forschungsdaten reproduzierbar zu machen und dafür professionelle und hochpotente Ressourcen nutzen zu können, ohne dazu notwendigerweise etwas auf dem eigenen Gerät installieren zu müssen oder Zeit für das Einrichten der benötigten Umgebung zu verschwenden. Da Zeit eine knappe Ressource ist, soll die angebotene Lösung helfen, dieses kostbare Gut im Forschungs- aber auch im Lehrkontext zu sparen. Um dies zu ermöglichen, liegt ein besonderer Fokus auf der vollautomatischen Bereitstellung der jeweiligen Benutzeranwendungen. Wie dies gewährleistet werden soll, erfahren Sie im Abschnitt Warum glauben wir an diese Vision?. Das Ziel ist es dabei verschiedene Bereiche von Entdeckung von Applikationen und Ressourcen über Entwicklung bis hin zur Bereitstellung der Applikationen abzudecken.

Anwendungsbereich	Fokus
Entdecken	Suchen und Finden von existierenden Applikationen und Daten Verfügbare (HPC und HTC) Ressourcen finden Ausprobieren von Beispiel Applikationen, Tools und Daten
Entwickeln	Entwickeln und Veröffentlichen eigener Applikationen Kollaboratives Arbeiten Testen des Codes und der Applikationen – Zugriff auf Online-Tools rund um Entwicklung, Test und Management
Ausführen	Einfaches Bereitstellen von Applikationen Ausführung und Verwendung der Applikationen – ohne lokale Konfigurationen Ausführen von Jobs

WARUM GLAUBEN WIR AN DIESE VISION?

Aus Interviews und Feedback ging hervor, dass Nutzer*innen die Möglichkeit haben wollen eigene Applikationen umzusetzen und auszufuehren, ohne dabei sich um die darunter liegenden Schichten der Infrastruktur und insbesondere des Netzwerkes und der Datenuebertragung zu sorgen. Für schnellen und übersichtlichen Zugang soll ein self-service User-Portal sorgen, sich von dort auf verschiedensten Diensten zentral anzumelden und Zugriffsrechte zu verwalten. Des Weiteren ist es eine grosse Zeitersparnis, in jedem Portal Applikationen zu erstellen, zu erweitern oder auf vorhandene zurückzugreifen, ohne am eigenen PC etwas installieren zu müssen. Das Portal ist über eine standardisierte Schnittstelle mit dem jeweiligen Back-End verbunden. Dabei handelt es sich einerseits um den jeweiligen High-Performance-Cluster oder aber auch um andere Rechenressourcen, welche die jeweiligen Universitäten selbst zur Verfügung haben. Die Daten liegen bei der jeweiligen Universität, können allerdings, bei Bedarf, einfach mit anderen Universitäten über gezielte Zugriffsrechte geteilt werden.

Bei der geplanten Lösung wird es sich nicht um eine zentral verwaltete Infrastruktur handeln, viel mehr sollen Universitäten die Möglichkeit bekommen, diese über eine einfache Anwendungsoberfläche, bei Bedarf selbst bereitzustellen. Diese Vorgehensweise wird IaC genannt – Infrastruktur als Code. Das macht es den Nutzer*innen einfach selbständig zu arbeiten und nicht auf einige wenige Expert*innen angewiesen zu sein. Die Anwender*innen müssen sich dennoch nicht um die darunter liegende Architektur kümmern. Die föderierte Datenverwaltung ermöglicht es, Kontrolle über die Daten zu behalten und gleichzeitig die Möglichkeit zu haben, sie mit anderen Universitäten auf einfache und benutzerfreundliche Weise zu teilen.

Die folgende Grafik zeigt jene Vision in ihren möglichen Komponenten.