IBM und DESY: leistungsfähige Big-Data-Lösung für Röntgenlicht-Forschung

By | 27. August 2014

Ein Blick ins Innere von DESYKennen Sie DESY? Also, nicht die Freundin von Donald Duck, sondern das Deutsche Elektronen-Synchrotron, dieses Beschleuniger- und Rechenzentrum, das an den Standorten Hamburg und Zeuthen (Brandenburg) Forschern aus aller Welt weitreichende Blicke und Erkenntnisse in den Mikro- und Nanokosmos erlaubt.

Dabei stehen diverse Forschungsgeräte wie PETRA III im Vordergrund, mit denen sich per Röntgenlicht enorme Energien erzeugen lassen, die für das Entdecken neuer Universen erforderlich sind.

Bei PETRA III handelt es sich um eine sogenannte Speicherring-Röntgenstrahlquelle, mit der sehr kleine Proben mithilfe von äußerst kurzwelligem Röntgenlicht beschleunigt und untersucht werden können. PERTRA III gibt es bereits seit 1978 und wurde das letzte Mal 2009 in seine jetzige Form umgebaut. Die Beschleunigeranlage ist gut 2 Kilometer lang und bietet derzeit 14 Messplätze für bis zu 30 Instrumente.

Riesige Datenmenge erfordern leistungsfähige Speicherlösungen

Dass bei derart komplexen Messungen und Analysen riesige Datenmengen zustande kommen, ist geradezu zwangsläufig. Damit die Daten aber nicht nur gesammelt, sondern auch in einer angemessenen Zeit analysiert und im Rahmen großer Forschungsprojekte eingesetzt werden können, sind leistungsfähige Speichernetze erforderlich, die mit einer derart großen Datenmenge problemlos zurecht kommen können. Zu diesem Zweck haben DESY und IBM eine Big-Data-Lösung entwickelt, die bis zu 20 Gigabyte pro Sekunde verarbeiten kann. Damit sollen jedes Jahr mehr als 2.000 Forscher und Wissenschaftler bei ihrer Arbeit unterstützt werden.

Sieht man sich die Proben genauer an, die mit PETRA III genommen und untersucht werden können, wird schnell klar: mit einer Standard-Storage-Lösung ist es hier nicht getan. Denn ein typischer Detektor, mit dem das Licht kanalisiert und untersucht wird, liefert einen Datenstrom von etwa fünf Gigabit pro Sekunde. Multipliziert man diesen Wert mit den 14 möglichen Messplätzen, die innerhalb von PETRA III zur Verfügung stehen, kommt man auf einen Wert von 70 Gigabit pro Sekunde, was knapp 9 Gigabyte entspricht. Zudem wird die Forschungslichtquelle gerade um zehn Messstationen erweitert, was eine maximale Datenmenge von 120 Gigabit oder 15 Gigabyte pro Sekunde ergibt.

Aus GPFS wird Elastic Storage

Aus diesem Grund haben DESY und IBM unter dem Codenamen Elastic Storage eine Speicherlösung konzipiert und realisiert, die dem Konzept des Software Defined Storage folgt. Damit lassen sich wie bereits erwähnte 20 Gigabyte pro Sekunde transferieren und speichern. Das erlaubt neben dem superschnellen Datenverkehr auch das Bereitstellen von PETRA III als Analysis-as-a-Service, bei dem die Messdaten in der Cloud speicher- und abrufbar sind.

Doch das soll nur der Anfang sein. So sind DESY und internationale Partner gerade dabei, mit dem Röntgenlaser European XFEL eine Lichtquelle zu bauen, die PETRA III in Sachen Leistungsfähigkeit und Datenmengen leichterdings in den Schatten stellen wird. Die Rede ist von etwa 100 Petabyte pro Jahr, was umgerechnet 100 Millionen Gigabyte entspricht. Dieses enorme Datenvolumen wird derzeit nur am CERN (Genf) produziert, und zwar mithilfe des Teilchenbeschleunigers LHC (Large Hadron Collider). Diese äußerst leistungsfähige Maschine ist so groß, dass sie locker in Notre Dame in Paris passen würde.

Elastic Storage erlaubt skalierbare Speichernetze mit bis zu 20 GB/sec.

Elastic Storage basiert übrigens auf einer Technik, die bei IBM schon seit 1998 zum Einsatz kommt: GPFS (General Parallel File System). Damit sind äußerst skalierbare und leistungsfähige Speichernetze möglich, die sich besonders einfach und effizient verwalten lassen. Aktuell kommt die Version 4.1 zum Einsatz, die zahlreiche interessante Merkmale aufweist.

Dazu zählt eine verbesserte Datensicherheit auf Basis einer hochkomplexen Verschlüsselungstechnik, die aus dem NIST (National Institute of Standards and Technology) stammt und die Bezeichnung SP 800-131A trägt. Die zugehörigen Richtlinien werden unter anderem von US-Regierungsbehörden und Finanzinstituten verwendet. Darüber hinaus setzt Elastic Storage 4.1 auf server-seitige Flash-Caches, mit der die I/O-Leistung um den Faktor 6 gesteigert werden kann.

Bitte folgen

Michael Hülskötter

Ich schreibe im Auftrag der IBM Deutschland GmbH auf dem Hightech Computing Blog.
Bitte folgen

One thought on “IBM und DESY: leistungsfähige Big-Data-Lösung für Röntgenlicht-Forschung

  1. Pingback: So wird sich High Performance Computing (HPC) künftig entwickeln

Schreibe einen Kommentar