Scott Tease über das weltweite Lenovo HPC-Geschäft

[Videoblog] Scott Tease über das weltweite HPC-Geschäft von Lenovo

Scott Tease verantwortet das weltweite HPC-Geschäft bei Lenovo (High-Performance Computing) und hat demzufolge eine ganze Menge zu diesem Thema zu sagen. Aus diesem Grund habe ich mit ihm während der International Supercomputing Conference 2018 ein Videointerview geführt. Darin spricht er über das HPC-Business von Lenovo im Allgemeinen, über die Besonderheiten der Warmwasser-Kühlungstechnologie Lenovo Neptune und über einen aktuellen HPC-Trend.

Lenovo stellt den führenden HPC-Anbieter dar

Betrachtet man die zweimal jährlich erscheinenden Top-500-Liste der 500 schnellsten Supercomputer der Welt, taucht dort Lenovo aktuell öfter auf als alle anderen Anbieter von Superrechnern, nämlich genau jedes vierte Mal. Das entspricht rein rechnerisch knapp 25 Prozent, worauf Lenovo mächtig stolz ist.  Das gilt ganz besonders für die Vielzahl an unterschiedlichen Konfigurationen, die das Unternehmen an seine Kunden verkauft.

So bekommen diese Firmen genau den Supercomputer, den sie für ihre Zwecke benötigen. Ob das der SuperMUC-NG mit seiner Warmwasser-gekühlten Anlage ist, der Marconi-Supercomputer in Italien, der MareNostrum4 des Barcelona Supercomputing Center oder der Niagara, der leistungsstärkste Supercomputer in Kanada mit gut 3 Petaflops – diese und andere Lenovo-Kunden setzen Supercomputing-System ein, die auf sie abgestimmt wurden.

Doch nicht nur bei Großkunden wie dem Leibniz-Rechenzentrum ist Lenovo gut im Geschäft. Denn auch mit kleineren Unternehmen und wissenschaftlichen Einrichtungen, die nicht unbedingt einen Supercomputer der Marke SuperMUC-NG brauchen, macht Lenovo aktuell gute Abschlüsse. So profitieren all diejenigen, die nur kleinere Recheneinheiten im Server benötigen, genauso von der zugrunde liegenden Lenovo Supercomputing-Technik.

Lenovo Neptun: Warmwasserkühlung zu diversen Zwecken

Bereits seit 2012 arbeitet Lenovo gemeinsam  mit dem Leibniz-Rechenzentrum an einem Kühlungssystem, das auf der Warmwassertechnik basiert. Dabei handelte es sich um den ersten SuperMUC, der von dieser seinerzeit noch ziemlich neuen Technik profitierte. Das Ziel damals (und heute) war eine deutliche Reduktion der Stromkosten, die solch ein Supercomputing verantwortet. Und genau diese Ideen und Konzepte, die daraus entstanden sind, werden heute unter der Bezeichnung Lenovo Neptun zusammengefasst. Gemeint ist damit eine Warmwasserkühlung für Großrechner, die Lenovo in den nächsten Jahren in einer Vielzahl von HPC-Systemen verbauen will.

Neben dieser direkten Warmwasserkühlung hat Lenovo aber auch kleinere Wärmeableitersysteme in petto. Dazu gehört zum Beispiel Rear Door Heat eXchanger. Damit lässt sich ebenfalls sehr effizient die Wärme eines Rechnersystems ableiten. Der Supercomputer MareNostrum4 des Barcelona Supercomputing Center setzt beispielsweise auf diese Technik. Dabei handelt es sich um eine Art Heizung, die anstelle der Serverrack-Tür am Rechner angebracht wird.

Darüber hinaus hat Lenovo eine Kühlungstechnik namens Thermal Transfers Module (TTM) im Programm. Damit lassen sich ganz im Sinne von Lenovo Neptun Systeme mithilfe von warmen Wasser kühlen, allerdings nicht auf System-, sondern auf CPU-Ebene. Dabei handelt sich um ein Hybridsystem, das einerseits die klassische Luftzirkulierung und andererseits die neuartige Warmwasserkühlung einsetzt. TTM kommt vor allem in kleineren Rechnereinheiten zum Einsatz, in denen aus Platzgründen Techniken wie Lenovo Neptun keine Option ist. Dies sorgt für mehr Rechnerleistung bei weniger Abwärme – und für weniger Lärm.

Aktuelle HPC-Trend: GPU statt CPU

Einer der wesentlichen HPC-Trends betrifft die Prozessortechnik, die verstärkt in Supercomputern zum Einsatz kommt. So findet nämlich gerade eine Transformation vom traditionell CPU-lastigen Rechnermodell hin zu GPU-Systemen steht. Das bedeutet konkret, dass vor allem Spezialanwendungen mehr und mehr von der Multicore-Architektur der Hochleistungsgrafikkarten wie einer NVIDIA V100 profitieren. Dazu gehört beispielsweise das riesige Themenfeld der Künstlichen Intelligenz, das aufgrund seiner hohen Rechneranforderungen verstärkt auf GPUs setzen wird. HPC at its best, sozusagen.

Das komplette Interview mit Scott Tease (auf Englisch)

Martin W. Hiegl über das Leibniz-Rechenzentrum (LRZ) und Lenovo

[Videoblog] Lenovo und die LRZ-SuperMUC-NG-Kooperation

Im Herbst 2018 geht die dritte Ausbaustufe des Lenovo Supercomputers der „Marke“ SuperMUC mit dem Zusatz „NG“ für „Next Generation“ ans Strom-Netz. Grund genug, mit einem der führenden Köpfe dieses für Lenovo so prestigeträchtigen Projekts ein Videointerview zu führen. Namentlich ist das Martin W. Hiegl von der Lenovo Data Center Group, der dort die Position des Director WW HPC & AI bekleidet. Mit ihm habe ich mich auf der International Supercomputing Conference 2018 über SuperMUC-NG und Co. unterhalten.

Darum ist für Lenovo die Kooperation mit dem Leibniz-Rechenzentrum so wichtig

Seit fast nunmehr zehn Jahren arbeiten Lenovo (seit 2014, vorher IBM) und das Leibniz-Rechenzentrum in Sachen Supercomputer zusammen. Dabei lag und liegt einer der Schwerpunkte im Bereich Energieeffizienz. So wies bereits der allererste SuperMUC im Jahr 2012 eine Heißwasserkühlung auf, die die gesamte Supercomputer-Anlage deutlich effizienter kühlte als andere Verfahren. Drei Jahre später folgte die zweite Ausbaustufe namens SuperMUC 2, und dieses Jahr im Herbst geht mit dem SuperMUC-NG die dritte Generation des Lenovo Supercomputers an der Start. Damit stellt die Kooperation mit dem LRZ für Lenovo einen wichtigen, langfristigen Baustein der Supercomputing-Strategie dar.

Der SuperMUC-NG geht im Herbst 2018 an das Strom-Netz

Nach drei Jahren SuperMUC 2 geht die dritte Generation des SuperMUC mit dem Zusatz „NG“ (wie „Next Generation“) ans Garchinger Stromnetz. Er umfasst 90 Compute-Racks, was 6.500 Compute-Knoten der Marke Lenovo ThinkSystem SD 650 DWC entspricht, die auf den skalierbaren Intel Xeon-Prozessoren basieren.

Der erste dieser Serverschränke wurde bereits ins Betrieb genommen, und über den Sommer verteilt wird Rack für Rack hinzukommen, sodass der SuperMUC-NG wie geplant im Herbst 2018 vom LRZ abgenommen und in Betrieb werden kann. Gerade rechtzeitig vor der Veröffentlichung der Herbstausgabe der Top-500-Liste, in der sich die 500 schnellsten Supercomputer der Welt befinden.

Der SuperMUC-NG weist beeindruckende Leistungswerte auf

In Sachen Leistungswerte wird der SuperMUC-NG aus dem Stand auf einem der vordersten Plätze der Top-500 klettern. Denn mit seiner Rechenleistung von rund 27 PetaFLOPS wird der LRZ-Rechner – Stand heute – der schnellste Supercomputer in Europa sein und darüber hinaus zu den Top 10 der Top 500 zählen. Das ist auch erforderlich, denn als HPC-Provider aller Münchner Universitäten ist das Leibniz-Rechenzentrum auf solche Hochleistungswerte dringend angewiesen, will es künftig seine Kunden zufriedenstellen. Denn diese benötigen die Rechenleistung des SuperMUC-NG für vielfältige Anwendungsbereiche, die mehr und mehr CPU-Power erfordern.

Die Kooperation mit dem LRZ umfasst mehr als nur Hardware

Bei der Implementierung des SuperMUC-NG gehört neben der Hardware auch die komplette Infrastruktur und die benötigte Software. Hierbei ist vor allem der Lenovo Intelligent Cluster Orchestrator zu nennen, der sich um sämtliche HPC-Funktionalitäten kümmert. Darüber hinaus zeichnet sich die Lenovo Data Center Group für die Wartung des Systems und den Anwendersupport verantwortlich.

Zudem sieht der Kooperationsvertrag eine Zusammenarbeit in Sachen Energieeffizienz vor. Hierbei soll mithilfe von optimiertem Software-Quellcode und der Energy Aware Runtime (EAR) für eine höhere Energieeffizienz gesorgt werden. Die EAR hat Lenovo in Kooperation mit dem Barcelona Supercomputing Center entwickelt. Dieses Tool sorgt unter anderem für angepasste Taktfrequenzen der Xeon-Prozessoren zur Laufzeit, je nachdem, ob eine Anwendung gerade mehr oder weniger Rechenleistung benötigt.

Das komplette Interview mit Martin W. Hiegl

Disclaimer: Diesen Video-Blogbeitrag habe ich im Auftrag von Lenovo verfasst. Bei der Ausgestaltung hatte ich freie Hand.

Der SuperMUC-NG wird wie seine Vorgänger wieder mit warmen Wasser gekühlt

SuperMUC-NG: Der nächste Supercomputer aus München

26,7 PetaFLOPS, das ist eine gewaltige Zahl. Sie besteht nämlich aus 17 Stellen – und zwar vor dem Komma! Diese enorme Rechenleistung, gemessen in Fließpunktoperationen pro Sekunde, kommt auf das Landesrechenzentrum (kurz: LRZ) Garching zu, wenn es den nächsten Supercomputer der Markt „SuperMUC“ einweihen darf. Sein genauer Name lautet SuperMUC-NG, wobei die Buchstaben „NG“ für „Next Generation“ stehen.

6.400 Lenovo-Server für Big-Data-Analysen und Erdbeben-Simulationen

Und genau darum geht es beim nächsten SuperMUC, dessen dritte Generation bereits zum Einsatz kommen wird. Denn in Zeiten von Big Data-Analysen und Echtzeitsimulationen sind Großrechner wie der SuperMUC-NG erforderlich, die mit riesigen Datenmengen, wie sie heute und morgen entstehen, auch zurecht kommen. Hierfür werden im Herzen des SuperMUC-NG gut 6.400 Hochleistungsrechner vom Typ Lenovo ThinkSystem SD 650 DWC werkeln, in denen der Intel Xeon Scalable-Prozessor das Berechnen bekannter und künftiger HPC-Applikationen unterstützt. In Summe sind das mehr als 300.000 CPU-Kerne, die die eingangs erwähnten 26,7 PetaFLOPS schaffen.

Warmwasserkühlung spart Energie und schafft gleichzeitig neue

Bei dieser unfassbar hohen Rechenleistung darf in Zeiten von Global Warming der Umweltschutzgedanke natürlich nicht zu kurz kommen. Daher setzt man im LRZ auch beim SuperMUC-NG wieder auf die Warmwasserkühlung, die seit Anfang an für eine sehr effiziente „Kühlung“ der gesamten Supercomputeranlage eingesetzt wird. Das führt nicht nur zu enorm reduzierten Energiekosten um bis zu 45 Prozent, sondern ermöglicht gleichzeitig das Recyceln der Abwärme in Form von Warmwasser für umliegende Einrichtungen und Gebäude. Doppeltes Energiesparen, sozusagen.

Erdbeben- und Klimawandel-Simulationen stehen auf der SuperMUC-NG-Liste

Doch was macht man mit dieser geballten Rechenpower, damit sie auch sinnvoll und zum Wohle der Gesellschaft eingesetzt werden kann? Nun, hierfür kommen zahlreiche Anwendungen infrage, wie die Vergangenheit bereits gezeigt hat. So konnte beispielsweise mithilfe des SuperMUC 2 das große Sumatra-Erdbeben simuliert werden, das im Dezember 2004 einen gewaltigen Tsunami auslöste. Hierfür erhielt das LRZ Garching sogar einen Preis, verliehen auf der diesjährigen Supercomputing Conference 2017. Aber auch der Klimawandel und die damit in Verbindung stehenden Auswirkungen auf Mensch und Umwelt können künftig mithilfe des SuperMUC-NG noch besser analysiert und bewertet werden.

Video-Rückblick: Prof. Dr. Bode im Interview

Dreieinhalb Jahre ist es schon wieder her, da habe ich mit Professor Dr. Arndt Bode vom LRZ Garching dieses Interview zum SuperMUC 2 geführt.

Ältere Informationen zu den Vorgängern des SuperMUC-NG

https://www.hightech-computing.de/supermuc-schafft-der-erdbebensimulation-mehr-als-1-petaflops/

https://www.hightech-computing.de/supercomputer-mit-super-kuehlung-der-supermuc-von-ibm/

https://www.hightech-computing.de/isc14-klaus-gottschalk-ibm-ueber-den-geplanten-ausbau-des-supermuc/