we hebben een supercomputer!

of toch niet?

02/05/2019

Begin 2019 verschenen er in de media berichten dat UAntwerpen samen met het onafhankelijke onderzoekscentrum IMEC de krachtigste supercomputer van het land had aangeschaft. Wij raakten nieuwsgierig en stuurden onze verantwoordelijke IT samen met een computerleek uit onze redactie naar de buitencampus om dit verder uit te zoeken. Kurt Lust, consultant voor de high performance computers van CalcUA vertelde ons meteen dat de nieuwe computer helemaal niet zo ‘super’ is als de media beweren.

Wanneer is een computer ‘super’? “De norm voor supercomputers evolueert voortdurend. In 1977 werden de weersvoorspellingen gedaan met een supercomputer. Als je dat toestel vergelijkt met de eerste iPhone dertig jaar later dan blijkt dat die smartphone krachtiger is", schetst Lust, "toch noemt niemand een iPhone een supercomputer. Het nieuwe toestel dat dit jaar is aangeschaft, een Nvidia DGX-2, heeft zestien speciale chips om op te rekenen.” Vervolgens wordt duidelijk waarom dit geen supercomputer is. “De krachtigste computer ter wereld van dat type heeft 27648 dergelijke chips. Als je meer dan duizend keer trager bent dan de snelste, is het moeilijk om nog van een supercomputer te spreken.”

 

De norm voor supercomputers evolueert voortdurend.

 

Supercomputers zijn er vooral om complexe berekeningen op uit te voeren. De Nvidia DGX-2 is overigens niet de enige ‘supercomputer’ die op onze universiteit ingezet wordt. “We hebben bij CalcUA twee clusters: de oude heet Hopper, naar Grace Hopper, die volgens een anekdote de term 'computer bug' introduceerde toen haar team een mot vond in hun computer. De nieuwere cluster heet Leibniz. Zo'n cluster is een groep van speciale kleinere computers, zogenoemde nodes, die efficiënt kunnen samenwerken over een supersnel netwerk. Leibniz heeft ongeveer 150 van zulke nodes.”

Het gaat echter niet alleen om het aantal nodes waar een cluster uit bestaat. “Om te bepalen hoe krachtig een computer is, testen experts hoeveel berekeningen hij per seconde kan uitvoeren. Dit noemen we FLOPS (floating point operations per second, nvdr.). De clusters van de universiteit halen zo ongeveer 0,1 petaFLOPS." (0,15 voor Leibniz, 0,07 voor Hopper). Omgerekend zijn dit 100 000 000 000 000 FLOPS, best veel dus.

 

goochelen met cijfers

Hoe snel is het jongste exemplaar precies? “Van de nieuwe DGX-2 wordt gezegd dat hij tot 2 petaFLOPS haalt, maar dat zijn niet dezelfde FLOPS. Om te kunnen vergelijken moet je hetzelfde soort bewerkingen doen met gelijkaardige getallen. Om aan dat hoge cijfer te komen, worden kleine getallen en 'gemakkelijke' bewerkingen gebruikt. Als je de standaard volgt, dan wordt het resultaat opeens zestien keer lager.” Bovendien zijn FLOPS maar een deel van het verhaal, vertelt Lust. “Je moet niet alleen bewerkingen doen, je moet bijvoorbeeld ook je gegevens kunnen bijhouden. Daarvoor is er het RAM-geheugen en de permanente opslag. De DGX-2 heeft wel een snellere permanente opslag, maar hij heeft een stuk minder capaciteit, zo'n 30TB. De capaciteit van CalcUA is nu 100TB en wordt waarschijnlijk nog uitgebreid naar 500TB.”

 

supergebruikers

We hebben al deze hoogwaardige technologie, komen er dan elke dag mannetjes met kromme ruggen naar UAntwerpen om de hele dag berekeningen uit te voeren? "Nee hoor. De clusters worden gebruikt voor allerlei onderzoeken aan de universiteit. De grootste groep gebruikers komt uit de exacte- en ingenieurswetenschappen, maar ook uit de psychologie of sociale wetenschappen komen gebruikers aankloppen die grote datasets moeten verwerken. De meestgebruikte toepassing zijn simulaties. De nieuwe DGX-2 daarentegen is specifiek ontworpen om moderne AI-systemen, specifieker neurale netwerken, uit te voeren.” (Neurale netwerken zijn een techniek geïnspireerd op de werking van het brein, nvdr.)

 

Je zou een subtropisch zwembad naast de universiteit kunnen zetten en daarmee op energie besparen.

 

We horen en lezen steeds vaker dat AI de toekomst is op het gebied van technologie. “Artificiële intelligentie trekt inderdaad veel aandacht naar zich toe omdat het nieuw is”, vertelt Lust, “je moet altijd iets hebben om te verkopen hè. Neurale netwerken zijn sterk in onder andere spraak- en beeldherkenning, maar dat is gewoonlijk slechts een klein onderdeel van een project. Er is zelfs weinig vraag naar aan onze universiteit.”

 

superverbruik

Dan is er nog het stroomverbruik. “CalcUA verbruikt in totaal ongeveer 100 kiloWatt. De DGX-2 zit rond de 10 kiloWatt. Het belangrijkste is dat dit vermogen goed gebruikt wordt”, benadrukt Lust, “de gebruikers moeten hun taken op voorhand klaarzetten zodat de capaciteit goed verdeeld kan worden. Het helpt ook als de gebruikers efficiënte programmacode uitvoeren. In grotere rekencentra moeten gebruikers aantonen dat ze daartoe in staat zijn. CalcUA doet dat niet, we willen het graag laagdrempelig houden.” 

“Om het verbruik omlaag te halen wordt tegenwoordig bij supercomputers meer en meer waterkoeling gebruikt”, vervolgt de consultant, “nieuwe systemen kunnen al koelen met water tot 35 graden. Dit is enorm voordelig omdat het water niet meer apart gekoeld moet worden. Het water dat buitenkomt is dan 45 graden en kan nog gebruikt worden voor verwarming. Je zou een subtropisch zwembad naast de universiteit kunnen zetten en daarmee energie besparen.”