Ook op reis naar Mars moet hardware kunnen falen

Infrastructuur Reading time: Reading time: Lästid: Lukemisen aika: Læsningstid Leestijd Lesetid 6 minutes minutes minuter minuuttia minutter minuten minutter

De ruimte zorgt voor specifieke uitdagingen voor hardware, en meestal worden de oplossingen daarvoor gezocht in heel speciale hardware. Ben Bennet, Director HPC Strategic Programs Hybrid IT Group van HPE, zoekt het nu juist in standaard hardware.

In het project Spaceborne werkt HPE samen met NASA om standaard hardware, zo van de lopende band, te testen in de ruimte. Ze doen dat om uit te vinden of je standaard servers kunt gaan inzetten in ruimteschepen, bijvoorbeeld voor een reis naar Mars. We spreken met Ben Bennett over de implicaties hiervan.

Er is nog nooit standaard hardware gebruikt in de ruimte, zo benadrukt Bennett, dus dit is een potentiële revolutie. De hardware voor in de ruimte werd tot nu toe custom gebouwd. De gedachte was namelijk dat deze machines veel degelijker moeten zijn dan hardware op aarde, omdat er in de ruimte niets fout mag gaan. Hardware mag absoluut niet falen. Vandaar dat alleen het degelijkste en meest robuuste spul de ruimte in werd gestuurd. Maar dat betekent ook direct dat heel zware en dure hardware is. Bovendien is het op het moment van lanceren al zwaar verouderd omdat er zoveel tijd gaat zitten in het ontwikkelen ervan en je niet zomaar allerlei nieuwe snufjes kunt toevoegen aan een langlopend project.

Maar dat hardware niet mag falen vindt Bennett complete onzin. “Falen hoort er nu eenmaal bij. Er bestaat geen hardware die niet faalt”, zo stelt hij resoluut. “Alles gaat een keer kapot. En dat is ook helemaal niet erg, als het maar veilig kapot gaat.” En precies daar wil Bennett op inzetten, het veilig falen van hardware. Alleen zit dat volgens hem niet zozeer in de hardware, die kan gewoon standaard zijn, maar in de software. Hij maakt zich dus sterk voor software defined in de ruimte, waarmee hardware in datacentra op aarde al wordt beheerd.

Als proef vliegen er sinds augustus 2017 twee standaard HPE servers mee op het International Space Station. “We hebben die servers helemaal willekeurig uitgekozen in het magazijn. Geef onze deze vier servers. Dan gaan deze twee de ruimte in en de andere twee blijven op aarde”, vertelt Bennett. Sinds september 2017 zijn de servers ook daadwerkelijk online in ISS. Als we hem spreken staat hij voor een dashboard waarop realtime informatie is te zien die door deze server wordt teruggezonden naar de aarde.

Op dit moment zijn deze servers de krachtigste computers op ISS. Die is in 1998 gelanceerd en heeft dus nog systemen uit die tijd. Maar toch is dit alleen maar een wetenschappelijke test, zo verzekert Bennett. In november komen de servers terug om te worden geanalyseerd en dan wordt nagegaan wat de invloed van de omstandigheden is op de servers. Zo is er bijvoorbeeld straling van de zon. Maar Bennett geeft ook aan dat spullen in de ruimte sneller ouder worden dan op aarde, zoals is aangetoond met de tweeling waarvan er ooit één de ruimte in ging. De analyses moeten dat allemaal aantonen en pas dan kan er besloten worden of er iets moet worden aangepast.

Voordelen van standaard servers

Het gebruik van standaard servers is volgens Bennett om allerlei redenen een goed idee. Om te beginnen is het heel goedkoop in vergelijking met speciaal gemaakte hardware. “Het gaat erom het zo economisch mogelijk te doen”, zegt hij. Standaard hardware kost een fractie van de prijs. En dan heb je het over honderdduizenden dollars in plaats van over miljoenen. Maar in een ruimteschip moet je ook economisch omgaan met ruimte. “In een ruimteschip is geen speciale plaats ingeruimd voor servers, zoals in een datacentrum. Ze wijzen je een driehoekig gevormde ruimte aan, ergens in een uithoek van het schip en daar moet je het dan allemaal maar in proppen. Dat werkt echt heel anders dan op aarde.”

Maar Bennett vindt dat voor hardware ook moet gelden wat voor astronauten geldt. “Zelf beweer ik altijd dat mijn lengte de reden is dat ik geen astronaut ben. Maar dat is natuurlijk onzin. Ik ben te oud en te dik om de ruimte in te gaan, en dat zou ook voor servers moeten gelden. Met de oude aanpak begon je drie jaar voor de lancering met de hardware. Met standaard hardware schaf je ze drie maanden voor lancering aan, en dan heb je natuurlijk nieuwer en beter spul voor een betere prijs.”

Naar Mars

Dit alles wordt volgens Bennett pas echt heel belangrijk als bemande ruimteschepen zich verder van de aarde af gaan bewegen, bijvoorbeeld naar Mars. De computers op ISS kun je nog voor een groot deel vanaf aarde beheren, maar bij een bemande marsreis, die er volgens Bennett binnen 15 jaar aan zit te komen, is dat allemaal heel anders. Met zo’n reis wordt software defined en automatisch beheer essentieel. Een voorproefje daarvan hebben we volgens hem gekregen tijdens de Apollo 11 missie.

Hij verwijst naar het bekende ‘Error 1202’ incident. Tijdens de landing op de maan kregen de astronauten een foutmelding waarvan ze niet wisten wat het was. Dus Armstrong vroeg het aan Houston: “It’s a 1202… What is that? Give us a reading on the 1202 Program Alarm…” De oplossing bleek vrij simpel, maar de astronauten waren 1202 nog nooit tegengekomen in de training, waardoor ze Houston nodig hadden bij het oplossen van het probleem. “Maar als zoiets tijdens de landing op Mars gebeurt,” zo plaatst Bennett het incident in een nieuw perspectief, “dan zijn de astronauten al ongeveer 24 minuten dood voordat het bericht de aarde bereikt.”

Dus kun je niet op aarde rekenen als je op weg bent naar Mars. “Sowieso moet je je niet veel voorstellen van de bandbreedte die je dan hebt”, gaat Bennett verder. “Dat betekent dat je alle data in the edge moet verwerken en alle processen aan boord moet beheren. Op zich is een ruimteschip naar Mars laten vliegen niet zo heel ingewikkeld, die baan is heel goed te berekenen. Het wordt ingewikkeld gemaakt door de mensen die meevliegen. Die moet je in leven houden, te eten geven, je moet ze bezig houden en ze maken dingen stuk. De enige keer dat de computers in ISS uitvielen gebeurde dat bijvoorbeeld doordat een astronaut per ongeluk met zijn knie een knop indrukte.”

Alles in de software

Om de systemen failsafe en foolproof te maken, moeten volgens Bennett dit soort incidenten, net als bijvoorbeeld errors als 1202, maar ook falende hardware, helemaal automatisch worden opgelost in de software. En dat kan prima als er voldoende hardware klaarstaat voor failover. “Dan hoef je tenminste ook geen sysadmin mee te nemen naar Mars. Je hebt vast wel ervaring met sysadmins”, zo gaat hij verder, “die wil je helemaal niet mee hebben.”

Om aan al die nieuwe eisen en specificaties in de ruimte tegemoet te komen maakt het projectteam van HPE natuurlijk speciale beheersoftware die dit allemaal regelt. En dat heeft ook weer impact hier op aarde, zo maakt Bennet de cirkel rond. “Binnenkort lanceren we nieuwe beheersoftware voor datacenters, en daar zit dan weer functionaliteit in die we hebben gemaakt voor in de ruimte.”

Beschikbaar voor ISS

Oorspronkelijk was het de bedoeling om de servers van het Spaceborneproject in november vorig jaar terug te halen naar de aarde, zodat ze geanalyseerd konden worden. Maar die terugkeer is uitgesteld. Sinds november is de proef zelfs uitgebreid  en is de compute-kracht van de servers ter beschikking gesteld aan de astronauten. Dat is maar al te welkom in ISS, omdat veel berekeningen uiteindelijk toch op aarde gedaan moesten worden. En de grote datasets die daarmee gepaard gaan souperen namelijk een groot deel op van de bandbreedte naar de aarde. Door high performance-mogelijkheden in de ruimte beschikbaar te maken kunnen de onderzoekers in de ruimte die bandbreedte beschikbaar houden voor noodgevallen. Zo wordt Spaceborne nu al ingezet op de manier waarop compute moet werken op de ruimtereis naar Mars.

Software-defined infrastructuur

Een software-defined infrastructuur bestaat uit volledig gevirtualiseerde compute, networking en storage, die worden beheerd als software. Het zit dan ook niet vast aan specifieke hardware en dit zorgt ervoor dat je het helemaal policy-based kunt inrichten, waardoor het volledig geautomatiseerd kan worden.

Meer weten over de status- en toekomst van High-Performance Computing? Lees hier verder


Relatert Lue seuraavaksi Relaterat Relateret Gerelateerd Related