På et romferd til Mars må maskinvaren feile på en sikker måte

Infrastruktur, Møt HPE Reading time: Reading time: Lästid: Lukemisen aika: Læsningstid Leestijd Lesetid 6 minutes minutes minuter minuuttia minutter minuten minutter

Rommet gir visse utfordringer for maskinvare, og løsningene på disse søkes vanligvis i svært spesialisert maskinvare. Ben Bennett, HPE Director HPC Strategic Programs Hybrid IT Group, ser nå tvertimot etter løsninger i standard maskinvare.

HPE samarbeider med NASA om Spaceborne-prosjektet, som tester standard COTS-maskinvare i rommet. De håper å finne ut om standardservere kan brukes i rommet, for eksempel på et romferd til Mars. Vi har snakket med Ben Bennett om hva dette innebærer.

Standard maskinvare har aldri blitt brukt i rommet, understreker Bennett, så dette markerer en potensiell revolusjon. Programvare for rommet har frem til nå alltid vært spesialtilpasset. Tanken har alltid vært at disse maskinene måtte være mye mer pålitelige og motstandsdyktige enn maskinvaren på jorden, fordi du ikke kan tillate at noe går galt i rommet. Maskinvare kan absolutt ikke tillates å feile, så bare det mest pålitelige og robuste utstyret sendes ut i rommet. Men umiddelbart betyr dette også svært tung og kostbar maskinvare. I tillegg er den fullstendig utdatert allerede fra det øyeblikket den lanseres, fordi det går med så mye tid på å utvikle den, og fordi du ikke bare kan legge til en masse nytt i et langsiktig prosjekt.

Men Bennett mener det bare er tull at maskinvare ikke kan tillates å feile. “Feil er rett og slett en fast bestanddel av maskinvare. Det er ikke noe som heter at maskinvare ikke feiler”, sier han bestemt. “Alt bryter sammen en gang i blant. Men det er faktisk ikke så alvorlig, så sant feilen skjer på en sikker måte.” Og det er akkurat dette Bennett ønsker å fokusere på: hvordan maskinvare kan feile på en sikker måte. Bare at han mener det ikke har så mye å gjøre med maskinvaren, som kan være standard, men med programvaren. Så han er en stor fan av programvare definert i rommet, som allerede styrer maskinvare i datasentre på jorden.

Tester på ISS

For å teste disse ideene har to HPE-servere vært om bord på den internasjonale romstasjonen (ISS) siden august 2017. “Vi valgte serverne helt tilfeldig blant dem som var tilgjengelige. Gi oss disse fire serverne. Så sender vi to ut i rommet, og de andre to blir værende på jorden”, sier Bennett. Serverne har vært online på romstasjonen siden september 2017. Vi snakker med ham foran et instrumentpanel som viser sanntidsinformasjon som disse serverne sender tilbake til jorden.

Disse serverne er nå de kraftigste datamaskinene på romstasjonen. Den ble skutt ut i 1991 og har fortsatt systemer fra den tiden. Men dette er bare en vitenskapelig test, forsikrer Bennett oss om. I november skal blir serverne hentes tilbake for å bli analysert, og påvirkningen fra tiden i rommet skal undersøkes. For eksempel solstråling. Men Bennett forklarer også at ting i rommet eldes raskere enn på jorden, og viser til et eksempel der bare en av et tvillingpar ble sendt ut i rommet. Analysene bør gjenspeile alt dette, og bare da kan man beslutte om det er noe som trenger å endres.

Fordeler med standardservere

Ifølge Bennett er bruken av standardservere en god idé av mange årsaker. For det første er det svært rimelig i forhold til spesialdesignet maskinvare. “Det handler om å gjøre det så økonomisk gunstig som mulig”, sier han. Standard programvare koster en brøkdel av prisen. Du snakker om hundre tusenvis av dollar i stedet for millioner. Men på et romskip må du også være økonomisk med plassen. “Et romskip har ikke et eget område som er satt av for servere, slik et datasenter har. De henviser deg til en trekantet hjørne langt inne i romskipet, der du bare må klemme alt inn. Det fungerer helt annerledes enn på jorden.”

Men Bennett mener at det samme bør gjelde for maskinvare som for astronauter. “Jeg sier alltid til folk at høyden min er den eneste grunnen til at jeg ikke ble astronaut. Men det er selvsagt bare tull. Jeg er for gammel og for tykk til å dra ut i rommet, og dette må også gjelde for serverne våre. Med den gamle tilnærmingen begynte du med maskinvaren tre år før utskytingen. Med standard maskinvare kjøper du den tre måneder før utskytingen, noe som selvsagt betyr at du har nyere og bedre utstyr til en bedre pris.”

Romferd Til Mars

Ifølge Bennett blir alt dette virkelig viktig først når bemannede romskip reiser enda lenger vekk fra jorden, for eksempel til Mars. Du kan fortsatt styre de fleste datamaskinene på ISS fra jorden, men på en bemannet romferd til Mars, som Bennett mener ligger i kortene innen de neste 15 årene, endres alt. På en slik ferd er det avgjørende å ha programvare som er definert og automatisk styrt. Han mener at vi fikk en forsmak på dette på Apollo 11-ferden.

Han peker på den velkjente ”feil 1202”-hendelsen. Da astronautene landet på månen, fikk de en feilkode som de ikke forstod. Så Armstrong spurte Houston: “Vi har fått en 1202… Hva er det? Les opp programalarm 1202 for oss…” Løsningen viste seg å være enkel, men astronautene hadde aldri støtt på 1202 i opplæringen, og de trengte derfor Houstons hjelp til å løse problemet. “Men hvis noe slikt skulle skje under landingen på Mars”, sier Bennett og gir et nytt perspektiv på hendelsen, “ville astronautene vært døde i ca. 24 minutter før meldingen nådde jorden”.

I 2024 kommer astronauter til å gå på månen igjen – takket være denne supercomputeren

Du kan altså ikke stole på jorden når du er på romferd til Mars. “Du burde uansett ikke ha noen store forventninger til den tilgjengelige båndbredden”, fortsetter Bennett. “Det betyr at du må behandle alle data der og da og styre alle prosesser om bord. Å sende et romskip til Mars er ikke så veldig avansert i seg selv, banen er enkel å beregne. Det er menneskene om bord som gjør det avansert. Du må holde dem i live, gi dem mat, holde dem i gang – og de ødelegger ting. Den eneste gangen datamaskinene på romstasjonen sviktet, for eksempel, var da en astronaut ved et uhell traff en knapp med kneet sitt.”

Alt i programvaren

For å oppnå helt feilsikre systemer mener Bennett at hendelser av denne typen, i likhet med feil som for eksempel 1202, men også feilende maskinvare, må løses fullt og helt i programvaren. Noe som er fint så lenge du har tilstrekkelig maskinvare tilgjengelig for failover. “Dette betyr i det minste at du ikke trenger å ta med deg en systemadministrator til Mars. Dere har nok alle hatt erfaring med systemadministratorer”, fortsetter han, “og dere ønsker virkelig ikke å ta dem med dere”.

For å imøtekomme alle disse nye kravene og spesifikasjonene i rommet utvikler HPEs prosjektteam selvsagt egen styringsprogramvare som skal håndtere alt dette. Og det vil igjen få effekt her på jorden, sier Bennett, og fullfører sirkelen. “Vi kommer snart til å lansere ny styringsprogramvare for datasentre, med funksjonalitet som vi har designet for bruk i rommet.”

Tilgjengelig for ISS

Hensikten var opprinnelig å hente serverne fra Spaceborne-prosjektet tilbake til jorden for analyse i november i fjor. Men dette har blitt forsinket. Fra november har selve testtiden blitt forlenget, og servernes beregningskraft er gjort tilgjengelig for astronautene. Dette er en svært kjærkommen utvikling på ISS, fordi en rekke beregninger til syvende og sist måtte gjøres på jorden. Og de store datasettene som følger med, spiser opp mye av båndbredden tilbake til jorden. Ved å gjøre høy ytelse tilgjengelig i rommet kan forskerne i rommet holde båndbredden ledig for bruk ved nødssituasjoner. Det betyr at Spaceborne allerede nå blir brukt på den måten datamaskinene må arbeide på på romferden til Mars.

Programvaredefinert infrastruktur

En programvaredefinert infrastruktur består fullt og helt av virtualisert databehandling, nettverksbygging og lagring, der alt styres som programvare. Den er ikke knyttet til noen spesifikk maskinvare. Du kan dermed konfigurere den på en helt policybasert måte, slik at den er fullt ut automatisert.


Relatert Lue seuraavaksi Relaterat Relateret Gerelateerd Related