Evnen til en datamaskin til å svare på feil eller katastrofe som maskinvarefeil og strømbrudd for å forhindre tap av data er kjent som
feiltoleranse eller
motstandskraft . Dette innebærer en kombinasjon av maskinvare- og programvareteknikker:
Maskinvareteknikker:
* Redundans: Bruke flere komponenter (f.eks. Harddrev, strømforsyninger, prosessorer) for å gi sikkerhetskopi hvis man mislykkes.
* raid (overflødig rekke uavhengige disker): En gruppe harddisker som jobber sammen for å gi dataredundans og forbedre ytelsen.
* Uavbruddsstrømforsyning (UPS): En batteridrevet enhet som gir sikkerhetskopiering i tilfelle strømbrudd.
* Hot-Swappable Components: Komponenter som kan byttes ut uten å slå av systemet.
Programvareteknikker:
* Backup og gjenoppretting av data: Regelmessig å lage kopier av data som skal gjenopprettes i tilfelle tap.
* failover: Bytter til et sikkerhetskopisystem eller server automatisk i tilfelle feil.
* Feildeteksjon og korreksjon: Innebygde mekanismer for å oppdage og rette feil i dataoverføring og lagring.
* Dataspeiling: Duplisere data i sanntid på flere steder.
* Virtualisering: Kjører flere operativsystemer eller applikasjoner på en enkelt fysisk server, noe som gir enkel failover.
nivåer av feiltoleranse:
* Feilpunkt: En enkelt komponentfeil kan få ned hele systemet.
* feiltolerant: Systemet kan fortsette å fungere til tross for en komponentfeil.
* Svært tilgjengelig: Systemet er designet for å ha minimal driftsstans, selv under vedlikehold eller oppgraderinger.
eksempler på feiltoleranse:
* servere i datasentre: Datasentre bruker overflødige strømforsyninger, kjølesystemer og nettverkstilkoblinger for å sikre høy tilgjengelighet.
* Cloud Storage Services: Replikere data på flere steder for å forhindre tap på grunn av maskinvarefeil eller naturkatastrofer.
* Aircraft Control Systems: Bruk flere overflødige systemer for å sikre sikker drift selv om en enkelt komponent mislykkes.
Viktige hensyn:
* Kostnad: Feiltoleranseløsninger kan være dyre å implementere og vedlikeholde.
* kompleksitet: Å håndtere overflødige systemer kan være komplekse, og kreve spesialisert kunnskap og kompetanse.
* ytelse: Å legge til redundans kan noen ganger påvirke systemytelsen.
Konklusjon:
Feiltoleranse er avgjørende for systemer der dataintegritet og tilgjengelighet er avgjørende. Å velge riktig kombinasjon av maskinvare- og programvareløsninger avhenger av systemets spesifikke behov og ressurser.