Availability Management
Tilgængelighed har bund i kundernes krav og IT-infrastrukturen tekniske formåen. 99,9% tilgængelighed er ikke altid nødvendigt (og teknisk muligt).
« Forrige side: IT Continuity Management | Næste side: Security Management »
Formål
- Optimere tilgængelighed via overvågning og rapportering.
- Fastlægge krav til tilgængelighed.
Definitioner
De mest centrale begreber indenfor Availability Management:- Tilgængelighed: Hvor længe en komponent eller Service kan tilgås målt i procent af det aftalte tidsrum.
- Availability-plan: Plan for forbedring af tilgængelighed de næste 1-3 år som også ser til aktuelle/fremtidige medarbejdere, processer og teknik.
- Overvågning: System til monitorering af servere, systemer, applikationer, SQL databaser mm., nogle systemer kan fx afgive en mail-notifikation når en grænseværdier overskrides ("CPU-forbrug er over 90% i 5 minutter") eller automatisk forsøge at rette hændelsen ("Hvis CPU-forbrug er over 90% i 5 minutter, så forsøg at genstarte servicen 3 gange.").
- Rapportering: Skriftlig rapport over oppetid for IT-services, servere, applikationer, Internet-adgang mm. baseret på Målinger. Business Intelligence-værktøjer eller blot Excel kan bruges i rapporterings-arbejdet.
- Måling: Data om tilgængelighed for en IT-service, server osv. genereret af et målesystem. Måledata samles typisk i logfiler eller databaser som danner basis for Rapportering.
Processer
Vigtige processer og aktiviteter indenfor Availability Management:- Lave Availability-plan.
- Etablere Målinger.
- Rapportere på aktuel tilgængelighed (på basis af måledata).
- Opfølgning på Tilgængeligheds-issues.
- Implementere Availability-plan
Udfordringer
- Overvåge at SLA-mål for tilgængelighed overholdes.
- Overvåge oppetid for IT-services.
- Lave relevante målinger og rapportering (og fjerne mindre relevante målinger og informationer).
KPIer
Eksempler på Key Performance Indicators for Availability Management:- Oppetid for IT-services og komponenter (min., pct. af aftalt oppetid).
- Oppetid for 3.parts systemer IT-services og komponenter (min., pct. af aftalt oppetid).
- Antal Incidents som skyldes manglende oppetid pr. IT-services og komponent.
- Incident responstid (min.)
- MTTR - Mean Time To Repair / Restore (min.)
Roller
Vigtige roller for Availability Management-processen:- Availability Manager
- SLA Manager
- IT-personale
- Kunder
Noter om Availability Management
Forretningen vil foretrække at alle services altid er tilgængelige, men i praksis er 100% tilgængelighed både for dyrt og sjældent teknisk muligt (100% tilgængelighed gør det fx vanskeligt at patche en produktionsserver). Et mere realistisk syn på tilgængelighed er at spørge:
- hvor længe en service skal være tilgængelig (kl. 8-16? kl. 8-23?),
- hvor høj oppetiden skal være (95%?, 99%?),
- skal der være vagtordning udenfor normal åbningstid?
- synliggøre prisen for lange åbningstider og høj tilgængelighed - og
- arbejde målrettet på at øge tilgængeligheden.
ITIL® is a registered trade mark of the Cabinet Office
Næste: Næste side: Security Management »
Om Kristoffer Bohmann:
Kristoffer Bohmann, M.Sc., har arbejdet med IT drift, support og implementering siden 1997. mere...
« Forrige side: IT Continuity Management | Næste side: Security Management »
