Dopóki kwestie zasilania nie zostan? lepiej zrozumiane, BA (British Airways) nie b?dzie pojedynczym incydentem. Warto zastanowi? si? nad problemem nie istotnym, dopóki si? nie pojawi.
Wysokie temperatury
Lato, d?ugie upalne dni, ciep?e wieczory i wakacje – to wszystko przywodzi na my?l beztrosk? zabaw? na s?o?cu. Je?li jednak lato jest dla danej bran?y najbardziej intensywnym okresem w roku i systemy informatyczne o krytycznym znaczeniu ulegn? w tym okresie awarii, spowoduje to chaos dla tysi?cy klientów i uszczerbek na dobrym wizerunku firmy. Wówczas beztroska zabawa odejdzie w zapomnienie du?o szybciej, ni? blaknie opalenizna.
S? pewne wydarzenia, które nie powinny mie? miejsca – win? za które nie mo?na obarczy? pogody, nieplanowanej konserwacji czy nawet „zak?óce? zasilania” – poniewa? z?e planowanie, w takiej sytuacji, jest zawsze lepszym wyt?umaczeniem. Istnieje wiele spekulacji na temat tego, co zawiod?o w firmie British Airways. Zaskoczeniem jest równie? fakt, ?e co? w ogóle mog?o pój?? nie tak, bior?c pod uwag? z?o?ono?? i ogromn? skal? dzia?ania tych linii lotniczych oraz wielko?? ich infrastruktury centrów przetwarzania danych, szacowanej na 500 szaf serwerowych. Wielko?ci? ust?puj? one jedynie centrom przetwarzania danych w bran?y bankowej, ale tak samo jak one, bezwzgl?dnie potrzebuj? 100 proc. dost?pno?ci. Od tego zale?y bezpiecze?stwo, ochrona i jako?? obs?ugi klienta.
Zaniki zasilania nie s? odosobnionymi przypadkami
A jednak – na poziomie bran?y centrów przetwarzania danych – ten incydent jest zdecydowanie odosobniony. Badanie przeprowadzone na zlecenie firmy Eaton w?ród mened?erów IT i Data Center w ca?ej Europie wykaza?o, ?e 27 proc. respondentów do?wiadczy?o przed?u?aj?cych si? zaników zasilania, co w ci?gu ostatnich 3 miesi?cy doprowadzi?o do uci??liwych przestojów. Zdecydowana wi?kszo?? respondentów (82 proc.) zgadza si?, ?e wi?kszo?? krytycznych procesów biznesowych zale?y od IT, a 74 proc. twierdzi, ?e stan centrum przetwarzania danych bezpo?rednio wp?ywa na jako?? us?ug IT. To daje jasny obraz tego, ?e dzia?alno?? biznesowa zale?y od systemów IT, a systemy IT zale?? od funkcjonowania centrum przetwarzania danych, wi?c fakt, ?e wi?cej ni? jedno na cztery centra ucierpia?o w ostatnim czasie z powodu przed?u?aj?cego si? przestoju, ?wiadczy o nieprawid?owo?ciach w ca?ej bran?y.
Niewystarczaj?ce planowanie energetyczne
Tak jak krytyczne procesy biznesowe zale?? od us?ug informatycznych, tak samo centrum przetwarzania danych musi by? niezawodne, aby zapewni? ci?g?o?? funkcjonowania biznesu. Jest to g?ówny aspekt strategii zarz?dzania ryzykiem w biznesie.
Jedyne, co wiemy na pewno na przyk?adzie BA, to fakt, ?e kto? lub co? przerwa?o zasilanie z centrum przetwarzania danych, a tak?e ?e w wyniku panicznej reakcji, czy te? braku wiedzy, po przywróceniu zasilania nieprawid?owe dzia?ania jeszcze zwi?kszy?y skal? problemu. Powinni?my uwa?a?, aby nie przypisywa? tej pora?ki ?adnej indywidualnej technologii czy osobie. Jest to problem s?abego zrozumienia zasilania energetycznego, któremu mog?y i powinny zapobiega? w?a?ciwe procesy i projektowanie systemu elektroenergetycznego, zw?aszcza je?li b?d? one przebiega? zgodnie z prost? zasad? zarz?dzania zasilaniem centrum przetwarzania danych – dzia?ania maj? konsekwencje, a konsekwencje wymagaj? okre?lonych dzia?a?.
Przyk?ad BA ponownie pokazuje, ?e niezrozumienie kwestii zasilania jest powszechnym problemem. Dwie trzecie specjalistów w zakresie centrów przetwarzania danych w badaniach firmy Eaton nie by?o w pe?ni pewnych siebie w kwestiach zasilania. Dopóki przedsi?biorstwa nie poradz? sobie z zarz?dzaniem energi? elektryczn?, mo?emy spodziewa? si? cz?stszych i d?u?szych przerw w jej dostawach. Kwestia posiadania odpowiednich umiej?tno?ci budzi g??bokie obawy, poniewa? trudno jest zdoby? i utrzyma? odpowiedni? wiedz? fachow?, niezale?nie od tego, czy chodzi o projektowanie pod k?tem efektywno?ci energetycznej, o zarz?dzanie zu?yciem energii na bie??co, czy te? o szybkie i skuteczne radzenie sobie z awariami zwi?zanymi z zasilaniem, aby unikn?? przestojów i zminimalizowa? skutki takich usterek.
Czy próbowali?cie wy??czy? i ponownie w??czy? urz?dzenie?
W przypadku wyst?pienia ca?kowitej przerwy w zasilaniu konieczne jest uruchomienie procesu odzyskiwania danych po awarii, który jasno okre?la kroki, jakie nale?y podj?? przy powrocie zasilania w centrum przetwarzania danych, wyszczególniaj?c, które systemy musz? zosta? przywrócone jako pierwsze. W sytuacji ca?kowitej awarii, gdy ludzie s? w stanie paniki i pod presj? czasu, aby wznowi? normalne ?wiadczenie us?ug, roz?o?enie w czasie ponownego uruchomienia zasilania systemów w centrum przetwarzania danych mo?e wydawa? si? sprzeczne z intuicj?, poniewa? celem jest jak najszybszy powrót do sieci. Jednak taki proces pomaga unikn?? dalszego przed?u?enia si? przestoju. Przywrócenie centrum przetwarzania danych po awarii musi by? przeprowadzone delikatnie i z jasno okre?lon? metodyk?. Próba odtworzenia wszystkiego w szybki i nieplanowany sposób spowoduje jedynie nag?e przeci??enie systemu, które mo?e wyd?u?y? przestój, ponownie parali?uj?c centrum przetwarzania danych. Zarz?dzanie energi? polega na zrozumieniu zale?no?ci mi?dzy ró?nymi cz??ciami systemu elektroenergetycznego i obci??eniem systemu IT oraz zapewnieniu odpowiedniego poziomu niezawodno?ci sprz?tu, oprogramowania i procesów.
Przywrócenie normalnej pracy po awarii wymaga cierpliwo?ci i systematycznego procesu – dwóch kwestii, których wed?ug doniesie? o awarii w BA brakowa?o. ?aden specjalista z zakresu centrum przetwarzania danych nigdy nie zapyta? „czy próbowali?cie wy??czy? i ponownie w??czy? urz?dzenie”? Prawid?owa praktyka polega na dzia?aniu krok po kroku, kontrolowaniu i monitorowaniu stopniowego restartu, tak aby partie systemów by?y uruchamiane tylko wtedy, gdy jest to bezpieczne i jeste?my pewni w?a?ciwego rozdzia?u obci??enia pomi?dzy fazy zasilania. Pomini?cie jakichkolwiek kroków w po?piechu, aby jak najszybciej przywróci? system, mo?e spowodowa? gwa?towny wzrost napi?cia, przeci??enie obwodów, zadzia?anie wy??czników i delikatnie mówi?c, wywo?a? chaos.
Niezawodno?? i modernizacja infrastruktury
Poza umiej?tno?ciami pracowników i procesami energetycznymi, sama infrastruktura cz?sto wymaga modernizacji, tak aby sprosta? dzisiejszym oczekiwaniom w zakresie wydajno?ci, niezawodno?ci i elastyczno?ci. Oko?o po?owa respondentów ankiety przeprowadzonej przez firm? Eaton twierdzi, ?e ich podstawowa infrastruktura informatyczna wymaga wzmocnienia, a liczba ta jest bli?sza dwóm trzecim, je?li chodzi takie us?ugi jak zasilanie i ch?odzenie.
Zarz?dzanie energi? staje si? w coraz wi?kszym stopniu aktywno?ci? definiowan? przez oprogramowanie. Bior?c pod uwag? luk? w umiej?tno?ciach personelu, oprogramowanie mo?e odegra? wa?n? rol? w niwelowaniu przepa?ci mi?dzy struktur? informatyczn? a zasilaniem, przedstawiaj?c opcje zarz?dzania energi? w stylu tablic rozdzielczych, które s? znane osobom pracuj?cym w informatyce, u?atwiaj?c zrozumienie, a nawet automatyzacj? zarz?dzania infrastruktur? energetyczn?. Mog?o to zapobiec przestojom, które wyst?pi?y w przypadku British Airways, poniewa? zautomatyzowane procesy umo?liwi?yby ponowne uruchomienie systemów w sposób kontrolowany i monitorowany.
Przeszli?my w kierunku bardziej zwirtualizowanych ?rodowisk w centrach przetwarzania danych. Specjali?ci z bran?y informatycznej s? zaznajomieni z wykorzystaniem wirtualizacji w celu utrzymania sprz?tu, wi?c dlaczego nie mieliby?my stosowa? tych samych zasad w kwestiach zasilania? Wa?ne jest, aby wszystkie projekty w zakresie dystrybucji energii elektrycznej i zwi?zane z nimi narz?dzia oprogramowania by?y kompatybilne ze wszystkimi g?ównymi dostawcami rozwi?za? wirtualizacji, aby zapewni? zabezpieczenie infrastruktury na przysz?o??. Dzi?ki takiemu podej?ciu specjali?ci zajmuj?cy si? centrami przetwarzania danych b?d? mogli wykonywa? równolegle prace konserwacyjne w celu ograniczenia ryzyka zwi?zanego z utrzymaniem i modernizacj? infrastruktury.
Nauka na b??dach
Cho? prawdopodobnie nigdy w pe?ni nie zrozumiemy, co wydarzy?o si? w centrum przetwarzania danych BA, jest niemal pewne, ?e nie b?dzie to odosobniony incydent w historii bran?y, nawet je?li ma?o prawdopodobne jest, ?e b?dziemy mieli kiedykolwiek do czynienia z awari? na tak wielk? skal?. Problem sprowadza si? do niewystarczaj?cego przygotowania lub nieprawid?owego przeprowadzenia przywrócenia pracy systemu. Lepsze przygotowanie procesu odzyskiwania danych w przypadku awarii centrum przetwarzania danych oznacza?oby, ?e po pierwsze, infrastruktura DR (Disaster Recovery) powinna by?a zosta? uruchomiona w celu pokrycia zapotrzebowania podczas awarii, a po drugie, ponowne uruchomienie sprz?tu i aplikacji, powinno zosta? zrealizowane w znacznie bardziej kontrolowany sposób. Oznacza?oby to powolne i stopniowe przywracanie zasilania systemów, co pozwoli?oby na p?ynne wznowienie pracy. Jako przemys? centrów przetwarzania danych musimy upewni? si?, ?e wszyscy wyci?gniemy wnioski z przestoju w BA i podejmiemy dzia?ania w celu zapewnienia, ?e skuteczne zarz?dzanie energi? jest „konieczno?ci?”, a nie tylko „mi?ym dodatkiem”.