Byłem jednym z setek tysięcy pasażerów, którzy niedawno doświadczyli awarii systemu komputerowego należącego do linii lotniczych Delta Air Lines. Sytuacja wydarzyła się 8 sierpnia, a ja tego dnia miałem zaplanowane dwa loty tą linią. Tak naprawdę miałem szczęście: firma nie anulowała obu moich lotów, nie przegapiłem lotu łączącego i czekałem krócej niż wielu innych pasażerów — tylko jakieś pięć godzin.
Ostatecznie wszystko zakończyło się szczęśliwie, a te pięć godzin uznałem za całkiem interesujące przeżycie.
Co się stało?
Firma Delta Air Lines, jeden z największych przewoźników lotniczych na świecie, posiada flotę ponad 800 samolotów, które wykonują około 6 000 lotów dziennie i przewożą ponad 100 milionów ludzi rocznie. Firma posiada 13 portów lotniczych, a jeden z nich znajduje się w Atlancie i jest największym lotniskiem na świecie. Jej porty obsługuje bardzo rozbudowany system.
8 sierpnia o 2:30 w nocy czasu wschodniego serwery systemu komputerowego centrum danych Delta Air Lines w Atlancie zostały odcięte od zasilania. Padły także systemy awaryjne (lub były przeciążone), w wyniku czego przestała działać cała sieć komputerowa.
Według Johna Krafta, rzecznika firmy Georgia Power (która jest odpowiedzialna za dostawę zasilania do centrum danych), winę za zaistniałą sytuację ponosi rozdzielnica. Działa ona na takiej zasadzie, jak wyłączniki w domu — pomaga kontrolować i przełączać przepływ energii.
Linie lotnicze #DeltaAir wznawiają loty po awarii https://t.co/4EDs3eDxha
— Gospodarka – Polskie Radio (@Gospodarka_PRSA) August 8, 2016
Analityk branżowy i były kierownik linii, Robert Mann, powiedział w wywiadzie dla Reutersa, że „firma prawdopodobnie uruchomiła rutynowy test swoich zapasowych zasilaczy, gdy rozdzielnica uległa awarii i odcięła Deltę od jej generatorów zapasowych”.
W wyniku tego 8 sierpnia zostało anulowanych około 1 000 lotów, a także wiele w dniach kolejnych, gdy Delta starała się przywrócić normalną pracę. Zdecydowana większość innych lotów uległa opóźnieniom.
Pomijając wpływ sytuacji na pasażerów, incydent ten dotknął dziesiątki innych lotnisk i zwiększył nakład pracy funkcjonariuszy odpowiedzialnych za sterowanie lotami na całym świecie.
Ucierpiał także starannie zaaranżowany system połączeń lotniczych pomiędzy Delta Air Lines a jej partnerami. Wielu pasażerów było zmuszonych pozostać na noc w miastach, w których planowali jedynie krótki postój.
Takim osobom Delta zaoferowała możliwość dobrowolnego zrezygnowania z planowanego lotu i pozostanie w mieście odlotu przez jeden dzień na koszt firmy. Wiele osób się zgodziło. Delta obiecała także podarować 200 dolarów w postaci lotniczych kart podarunkowych wszystkim klientom, dla których loty zostały anulowane lub opóźnione o więcej niż trzy godziny.
Jak spędziłem ten dzień
Najgorszą częścią dnia było popołudnie. Był to szczyt awarii, anulowania lotów i opóźnień. Spędziłem ten czas na lotnisku międzynarodowym w Los Angeles — piątym spośród lotnisk na świecie, które obsługują najwięcej pasażerów (ok. 70 milionów pasażerów rocznie). Nie jest to spokojne miejsce nawet wtedy, gdy wszystko przebiega sprawnie.
W różnych miejscach działo się wiele dziwnych rzeczy. Mój lot do Seattle zniknął z tablicy przylotów i odlotów. Aplikacja mobilna firmy Delta umożliwiała uzyskanie informacji tylko o tym, kiedy i gdzie rozpoczęło się wpuszczanie pasażerów na pokład.
Bramki, które były wyznaczone dla każdego lotu, zmieniały się co pięć minut. Przyszło mi do głowy, że ludzie odpowiedzialni za wyznaczanie tych bramek muszą żonglować setkami lotów, mając do dyspozycji kilkadziesiąt bramek — coś na kształt gigantycznej gry w Tetris o najwyższym poziomie trudności.
Po półgodzinnym biegu przez terminal dostałem się wreszcie do bramki, która była przeznaczona dla mojego lotu. Wyznaczanie to działo się na zasadzie rozmów: pracownicy lotniska nieustannie się ze sobą kontaktowali przy użyciu starych, dobrych telefonów.
Minęły kolejne dwie godziny, zanim wsiadłem do samolotu, a później następne dwie, zanim wystartowaliśmy.
W trakcie tego pięciogodzinnego opóźnienia nie dało się nie zauważyć profesjonalnego zachowania pracowników linii lotniczej. Robili, co mogli, aby złagodzić skutki awarii. Z ogromną dozą cierpliwości wyjaśniali pasażerom, co się stało, i przepraszali za niedogodności — zawsze grzeczni, przyjacielsko nastawieni i spokojni. Żaden z nich nie zachował się niegrzecznie i nikt nie ignorował pytań, mimo że mieli mnóstwo innych rzeczy do zrobienia.
Wnioski
Gdy zawodzi system komputerowy, musimy przestawić się na stare sposoby, które nie tylko bywają mało skuteczne, ale także są dalekie od przydatności w dzisiejszych czasach — w końcu nie były zaprojektowane do tego, aby radzić sobie z nowoczesnymi sprawami. To, co możemy zrobić w takim przypadku, to mieć nadzieję, że systemy elektroniczne zaczną działać tak szybko, jak tylko będzie to możliwe.
Co zatem można zrobić? Czy powinniśmy przestać używać systemów elektronicznych, ponieważ od czasu do czasu zawodzą? Oczywiście, że nie. Bez nowoczesnych technologii żadna firma nie będzie konkurencyjna. Auta osobowe oraz ciężarowe także są niebezpieczne, ale nikt nie sugeruje, aby zamienić je na konie.
Konieczne jest skupienie swojej uwagi na kwestiach bezpieczeństwa i niezawodności. Elektronika, na której polegamy, aby zarządzać działaniem infrastruktury krytycznej, powinna być właściwie chroniona przed incydentami i atakami. Ten jeden przykład pokazuje, jak jeden błąd w systemie komputera przemysłowego może wpłynąć na życie setek tysięcy ludzi — że nie wspomnę o stratach finansowych.