Come ho affrontato il blackout elettrico della Delta Air Lines

L’esperienza privata di un redattore di Kaspersky Lab con il guasto al sistema informatico della Delta Air Lines.

Delta

Io ero uno dei centinaia di migliaia di passeggeri colpiti dal recente guasto del sistema informatico della Delta Air Lines. È successo l’8 agosto, quando avevo in programma due voli con Delta. Infatti sono stato fortunato: la compagnia non ha cancellato nessuno dei miei due voli, non ho perso la coincidenza e ho aspettato complessivamente meno tempo rispetto agli altri passeggeri (solo cinque ore).

Alla fine tutto è andato bene, anche se quelle cinque ore d’attesa sono state un’esperienza interessante.

Cosa è successo?

Delta Air Lines, una delle maggiori compagnie aeree del mondo, opera con una flotta di più di 800 aeromobili che effettuano circa 6.000 voli al giorno e che trasportano più di 100 milioni di persone all’anno. La compagnia possiede 13 centri aeroportuali e uno di questi si trova ad Atlanta, l’aeroporto più grande del mondo. Delta possiede, quindi, un sistema di centri aeroportuali enorme.

L’8 agosto, alle 2:30 del mattino, ora locale (8:30 in Italia) i server del sistema informatico del data center della Delta Air Lines ad Atlanta si sono spenti dopo un blackout elettrico. I sistemi duplicati non sono riusciti ad apparire online ed erano sovraccarichi, di conseguenza l’intero sistema informatico ha smesso di funzionare.

 

Secondo John Kraft, il portavoce della Georgia Power (l’azienda che fornisce elettricità al data center), a provocare il blackout sarebbe stato un commutatore. Un commutatore funziona proprio come il salvavita di una casa (aiuta a controllare e a interrompere i flussi di corrente).

Robert Mann, analista di settore ed ex dirigente della compagnia aerea, ha dichiarato a Reuters che “la compagnia stava probabilmente effettuando un test di routine sull’alimentatore di riserva quando il commutatore ha smesso di funzionare e non ha permesso alla Delta di utilizzare i generatori di riserva.”

Di conseguenza, l’8 agosto sono stati cancellati circa 1000 voli e ne sono stati cancellati ancora di più nei giorni successivi, dal momento che Delta non è riuscita a risolvere il problema. La maggior parte del resto dei voli ha subito ritardi.

Tralasciando gli effetti che si sono ripercossi sui passeggeri, l’incidente ha interessato dozzine di aeroporti e ha incrementato il carico di lavoro degli addetti alle operazioni di volo in tutto il mondo.

Sicuramente anche il sistema di coincidenza dei voli tra Delta Air Lines e i suoi partner ha subito dei danni. Molti passeggeri hanno dovuto trascorrere la notte in città in cui pensavano di dover fare solo una breve sosta.

La compagnia aerea Delta ha offerto a questi passeggeri l’opzione di rinunciare volontariamente al proprio volo già organizzato e rimanere un giorno nella città di partenza a spese della compagnia. Molti hanno accettato. Delta ha promesso anche un rimborso di 200 dollari sotto forma di voucher a tutti i clienti i cui voli erano stati cancellati o avevano subito un ritardo di più di tre ore.

 

Come ho trascorso quella giornata

Il pomeriggio dell’8 agosto è stata la parte peggiore della giornata. È stato l’apice dei problemi, cancellazioni di voli e ritardi. Ho trascorso il pomeriggio all’Aeroporto Internazionale di Los Angeles, il quinto aeroporto al mondo con il maggior traffico passeggeri (circa 70 milioni di passeggeri all’anno). Non è un posto tranquillo nemmeno quando tutto va bene.

Sono successe cose strane. Il mio volo per Seattle era scomparso dalla schermata degli arrivi e delle partenze. L’unico modo per sapere quando e dove iniziava l’imbarco era utilizzando l’app mobile della Delta.

Ad ogni modo, il gate assegnato cambiava ogni cinque minuti. Credo che le persone responsabili di assegnare il gate abbiano dovuto ridistribuire centinaia di voli in dozzine di gate (come un gran Tetris al massimo livello di difficoltà).

Dopo aver corso mezz’ora per il terminal, sono arrivato finalmente al vero gate assegnato per il mio volo. L’assegnazione del gate è stata solo verbale: gli impiegati della compagnia aerea erano in costante contatto tra loro tramite i vecchi ma buoni telefoni.

Sono passate altre due ore prima di salire sull’aereo, e poi altre due ore prima che l’aereo decollasse.

In queste cinque ore di ritardo, ho apprezzato la professionalità degli impiegati della compagnia aerea. Hanno fatto del loro meglio per mitigare le conseguenze del blackout elettrico. Hanno spiegato con tanta pazienza cosa stesse succedendo e si sono scusati per l’inconveniente (sempre in maniera educata, cordiale e tranquilla). Nessun impiegato è stato sgarbato o ha ignorato le domande poste, anche se avevano molto altro lavoro da fare.

 

Conclusioni

Quando un sistema informatico smette di funzionare, dobbiamo cambiare i vecchi metodi che sembrano inefficienti e inutilizzabili al giorno d’oggi (non erano progettati per affrontare i carichi attuali). Tutto quello che si può fare in quel caso è sperare che il sistema elettronico sia nuovamente online il prima possibile.

 

Quindi cosa si può fare? Dovremmo abbandonare i sistemi elettronici se a volte si rilevano essere inaffidabili? Certo che no. Nessuna compagnia priva delle moderne tecnologie può essere competitiva. Le automobili e i camion sono pericolosi ma nessuno consiglia di trasportare beni e persone a cavallo.

Quello di cui abbiamo bisogno è prestare la massima attenzione alla sicurezza e all’affidabilità. I sistemi elettronici a cui ci affidiamo per gestire il lavoro delle infrastrutture critiche dovrebbero essere protetti adeguatamente dagli incidenti e dagli attacchi. L’esempio della Delta è importante per ricordarci l’impatto enorme che un guasto al sistema informatico industriale può avere sulle vite di centinaia di migliaia di persone (senza parlare delle perdite economiche).

Consigli