Business Continuity: che cosa è e che cosa non è
La business continuity significa continuare a lavorare nonostante il verificarsi di un disastro, quindi la chiave di tutto, come dice la parola stessa continuity, è continuare a fare le cose che stavi facendo o comunque subire un’interruzione il più limitata possibile nel tempo.
Stiamo parlando di qualche cosa che non è andato a buon fine, qualche cosa che si è rotto e che può essere in generale un computer che non va più, un server, un sito web. Ci sono diversi tipi di interruzione del business a cui si deve riparare.
Tutti questi elementi possono essere afflitti da una qualche forma di disastro che può andare dai disastri più cinematografici come inondazioni, terremoti, tornado, ecc. a cose molto più terra terra, come il firmware di una SAN o un virus o un utente che cancella dei file dolosamente o colposamente.
Normalmente quando si parla di disastro tutti siamo portati a pensare alle trombe d’aria o alluvioni, ma in realtà per un’azienda avere un disastro informatico è molto semplice. Basti pensare alla diffusione che ha avuto CryptoLocker in questi ultimi due anni. Sentiamo quasi quotidianamente aziende che hanno subito un danno importante dovuto al fatto che CryptoLocker ha cifrato una parte consistente dei dati, per cui parte del business aziendale è perso e in qualche modo va recuperato.
Oppure facciamo l’esempio di un dipendente o un collaboratore che maldestramente, o perché non formato, cancella 20 ordini oppure, a causa dell’interruzione del contratto di lavoro, vuole arrecare un danno all’azienda cancellando dei dati o delle applicazioni che per l’azienda sono importanti. Tutto questo è un disastro in termini di business dell’azienda.
La business continuity si prefigge l’obiettivo di aiutare l’azienda che dovesse incappare in disastri e aiutare che l’impatto sul business sia il meno oneroso possibile, commisurato naturalmente ai costi che il disastro comporta all’azienda.
A fronte di un danno bisogna capire quanto è accettabile un disastro. Ovvero è necessario mettere in piedi un piano di business continuity valutando quali sono i costi di inattività per l’azienda. Un’azienda può magari permettersi di stare ferma, 5, 10, 30 minuti e magari 4 ore sono già troppe. Alcune aziende non possono permettersi di stare ferme nemmeno per 2 secondi!
Due acronimi ricorrono spesso quando si parla di business continuity: RPO e RTO. Di che cosa si tratta e come sono correlati alla business continuity?
RPO è l’acronimo di Recovery Point Objective ed è l’intervallo di tempo che passa tra il verificarsi di un disastro e a quando risale l’ultimo salvataggio utilizzabile. Supponiamo che tu faccia il salvataggio a mezzanotte, se il disastro si verifica alle 10 di mattina, il valore dell’RPO in questo caso è il tempo che intercorre tra la mezzanotte e le 10 di mattina.
L’RTO, o Recovery Time Objective, invece, indica il tempo necessario a far ripartire il sistema dopo un incidente. RTO e RPO sono entrambi parametri vitali per misurare quanto costa un disastro o la bontà di un sistema di business continuity. Minori sono questi due valori e minore è il fermo che il business subisce sia in termini di tempo che ci mette a ripartire sia in termini di quanti dati sono stati persi dopo il disastro.
RPO e di RTO ricorrono spesso anche quando si parla di backup. Qual è quindi la differenza tra la business continuity e il backup?
Il backup si occupa di salvare i dati, mentre la business continuity si preoccupa di salvare il tempo, di salvare il downtime.
Fare il backup è assolutamente necessario, ma una volta che i dati sono salvati, in caso di disastro, per poter riutilizzare questi dati sarà necessario rimettere in piedi uno o più server, rimettere in piedi il sistema operativo, le applicazioni e solo alla fine si potranno caricare i dati.
Tutto questo richiede del tempo e se l’azienda in questo tempo non può lavorare, questo arco di tempo si chiama downtime, ossia il tempo di fermo.
La business continuity invece protegge da questo downtime perché gli strumenti di business continuity, hardware e software, tendono a minimizzare il tempo che si impiega a tornare operativi con tutti i dati. Il backup è una parte dell’intera business continuity che sarà un insieme di processi più complessi e articolati che riguarderanno i dati, ma riguarderanno anche il far ripartire in fretta il server, e l’avere il sistema già pronto con il sistema operativo. La business continuity si occupa di quindi di tenere stretti i tempi di ripartenza, mentre il backup si occupa solo di salvare i dati e non si preoccupa di quanto ci metteremo a ripartire.
E il backup offsite?
È importante ricordare che il backup si deve accompagnare sempre al restore, le soluzioni tradizionali di backup si occupano di questi due aspetti, appunto salvataggio dei dati e recupero dei dati ma non di tutto il processo che ci sta intorno.
In questo senso, il backup offsite è semplicemente un altro tipo di backup e non stiamo parlando di business continuity, ma aggiunge un gradino in più alla sicurezza del semplice backup. Parlando di imprese o studi professionali, normalmente i backup vengono fatti in rete. Se il backup viene fatto anche offsite si aumenta la sicurezza dei dati, perché nel caso in cui nella prima location vengano persi, distrutti o rubati, c’è comunque un secondo luogo dove si trovano i dati. Questo però non accorcia i tempi nei quali si può ripartire in caso di disastro.
C’è differenza tra business continuity e disaster recovery?
La business continuity è un obiettivo, cioè fare in modo che a fronte di un disastro l’azienda riesca a lavorare lo stesso. Ci sono vari processi, vari elementi che concorrono a rendere possibile questo obiettivo, e il disaster recovery è uno di questi, ossia a fronte dell’avvenuto disastro mettere in piedi le procedure per ripristinare i sistemi come erano prima del disastro.
Possiamo quasi dire che per raggiungere la perfezione della business continuity dovremmo avere un sistema di disaster recovery istantaneo, cioè che una volta che è successo il disastro, in meno di uno schiocco di dita fa tornare tutto come era senza che il disastro abbia avuto alcun impatto.
Raggiungere le vere business continuity o i veri disaster recovery in tempo zero sono operazioni che rasentano quasi l’impossibile, anche le strutture più sofisticate come le banche non hanno veramente zero disservizi a fronte di un down. Hanno pochi secondi, che è altamente desiderabile, ma il processo di disaster recovery deve esistere, perché qualcuno o qualcosa si deve accorgere che il disastro è esistito e quindi porre rimedio al disastro eventualmente nel giro di pochi attimi.
Quanto deve essere l’investimento da fare in rapporto alla necessità di accorciamento di RPO e RTO.
Gli investimenti per avere un tempo di recovery di qualche secondo sono ingenti, o comunque più ingenti rispetto ad altre soluzioni che hanno invece un tempo di indisponibilità dei sistemi più lungo.
C’è quindi un compromesso da fare tra il costo di stare fermi e le soluzioni, le contromisure per non stare fermi, o per stare fermi un certo quantitativo di tempo.
Come regola molto empirica, però assolutamente efficace, è quanto minori sono i tempi di RPO e RTO, tanti più soldi devi spendere. Quanto più si dilatano questi tempi, tanto meno è necessario investire.
La business continuity non è solo un prodotto, è un processo o un insieme di processi, un approccio che si appoggia a un prodotto.
La business continuity per qualunque azienda si appoggia a un prodotto perché il business di tutti poggia su sistemi informativi, e quindi in caso di disastro ci vuole un prodotto che ci faccia ripartire.
Però la business continuity parte da molto più lontano: è un insieme di processi, di analisi, di valutazioni che ogni azienda dovrebbe mettere in atto per capire quali sono prima i suoi rischi, poi quali sono i costi, nel caso in cui si verifichi uno dei rischi valutati, ed eventualmente quali sono gli investimenti che può fare per mitigare i rischi e quindi i costi.
La prima cosa da fare è valutare i rischi oggettivi, facciamo un esempio molto banale: esiste veramente il rischio di alluvioni per la mia azienda?
Oppure ancora, nell’azienda dove lavoro, per com’è strutturata l’azienda, per i locali, c’è possibilità di furti?
Dopo la prima valutazione ci sono altri elementi da prendere in considerazione e che potremmo chiamare variabili, che sono la quantità di cose che sono veramente critiche.
Continuando con l’esempio, magari ho 10 server ma solo 2 contengono i dati dei miei clienti. Se perdessi gli altri 8 server, subirei sicuramente un danno ma un danno dal quale posso ripartire senza problemi.
E poi, alla fine di tutte le valutazioni, quando si decide che è necessario uno strumento per ripartire velocemente, si dovrà scegliere un prodotto.
Quanto è importante la definizione di un piano invece di disater recovery?
È assolutamente fondamentale la presenza di un piano dettagliato per un motivo molto semplice: quando c’è un malfunzionamento si va tutti panico e c’è il rischio di agire in modo scoordinato e seguendo il proprio istinto personale. È proprio quello però il momento in cui è necessario avere un piano riflettuto a freddo, in cui sono elencati i passi necessari per ripartire e rispondere a un disastro. Se invece non c’è questo piano, il rischio è iniziare a fare cose non necessarie o di non fare quelle necessarie. Purtroppo sono tante le realtà che non hanno previsto un piano, che invece è necessario avere perché nonostante i sistemi informativi che tutti noi oggi utilizziamo sono facili da usare, in realtà nascondono delle complessità per cui gli elementi da tenere in considerazione sono veramente tanti.
Quale settore dovrebbe cogliere l’opportunità di un piano di business continuity?
Sicuramente gli studi professionali, come uffici paghe, commercialisti, che in determinati periodi dell’anno vanno sotto pressione e se si rompe un disco in quel momento ecco che il fornitore IT viene messo sotto pressione perché non è tollerabile avere un fermo.
Anche uno studio di 10, o 5 professionisti, in un determinato periodo dell’anno non può permettersi un fermo nemmeno di qualche ora.
Anche le aziende più grandi e strutturate, dai 20 dipendenti in su, dove indipendentemente dalla ragione sociale e dall’attività svolta il costo di stare fermi è il costo del personale, cioè avere 20 dipendenti che sono fermi, che non possono lavorare, qualunque sia il loro lavoro, inizia ad essere improponibile per un’azienda di oggi.
È quindi fondamentale che tutte le aziende si pongano il problema, poi magari arrivando alla conclusione che il costo del down è così basso che non è necessario dotarsi di una soluzione di business continuity e disaster recovery… ma la riflessione è necessaria.