Salta al contenuto

Disaster Recovery

Disaster Recovery (DR) è la capacità di un'azienda di ripristinare i propri sistemi IT critici in caso di disastro: incendio o alluvione del datacenter, attacco ransomware massivo, errore umano grave (cancellazione di server in produzione), guasti hardware estesi. È diverso dal backup standard: backup protegge dati, DR protegge il SERVIZIO (capacità di continuare a operare).

La metrica fondamentale è il **RTO** (Recovery Time Objective): quanto tempo posso tollerare che il servizio sia down. Per gestionali aziendali RTO può essere 4-8 ore (un giorno di disservizio), per e-commerce o customer service tempo reale RTO è minuti. Il **RPO** (Recovery Point Objective) è quanti dati posso permettermi di perdere: per scritture contabili RPO può essere 24h (backup notturno), per transazioni e-commerce RPO deve essere zero (replica sincrona).

In SynSphere progettiamo strategie DR appropriate al criticità del workload: per scenari standard PMI usiamo Azure Site Recovery (replica VM/server da on-premise verso Azure region remota, con failover veloce), per scenari mission-critical replica multi-region Azure (West Europe → North Europe), per backup-based DR usiamo Veeam con cloud destinations (RTO maggiore ma costo inferiore). Includiamo sempre **test DR periodici** (annuali minimo): un piano DR mai testato non è un piano DR. Documentation runbook completa per consentire al cliente di eseguire failover anche senza SynSphere (in scenari estremi).

A chi è rivolto

Profili e dimensioni aziendali per cui Disaster Recovery è la scelta più efficace.

  • PMI con sistemi mission-critical (gestionali, e-commerce, customer service) che non possono permettersi downtime prolungato
  • Aziende con compliance requirements per DR (NIS2, ISO 22301 business continuity, settori regolati)
  • Realtà che hanno avuto incidenti passati (incendio sede, allagamento, ransomware) e vogliono evitare ricaduta
  • Organizzazioni con datacenter on-premise unico (single point of failure) che vogliono replicare su cloud per resilienza
  • Aziende mid-market in fase di adozione cloud che vogliono iniziare con DR (caso d'uso a basso rischio per testare cloud journey)

Funzionalità chiave

Cosa è incluso in Disaster Recovery e perché ha valore per la tua azienda.

  • Azure Site Recovery (ASR)

    Replica VM da on-premise (Hyper-V, VMware) o da Azure region a Azure region remota. RPO < 5 minuti, RTO < 1 ora con setup appropriato.

  • Replica multi-region Azure

    Per workload Azure-native: deploy multi-region con Azure Front Door per geo-routing automatico, failover trasparente in caso di disastro region-wide.

  • Veeam Replication

    Replica VM Veeam tra siti on-premise o verso cloud destination. Backup-based DR con RTO maggiore (1-8 ore) ma costo inferiore.

  • RPO configurabile

    Recovery Point Objective scelto in base a criticità: 5 minuti (replica continua), 1 ora (replica frequente), 24h (backup giornaliero).

  • RTO documentato

    Recovery Time Objective garantito da contratto: minuti (instant recovery), 1 ora (ASR standard), 4-8 ore (backup-based DR).

  • Test DR periodici

    Test failover documentati semestrali/annuali: simulazione realistica di disastro, validation che i sistemi tornano operativi entro RTO concordato.

  • Runbook DR documentato

    Documentazione passo-passo per eseguire failover (anche senza SynSphere disponibile in caso estremo): istruzioni tecniche dettagliate, contatti emergenze, sequenza azioni.

  • Ridondanza geografica

    Failover su region geograficamente distante (West Europe Olanda → North Europe Irlanda): resilienza anche a disastri region-wide.

  • Failover orchestration

    Recovery plan in ASR per failover di multiple VM in sequenza specifica (es. database prima, poi app server, poi web frontend), con script personalizzabili.

Casi d'uso reali

Scenari concreti basati su clienti che abbiamo seguito o profili tipici per cui Disaster Recovery ha senso.

  • PMI manifattura — DR per gestionale ERP — Vicenza

    Situazione di partenza

    ERP Business Central su 2 VM Hyper-V on-premise (1 web/app + 1 SQL Server). Datacenter unico in capannone produzione. Incendio o allagamento = blocco produzione totale, costi imprevedibili.

    Azure Site Recovery: replica continua delle 2 VM Hyper-V verso Azure West Europe. RPO < 5 minuti. In caso di disastro on-premise: failover ad Azure in ~30-60 minuti, dipendenti accedono al gestionale via web/RDP da remoto. RTO 1 ora effettivo. Test DR semestrali documentati per audit ISO. Costo: indicativamente 200-500€/mese per replica + storage Azure (vs decine di migliaia per secondo datacenter fisico).

  • E-commerce — DR multi-region — Milano

    Situazione di partenza

    E-commerce su Azure (App Service + Azure SQL). Architettura attuale single-region (West Europe). Picco vendite Black Friday: rischio outage region-wide Azure costerebbe centinaia di migliaia di euro mancati ricavi.

    Architettura multi-region: deploy in West Europe (primary) e North Europe (secondary). Azure Front Door per geo-routing globale e health check. Azure SQL geo-replication. Storage Azure GRS. In caso di disastro West Europe: Front Door routea automaticamente traffico a North Europe (RTO < 5 minuti). Cliente non si accorge del disastro region-wide.

  • Studio professionale — DR backup-based — Roma

    Situazione di partenza

    Studio commercialista 30 utenti, 1 server fisico con SQL Server gestionale. Budget DR limitato, ma vogliono almeno protezione contro incendio sede.

    DR backup-based con Veeam: backup giornaliero notturno verso Azure Blob (Cool tier per costi ridotti). In caso di disastro: nuovo server temporaneo o VM Azure provvisionata, restore da backup Azure. RTO 8-12 ore (vs minuti dell'ASR), ma costo molto contenuto (~50-100€/mese per backup secondary cloud). Trade-off accettabile per budget limitato. Test restore semestrale.

  • Mid-market 200 utenti — DR completo enterprise — Milano

    Situazione di partenza

    Mid-market in settore finanziario, 200 utenti, 25 server (mix Hyper-V + fisici). Compliance richiede DR test annuale documentato. Budget appropriato.

    DR enterprise multi-livello: 1) Azure Site Recovery per i 10 server mission-critical (RTO < 1 ora). 2) Veeam backup + replication per i 15 server tier-2 (RTO 4-8 ore). 3) Test DR annuale documentato con coinvolgimento auditor esterno. 4) Runbook completo per failover senza dipendenza da SynSphere. 5) Disaster Recovery Plan documentato con scenari multipli (ransomware, incendio, errore umano, region outage). Compliance ISO 22301 raggiunta.

Si integra con

Disaster Recovery è parte di un ecosistema. Ecco i prodotti con cui lavora nativamente.

Modelli di acquisto e gestione

Come SynSphere progetta e gestisce strategie disaster recovery enterprise.

Disaster Recovery è un servizio consulenziale + costi infrastruttura cloud + licensing tool DR.

Componenti di costo:

1. Servizio SynSphere (a progetto + retainer):

  • Setup iniziale: assessment, design, deploy ASR/Veeam, test DR iniziali, documentazione runbook. Costo nell'ordine di 10-50k€ in base a complessità.
  • Retainer mensile: monitoring DR, gestione replica, test DR semestrali/annuali, aggiornamenti runbook. Costo nell'ordine di 500-3.000€/mese.

2. Infrastruttura cloud (Azure):

  • Azure Site Recovery: licenza per VM protetta. ~€20-25/VM/mese.
  • Azure VM target: pricing standard Azure VM ma in modalità 'cold' (non running fino al failover). Storage e replica costano ~€10-20/VM/mese in pre-failover.
  • Storage GRS per backup secondary: ~€20/TB/mese.
  • Bandwidth in uscita per replica iniziale (1 volta) e replica continua (modesta).

3. Licensing software DR:

  • Azure Site Recovery: incluso in alcune edizioni Azure, altrimenti pricing per VM protetta.
  • Veeam Replication: incluso in licensing Veeam Backup & Replication (vedi pagina Veeam Cloud).

Esempio scenario PMI:

  • 5 VM critical replicate via ASR a Azure West Europe.
  • ASR licensing: ~€100/mese.
  • VM target cold: ~€50-100/mese.
  • Storage replica: ~€50-100/mese.
  • Bandwidth: trascurabile.
  • Setup SynSphere: ~10-20k€ (assessment, deploy, test, documentazione).
  • Retainer SynSphere: ~500-1.000€/mese (monitoring + test annuale).
  • Totale operativo: ~700-1.300€/mese (vs decine di migliaia per secondo datacenter fisico).

Cosa è incluso nel servizio SynSphere:

  • Assessment: analisi workload, definizione RTO/RPO target per ogni applicazione, identificazione SPOF (single points of failure).
  • Design: scelta strategia DR appropriata per criticità (ASR per mission-critical, Veeam per tier-2, backup-based per dev/test).
  • Deploy: setup ASR/Veeam, configurazione replica, test failover iniziale.
  • Documentazione: runbook DR completo (passo-passo per failover), Disaster Recovery Plan documentato.
  • Test DR periodici: semestrali/annuali, documentati per audit.
  • Monitoring: alerting su anomalie replica, capacity planning, gestione patches.
  • Update plan: revisione DR plan ad ogni cambio significativo (nuovo workload, nuovo gestionale, ridimensionamenti).

RTO/RPO tipici:

Soluzione RTO RPO Costo relativo
Backup-only (no DR) Giorni-settimane 24 ore Basso
Backup + cloud destination 8-24 ore 24 ore Basso-Medio
Veeam Replication 1-4 ore 15 min - 1 ora Medio
Azure Site Recovery 30-60 min 5 minuti Medio-Alto
Multi-region active-passive 5-15 min 1-5 minuti Alto
Multi-region active-active < 1 min < 1 min Molto Alto

SynSphere consiglia il livello appropriato per ogni workload, no overspend (active-active per applicazioni non critical) né underspend (backup-only per gestionale ERP).

Domande frequenti

Risposte rapide alle domande che ci fanno più spesso su Disaster Recovery.

Differenza tra backup e disaster recovery?
Backup = preservazione dati per recovery di file singoli, recovery a punto nel tempo, archive long-term. RTO tipico: ore-giorni. Disaster Recovery = ripristino del SERVIZIO completo dopo disastro, con sistemi che tornano operativi rapidamente. RTO tipico: minuti-ore. Esempio: backup ti permette di recuperare un file cancellato 6 mesi fa. DR ti permette di tornare operativo in 1 ora dopo che il datacenter ha preso fuoco. Servono entrambi, complementari.
Cosa è RTO e RPO?
RTO (Recovery Time Objective): tempo massimo accettabile per ripristinare il servizio. Esempio RTO 1 ora = entro 1 ora dal disastro il sistema è di nuovo operativo. RPO (Recovery Point Objective): quanti dati posso perdere. Esempio RPO 5 minuti = al massimo perdo 5 minuti di transazioni dal momento del disastro. RTO e RPO sono scelti in base a criticità del workload: gestionale fatturazione magari RTO 4 ore RPO 1 ora (perdi al massimo 1 ora di fatture, ripristini in 4 ore). E-commerce RTO 5 minuti RPO 0.
Perché Azure Site Recovery vs secondo datacenter fisico?
Costo. Secondo datacenter fisico richiede: hardware ridondante (server identici al primario), colocation o spazio dedicato, networking, manutenzione, refresh ogni 5 anni. Costo TCO 5 anni tipico mid-market: 200k-1M€. Azure Site Recovery: pay per use, costi mensili nell'ordine di centinaia/migliaia di euro per la stessa protezione. ASR scala automaticamente, no più gestione hardware fisico secondario. Per PMI italiane: ASR è quasi sempre la scelta corretta vs investimento in secondo DC.
Test DR: con che frequenza?
Minimo annuale (best practice ISO 22301), raccomandato semestrale per scenari mission-critical. Test deve essere realistico: failover effettivo (non solo simulazione su carta) con misurazione RTO reale. SynSphere include test DR semestrali nel servizio managed, con documentazione formale per audit (ISO 22301, NIS2, ecc.). Senza test reali, il piano DR è un documento mai validato che probabilmente non funzionerà al momento del bisogno.
In caso di disastro, cosa succede esattamente?
Procedura tipica con ASR: 1) Detection del disastro (manuale via Azure Portal o automatico via monitoring). 2) Lancio failover dal Recovery Plan (orchestrato Azure: VM target boot in sequenza pre-definita). 3) Aggiornamento DNS o load balancer per puntare a VM target. 4) Validation servizi up & running. 5) Comunicazione utenti dell'avvenuto failover. Total time: 30-60 minuti tipici. SynSphere supporta on-call durante failover reali. Post-disastro: failback a primary quando primary è ripristinato.
Backup immutable vs DR: serve davvero entrambi?
Sì, complementari. Backup immutable = recovery di dati specifici a punti nel tempo (ottimale per ransomware: ripristino allo stato pre-cifratura). DR = ripristino veloce del servizio in scenario di disastro fisico (incendio datacenter). In scenario ransomware: DR di per sé non aiuta (il datacenter primary è 'a posto', il problema sono i dati cifrati). Backup immutable + restore = strategia anti-ransomware. In scenario incendio datacenter: backup immutable di per sé non basta (devi reinstallare tutto, RTO settimane). DR + replica = ripristino veloce. Combinati: protezione completa.
Quanto tempo per implementare DR?
Per scenario standard PMI (5-15 VM critical, ASR verso Azure): 4-8 settimane. Assessment 1 settimana, design 1-2 settimane, deploy ASR + replica iniziale 2-4 settimane (la replica iniziale può richiedere giorni in base a volumi e bandwidth), test DR + documentazione 1-2 settimane. Per scenari mid-market o multi-region active-active: 3-6 mesi. SynSphere fa il piano tempistiche dettagliato dopo assessment iniziale.

Altri prodotti in Backup & Disaster Recovery

Continua a esplorare le tecnologie della categoria.