Cause profonde

Come descriveresti la cronologia degli eventi?

Il deployment è stato rilasciato alle 14:20 e i primi avvisi di errore si sono attivati circa otto minuti dopo.
I clienti hanno iniziato a segnalare errori di login prima che il nostro monitoraggio li rilevasse.
Abbiamo eseguito il rollback alle 15:05, ma la cache ha impiegato altri 20 minuti per essere completamente svuotata.
Cosa è andato bene?

Cosa ha funzionato e ci ha aiutato a rispondere efficacemente?

Il nostro sistema di allerta ha rilevato il picco di errori quasi immediatamente.
Il team si è collegato alla chiamata sull'incidente in pochi minuti ed è rimasto calmo.
Avere una procedura di rollback chiara ci ha fatto risparmiare molto tempo.
Cosa è andato male?

Dove le cose si sono interrotte o non sono state all'altezza?

Non avevamo un test automatizzato che coprisse questo percorso di configurazione.
Il monitoraggio non copriva la dipendenza che è effettivamente fallita.
Il percorso di escalation non era chiaro, quindi le persone giuste sono state chiamate troppo tardi.
Azioni da intraprendere

Cosa faremo per prevenire questo in futuro?

Aggiungere test automatizzati che coprano la modifica di configurazione che si è guastata.
Aggiornare il runbook e verificare i passaggi di rollback la prossima settimana.
Introdurre un blocco dei deployment del venerdì per le modifiche ad alto rischio.

Cos'è la Retrospettiva Post-Mortem

Una retrospettiva post-mortem offre ai team un modo strutturato e privo di colpe per esaminare un incidente, un progetto o un rilascio dopo la sua conclusione e per documentare esattamente cosa è successo, perché è successo e cosa dovrebbe cambiare. Invece di puntare il dito, l'attenzione è rivolta alla comprensione della cronologia degli eventi, all'emersione dei fattori che hanno contribuito e alla traduzione di queste intuizioni in azioni concrete che impediscano il ripetersi degli stessi problemi. Funziona altrettanto bene per gli incidenti e le interruzioni tecniche, le scadenze mancate o la chiusura di un'iniziativa importante. Il formato guida i partecipanti attraverso una ricostruzione condivisa degli eventi, uno sguardo onesto su ciò che è andato bene e ciò che è andato male, un'esplorazione delle cause profonde e infine un insieme di miglioramenti concordati con una chiara responsabilità. Documentando tutto in un unico posto, il team costruisce una memoria istituzionale a cui può tornare e da cui può imparare nel tempo. Condurre la sessione in TeamRetro mantiene tutti allineati in tempo reale, rende facile raggruppare le osservazioni correlate, dare priorità ai problemi più rilevanti e assegnare le azioni di follow-up prima della fine della riunione. Il vero valore di un post-mortem risiede nel suo impegno verso la sicurezza psicologica e il miglioramento continuo. Quando i team trattano i fallimenti come dati anziché come colpe, scoprono debolezze sistemiche, rafforzano i processi e rispondono più rapidamente la volta successiva. Reso popolare dalle pratiche di site reliability e gestione degli incidenti di aziende come Google, il post-mortem privo di colpe è diventato un rituale essenziale per i team ad alte prestazioni che desiderano diventare più forti ad ogni evento.

Formato della retrospettiva Post-Mortem

Cause profonde

Come descriveresti la cronologia degli eventi?

Questo argomento stabilisce un resoconto condiviso e fattuale dell'incidente o del progetto prima di iniziare qualsiasi analisi. Incoraggia il team a esporre la sequenza degli eventi in modo obiettivo, concentrandosi su cosa è accaduto e quando, piuttosto che su chi ha fatto cosa. Costruire prima questa cronologia comune evita malintesi e fornisce a tutti lo stesso punto di partenza per la conversazione più approfondita.

Cosa è andato bene?

Cosa ha funzionato e ci ha aiutato a rispondere efficacemente?

Anche durante gli incidenti difficili ci sono di solito cose che vale la pena celebrare e rafforzare. Usa questo argomento per evidenziare i comportamenti, gli strumenti e le decisioni che hanno aiutato, così che il team sappia cosa continuare a fare. Catturare gli aspetti positivi bilancia anche la conversazione e mantiene alto il morale.

Cosa è andato male?

Dove le cose si sono interrotte o non sono state all'altezza?

Questo argomento fa emergere i problemi, le lacune e i punti di attrito che hanno contribuito all'incidente o al risultato negativo. Mantieni un tono costruttivo e concentrati sui processi e sui sistemi piuttosto che sulle persone. Incoraggia l'onestà ricordando al team che l'obiettivo è imparare, non incolpare.

Azioni da intraprendere

Cosa faremo per prevenire questo in futuro?

Trasforma la discussione in miglioramenti specifici, assegnati e con scadenze definite. Assicurati che ogni azione abbia un responsabile chiaro e sia abbastanza realistica da poter essere effettivamente completata. Dai priorità ai cambiamenti che avranno il maggiore impatto nel prevenire una ricorrenza.

Quando utilizzare la retrospettiva

  • Dopo un incidente o un'interruzione in produzione, per comprendere la causa e impedire che si ripeta.
  • Alla chiusura di un progetto o rilascio importante, per catturare le lezioni apprese mentre i dettagli sono ancora freschi.
  • Quando una scadenza è stata mancata o un'iniziativa non ha raggiunto le aspettative e il team ha bisogno di una revisione onesta.
  • Ogni volta che un problema ricorrente continua a riaffiorare e vuoi arrivare alla sua vera causa profonda.
  • Per costruire una cultura di apprendimento privo di colpe e di miglioramento continuo tra i team.

Domande di rompighiaccio suggerite

  • Qual è il momento 'ops' più memorabile che hai avuto e che si è trasformato in una grande lezione?
  • Se questo incidente fosse il titolo di un film, come lo chiameresti?

Idee e suggerimenti per la riunione retrospettiva

  • Imposta un tono privo di colpe fin dall'inizio in modo che le persone si sentano sicure di condividere ciò che è realmente accaduto.
  • Costruisci una cronologia condivisa e fattuale prima di passare all'analisi per mantenere tutti allineati.
  • Usa i Cinque Perché per andare oltre i sintomi e scoprire le vere cause profonde.
  • Rendi ogni azione specifica, assegnata e con una scadenza definita affinché il follow-up avvenga davvero.
  • Invita il giusto mix di persone coinvolte, ma mantieni il gruppo abbastanza piccolo da restare concentrato.
  • Documenta il risultato e rivedi le azioni passate nelle sessioni future per confermare che le correzioni siano rimaste efficaci.

Domande frequenti

Cos'è un post-mortem privo di colpe?
Un post-mortem privo di colpe si concentra sulla comprensione dei sistemi, dei processi e delle circostanze che hanno portato a un incidente, piuttosto che sull'attribuzione di colpe agli individui. Questo approccio incoraggia l'onestà e fa emergere le vere cause profonde affinché il team possa correggerle.
Quando dovresti condurre una retrospettiva post-mortem?
Conducine una dopo un incidente significativo, un'interruzione, una scadenza mancata o il completamento di un progetto importante. È più efficace quando si tiene poco dopo l'evento, mentre i dettagli e il contesto sono ancora freschi.
Quanto dura una retrospettiva post-mortem?
La maggior parte dei post-mortem richiede dai 60 ai 90 minuti, a seconda della complessità dell'incidente. Concedi tempo extra per un'analisi approfondita delle cause profonde e per concordare azioni chiare.
In che modo un post-mortem è diverso da una retrospettiva di sprint?
Una retrospettiva di sprint esamina un periodo di lavoro definito e il processo del team, mentre un post-mortem si concentra su uno specifico incidente o evento, enfatizzando la ricostruzione della cronologia e l'analisi delle cause profonde.
Chi dovrebbe partecipare a una retrospettiva post-mortem?
Includi le persone direttamente coinvolte nell'incidente o nel progetto, insieme a eventuali stakeholder che possono fornire contesto o assumersi la responsabilità delle azioni di follow-up. Mantieni il gruppo abbastanza focalizzato affinché tutti possano partecipare in modo significativo.
Come si evita che un post-mortem si trasformi in una caccia al colpevole?
Stabilisci fin dall'inizio l'aspettativa che la sessione sia priva di colpe, concentra la conversazione sui processi e sui sistemi anziché sulle persone, e inquadra gli errori come opportunità di apprendimento. Un facilitatore neutrale può aiutare a mantenere un tono costruttivo.

E' nuovo alle retrospettive? Legga la nostra guida su come gestire una retrospettiva →