Gestione dei problemi
Identifica ed elimina le cause radice degli incidenti ricorrenti
La gestione dei problemi mira a identificare e trattare le cause radice degli incidenti per prevenirne la ricorrenza. KaliaOps offre un workflow dedicato con analisi delle cause radice (RCA), documentazione dei workaround, database degli errori noti (KEDB) e tracciamento delle soluzioni permanenti.
Presentazione
Un problema è la causa sottostante di uno o più incidenti. Mentre la gestione degli incidenti mira a ripristinare il servizio rapidamente, la gestione dei problemi mira a eliminare definitivamente la causa.
Incidente vs Problema
| Aspetto | Incidente | Problema |
|---|---|---|
| Natura | Sintomo | Causa radice |
| Obiettivo | Ripristinare il servizio | Prevenire la ricorrenza |
| Urgenza | Alta (impatta gli utenti) | Variabile (può essere pianificato) |
| Esempio | «L'applicazione si blocca» | «Memory leak nel modulo X» |
Quando creare un problema?
- Incidenti ricorrenti: Lo stesso incidente si verifica regolarmente
- Incidente maggiore: Un incidente critico richiede un'indagine approfondita
- Analisi proattiva: Identificazione di rischi prima che causino incidenti
Creare un problema
Accedi al modulo Problemi
Nel menu laterale, clicca su ITSM → Problemi.
Clicca su «Nuovo problema»
In alto a destra, clicca su «Nuovo problema».
Descrivi il problema
Compila:
- Titolo: Descrizione concisa della causa sospettata
- Descrizione: Contesto, sintomi osservati, pattern identificati
- Priorità: Critical, High, Medium, Low
- Impatto: Perimetro interessato
Collega gli incidenti associati
Associa gli incidenti che hanno portato alla creazione del problema. Questo permette di:
- Tracciare l'origine del problema
- Notificare automaticamente alla risoluzione
- Misurare l'impatto (numero di incidenti collegati)
Assegna il problema
Assegna a un analista o team specializzato per l'indagine.
Salva
Il problema viene creato con un riferimento unico: PRB-YYYYMMDD-XXXXXX.
Workflow e stati
Il workflow di gestione dei problemi ha 7 stati:
Diagramma
NEW → ASSIGNED → UNDER_INVESTIGATION → ROOT_CAUSE_IDENTIFIED → KNOWN_ERROR / RESOLVED → CLOSEDDescrizione degli stati
| Stato | Descrizione |
|---|---|
| New | Problema creato, in attesa di assegnazione |
| Assigned | Problema assegnato a un analista |
| Under Investigation | Analisi in corso per identificare la causa radice |
| Root Cause Identified | Causa radice documentata, soluzione in elaborazione |
| Known Error | Problema documentato in KEDB con workaround |
| Resolved | Soluzione permanente implementata |
| Closed | Problema terminato e archiviato |
Analisi delle cause radice
L'analisi delle cause radice (Root Cause Analysis - RCA) è il cuore della gestione dei problemi.
Metodi di analisi
- 5 Perché: Chiedere «Perché?» in modo iterativo
- Diagramma di Ishikawa: Categorizzare le cause potenziali
- Analisi cronologica: Ricostruire la sequenza degli eventi
- Analisi dei log: Esaminare i registri tecnici
Documentare la causa radice
Una volta identificata, documenta la causa radice:
- Clicca su «Identifica la causa radice»
- Redigi una descrizione dettagliata della causa
- Conferma
KaliaOps registra:
- La descrizione della causa radice
- La data di identificazione
- L'utente che ha identificato la causa
Lo stato passa automaticamente a «Root Cause Identified».
Documentare un workaround
Un workaround (soluzione alternativa) permette di ripristinare il servizio in attesa della soluzione permanente.
Quando documentare un workaround?
- La causa radice è identificata
- Una soluzione permanente richiederà tempo
- Un'alternativa è possibile
Creare il workaround
- Clicca su «Documenta il workaround»
- Descrivi la procedura alternativa
- Indica le eventuali limitazioni
- Conferma
Il campo «Workaround disponibile» passa a Sì.
Utilizzo del workaround
Quando si verifica un nuovo incidente per questo problema noto:
- Il team di supporto può applicare il workaround documentato
- L'incidente viene risolto più rapidamente
- Il problema rimane aperto fino alla soluzione permanente
Errori noti (KEDB)
La KEDB (Known Error Database) è il database degli errori noti: problemi la cui causa e workaround sono documentati.
Marcare come errore noto
Quando la causa radice E il workaround sono documentati:
- Clicca su «Marca come errore noto»
- Lo stato passa a «Known Error»
- Il problema viene aggiunto alla KEDB
Utilità della KEDB
- Accelerare la risoluzione: I tecnici consultano la KEDB per gli incidenti ricorrenti
- Ridurre l'escalation: Il livello 1 può risolvere con il workaround
- Capitalizzare le conoscenze: Documentazione perenne dei problemi noti
Consultazione della KEDB
La lista degli errori noti è accessibile via:
- Menu ITSM → Problemi con filtro «Errori noti»
- Ricerca nella knowledge base
Soluzione permanente
L'obiettivo finale è implementare una soluzione permanente che elimini definitivamente la causa radice.
Documentare la soluzione
- Clicca su «Risolvi il problema»
- Descrivi la soluzione permanente implementata
- Indica la data di implementazione
- Conferma
KaliaOps registra:
- La descrizione della soluzione
- La data di implementazione
- L'utente che ha implementato la soluzione
Collegamento con i cambiamenti
La soluzione permanente spesso implica un cambiamento:
- Aggiornamento software
- Sostituzione hardware
- Modifica di configurazione
Collega il problema al cambiamento corrispondente per tracciabilità.
Chiusura
Dopo aver verificato che la soluzione è efficace:
- Clicca su «Chiudi»
- Il problema viene archiviato
- Gli incidenti collegati possono essere notificati della risoluzione definitiva
Collegare gli incidenti
Incidenti all'origine del problema
Alla creazione o in qualsiasi momento, collega gli incidenti che hanno rivelato il problema:
- Documentazione dell'origine
- Misurazione dell'impatto (numero di incidenti)
- Giustificazione della priorità
Nuovi incidenti collegati
Quando un nuovo incidente corrisponde a un problema esistente:
- Dall'incidente, clicca su «Collega a un problema»
- Seleziona il problema corrispondente
- L'incidente beneficia del workaround se disponibile
Notifica automatica
Quando il problema viene risolto:
- Gli incidenti collegati non chiusi vengono notificati
- I team possono informare gli utenti
Analisi dei pattern
Il numero di incidenti collegati a un problema permette di identificare:
- I problemi più impattanti
- La frequenza di ricorrenza
- Il ROI della risoluzione (incidenti evitati)
- Distinzione chiara: incidente (sintomo) vs problema (causa radice)
- Workflow dedicato in 7 stati per indagine e risoluzione
- Documentazione strutturata dell'analisi delle cause radice (RCA)
- Database degli errori noti (KEDB) riutilizzabile
- Workaround temporaneo + soluzione permanente tracciati
- Collegamento automatico con gli incidenti ricorrenti