Gestión de problemas
Identifique y elimine las causas raíz de los incidentes recurrentes
La gestión de problemas busca identificar y tratar las causas raíz de los incidentes para prevenir su recurrencia. KaliaOps ofrece un workflow dedicado con análisis de causas raíz (RCA), documentación de workarounds, base de datos de errores conocidos (KEDB) y seguimiento de soluciones permanentes.
Presentación
Un problema es la causa subyacente de uno o varios incidentes. Mientras la gestión de incidentes busca restaurar el servicio rápidamente, la gestión de problemas busca eliminar definitivamente la causa.
Incidente vs Problema
| Aspecto | Incidente | Problema |
|---|---|---|
| Naturaleza | Síntoma | Causa raíz |
| Objetivo | Restaurar el servicio | Prevenir la recurrencia |
| Urgencia | Alta (impacta a los usuarios) | Variable (puede planificarse) |
| Ejemplo | «La aplicación falla» | «Fuga de memoria en el módulo X» |
¿Cuándo crear un problema?
- Incidentes recurrentes: El mismo incidente ocurre regularmente
- Incidente mayor: Un incidente crítico requiere una investigación profunda
- Análisis proactivo: Identificación de riesgos antes de que causen incidentes
Crear un problema
Acceda al módulo Problemas
En el menú lateral, haga clic en ITSM → Problemas.
Haga clic en «Nuevo problema»
En la parte superior derecha, haga clic en «Nuevo problema».
Describa el problema
Complete:
- Título: Descripción concisa de la causa sospechada
- Descripción: Contexto, síntomas observados, patrones identificados
- Prioridad: Critical, High, Medium, Low
- Impacto: Perímetro afectado
Vincule los incidentes asociados
Asocie los incidentes que llevaron a la creación del problema. Esto permite:
- Rastrear el origen del problema
- Notificar automáticamente al resolver
- Medir el impacto (número de incidentes vinculados)
Asigne el problema
Asigne a un analista o equipo especializado para investigación.
Guarde
El problema se crea con una referencia única: PRB-YYYYMMDD-XXXXXX.
Workflow y estados
El workflow de gestión de problemas tiene 7 estados:
Diagrama
NUEVO → ASIGNADO → EN INVESTIGACIÓN → CAUSA IDENTIFICADA → ERROR CONOCIDO / RESUELTO → CERRADODescripción de los estados
| Estado | Descripción |
|---|---|
| Nuevo | Problema creado, esperando asignación |
| Asignado | Problema asignado a un analista |
| En investigación | Análisis en curso para identificar la causa raíz |
| Causa identificada | Causa raíz documentada, solución en elaboración |
| Error conocido | Problema documentado en KEDB con workaround |
| Resuelto | Solución permanente implementada |
| Cerrado | Problema terminado y archivado |
Análisis de causas raíz
El análisis de causas raíz (Root Cause Analysis - RCA) es el corazón de la gestión de problemas.
Métodos de análisis
- 5 Por qués: Preguntar «¿Por qué?» de forma iterativa
- Diagrama de Ishikawa: Categorizar las causas potenciales
- Análisis cronológico: Reconstituir la secuencia de eventos
- Análisis de logs: Examinar los registros técnicos
Documentar la causa raíz
Una vez identificada, documente la causa raíz:
- Haga clic en «Identificar la causa raíz»
- Redacte una descripción detallada de la causa
- Confirme
KaliaOps registra:
- La descripción de la causa raíz
- La fecha de identificación
- El usuario que identificó la causa
El estado pasa automáticamente a «Causa identificada».
Documentar un workaround
Un workaround (solución alternativa) permite restaurar el servicio mientras se espera la solución permanente.
¿Cuándo documentar un workaround?
- La causa raíz está identificada
- Una solución permanente llevará tiempo
- Una alternativa es posible
Crear el workaround
- Haga clic en «Documentar el workaround»
- Describa el procedimiento de alternativa
- Indique las limitaciones eventuales
- Confirme
El campo «Workaround disponible» pasa a Sí.
Uso del workaround
Cuando surge un nuevo incidente para este problema conocido:
- El equipo de soporte puede aplicar el workaround documentado
- El incidente se resuelve más rápidamente
- El problema permanece abierto hasta la solución permanente
Errores conocidos (KEDB)
La KEDB (Known Error Database) es la base de errores conocidos: problemas cuya causa y workaround están documentados.
Marcar como error conocido
Cuando la causa raíz Y el workaround están documentados:
- Haga clic en «Marcar como error conocido»
- El estado pasa a «Error conocido»
- El problema se añade a la KEDB
Utilidad de la KEDB
- Acelerar la resolución: Los técnicos consultan la KEDB para incidentes recurrentes
- Reducir el escalado: El nivel 1 puede resolver con el workaround
- Capitalizar conocimientos: Documentación perenne de problemas conocidos
Consulta de la KEDB
La lista de errores conocidos es accesible vía:
- Menú ITSM → Problemas con filtro «Errores conocidos»
- Búsqueda en la base de conocimientos
Solución permanente
El objetivo final es implementar una solución permanente que elimine definitivamente la causa raíz.
Documentar la solución
- Haga clic en «Resolver el problema»
- Describa la solución permanente implementada
- Indique la fecha de implementación
- Confirme
KaliaOps registra:
- La descripción de la solución
- La fecha de implementación
- El usuario que implementó la solución
Vínculo con cambios
La solución permanente a menudo implica un cambio:
- Actualización de software
- Reemplazo de hardware
- Modificación de configuración
Vincule el problema al cambio correspondiente para trazabilidad.
Cierre
Después de verificar que la solución es efectiva:
- Haga clic en «Cerrar»
- El problema se archiva
- Los incidentes vinculados pueden ser notificados de la resolución definitiva
Vincular incidentes
Incidentes en el origen del problema
Al crear o en cualquier momento, vincule los incidentes que revelaron el problema:
- Documentación del origen
- Medición del impacto (número de incidentes)
- Justificación de la prioridad
Nuevos incidentes vinculados
Cuando un nuevo incidente corresponde a un problema existente:
- Desde el incidente, haga clic en «Vincular a un problema»
- Seleccione el problema correspondiente
- El incidente se beneficia del workaround si está disponible
Notificación automática
Cuando el problema se resuelve:
- Los incidentes vinculados no cerrados son notificados
- Los equipos pueden informar a los usuarios
Análisis de patrones
El número de incidentes vinculados a un problema permite identificar:
- Los problemas más impactantes
- La frecuencia de recurrencia
- El ROI de la resolución (incidentes evitados)
- Distinción clara: incidente (síntoma) vs problema (causa raíz)
- Workflow dedicado en 7 estados para investigación y resolución
- Documentación estructurada del análisis de causas raíz (RCA)
- Base de datos de errores conocidos (KEDB) reutilizable
- Workaround temporal + solución permanente rastreados
- Vinculación automática con incidentes recurrentes