Gestion des problèmes
Identifiez et éliminez les causes racines des incidents récurrents
La gestion des problèmes vise à identifier et traiter les causes racines des incidents pour prévenir leur récurrence. KaliaOps propose un workflow dédié avec analyse des causes racines (RCA), documentation des workarounds, base de données des erreurs connues (KEDB) et suivi des solutions permanentes.
Présentation
Un problème est la cause sous-jacente d'un ou plusieurs incidents. Là où la gestion des incidents vise à restaurer le service rapidement, la gestion des problèmes cherche à éliminer définitivement la cause.
Incident vs Problème
| Aspect | Incident | Problème |
|---|---|---|
| Nature | Symptôme | Cause racine |
| Objectif | Restaurer le service | Prévenir la récurrence |
| Urgence | Haute (impacte les utilisateurs) | Variable (peut être planifié) |
| Exemple | « L'application plante » | « Fuite mémoire dans le module X » |
Quand créer un problème ?
- Incidents récurrents : Le même incident se produit régulièrement
- Incident majeur : Un incident critique nécessite une investigation approfondie
- Analyse proactive : Identification de risques avant qu'ils ne causent des incidents
Créer un problème
Accédez au module Problèmes
Dans le menu latéral, cliquez sur ITSM → Problèmes.
Cliquez sur « Nouveau problème »
En haut à droite, cliquez sur « Nouveau problème ».
Décrivez le problème
Renseignez :
- Titre : Description concise de la cause suspectée
- Description : Contexte, symptômes observés, patterns identifiés
- Priorité : Critical, High, Medium, Low
- Impact : Périmètre affecté
Liez les incidents associés
Associez les incidents qui ont conduit à la création du problème. Cela permet de :
- Tracer l'origine du problème
- Notifier automatiquement lors de la résolution
- Mesurer l'impact (nombre d'incidents liés)
Assignez le problème
Assignez à un analyste ou une équipe spécialisée pour investigation.
Enregistrez
Le problème est créé avec une référence unique : PRB-YYYYMMDD-XXXXXX.
Workflow et statuts
Le workflow de gestion des problèmes comporte 7 statuts :
Diagramme
NOUVEAU → ASSIGNÉ → EN INVESTIGATION → CAUSE IDENTIFIÉE → ERREUR CONNUE / RÉSOLU → CLÔTURÉDescription des statuts
| Statut | Description |
|---|---|
| Nouveau | Problème créé, en attente d'assignation |
| Assigné | Problème assigné à un analyste |
| En investigation | Analyse en cours pour identifier la cause racine |
| Cause identifiée | Cause racine documentée, solution en cours d'élaboration |
| Erreur connue | Problème documenté dans la KEDB avec workaround |
| Résolu | Solution permanente implémentée |
| Clôturé | Problème terminé et archivé |
Analyse des causes racines
L'analyse des causes racines (Root Cause Analysis - RCA) est le coeur de la gestion des problèmes.
Méthodes d'analyse
- 5 Pourquoi : Poser « Pourquoi ? » de manière itérative
- Diagramme d'Ishikawa : Catégoriser les causes potentielles
- Analyse chronologique : Reconstituer la séquence d'événements
- Analyse des logs : Examiner les journaux techniques
Documenter la cause racine
Une fois identifiée, documentez la cause racine :
- Cliquez sur « Identifier la cause racine »
- Rédigez une description détaillée de la cause
- Confirmez
KaliaOps enregistre :
- La description de la cause racine
- La date d'identification
- L'utilisateur qui a identifié la cause
Le statut passe automatiquement à « Cause identifiée ».
Documenter un workaround
Un workaround (solution de contournement) permet de restaurer le service en attendant la solution permanente.
Quand documenter un workaround ?
- La cause racine est identifiée
- Une solution permanente prendra du temps
- Un contournement est possible
Créer le workaround
- Cliquez sur « Documenter le workaround »
- Décrivez la procédure de contournement
- Indiquez les limitations éventuelles
- Confirmez
Le champ « Workaround disponible » passe à Oui.
Utilisation du workaround
Lorsqu'un nouvel incident survient pour ce problème connu :
- L'équipe support peut appliquer le workaround documenté
- L'incident est résolu plus rapidement
- Le problème reste ouvert jusqu'à la solution permanente
Erreurs connues (KEDB)
La KEDB (Known Error Database) est la base des erreurs connues : problèmes dont la cause et le workaround sont documentés.
Marquer comme erreur connue
Lorsque la cause racine ET le workaround sont documentés :
- Cliquez sur « Marquer comme erreur connue »
- Le statut passe à « Erreur connue »
- Le problème est ajouté à la KEDB
Utilité de la KEDB
- Accélérer la résolution : Les techniciens consultent la KEDB pour les incidents récurrents
- Réduire l'escalade : Le niveau 1 peut résoudre avec le workaround
- Capitaliser les connaissances : Documentation pérenne des problèmes connus
Consultation de la KEDB
La liste des erreurs connues est accessible via :
- Menu ITSM → Problèmes avec filtre « Erreurs connues »
- Recherche dans la base de connaissances
Solution permanente
L'objectif final est d'implémenter une solution permanente qui élimine définitivement la cause racine.
Documenter la solution
- Cliquez sur « Résoudre le problème »
- Décrivez la solution permanente implémentée
- Indiquez la date d'implémentation
- Confirmez
KaliaOps enregistre :
- La description de la solution
- La date d'implémentation
- L'utilisateur qui a implémenté la solution
Lien avec les changements
La solution permanente implique souvent un changement :
- Mise à jour logicielle
- Remplacement matériel
- Modification de configuration
Liez le problème au changement correspondant pour traçabilité.
Clôture
Après vérification que la solution est effective :
- Cliquez sur « Clôturer »
- Le problème est archivé
- Les incidents liés peuvent être notifiés de la résolution définitive
Lier les incidents
Incidents à l'origine du problème
Lors de la création ou à tout moment, liez les incidents qui ont révélé le problème :
- Documentation de l'origine
- Mesure de l'impact (nombre d'incidents)
- Justification de la priorité
Nouveaux incidents liés
Lorsqu'un nouvel incident correspond à un problème existant :
- Depuis l'incident, cliquez sur « Lier à un problème »
- Sélectionnez le problème concerné
- L'incident bénéficie du workaround si disponible
Notification automatique
Lorsque le problème est résolu :
- Les incidents liés non clôturés sont notifiés
- Les équipes peuvent informer les utilisateurs
Analyse des patterns
Le nombre d'incidents liés à un problème permet d'identifier :
- Les problèmes les plus impactants
- La fréquence de récurrence
- Le ROI de la résolution (incidents évités)
- Distinction claire : incident (symptôme) vs problème (cause racine)
- Workflow dédié en 7 statuts pour l'investigation et la résolution
- Documentation structurée de l'analyse des causes racines (RCA)
- Base de données des erreurs connues (KEDB) réutilisable
- Workaround temporaire + solution permanente tracés
- Liaison automatique avec les incidents récurrents