Incident Management

Incident Management

Een incident is een ongeplande onderbreking of kwaliteitsvermindering van een IT Service. Storing van een configuratie-item die nog geen impact op de service heeft, is ook een incident. Incident Management is het proces om elke ongeplande onderbreking zo snel en goed mogelijk te herstellen. Tot de doelstellingen behoren onder andere:

  • Het zo snel mogelijk herstellen van de normale serviceproductie en het minimaliseren van de negatieve impact op de bedrijfsvoering.
  • Ervoor zorgen dat de hoogst mogelijke levels van servicekwaliteit en -beschikbaarheid gehaald worden.

Onder normale serviceproductie wordt volgens ITIL® verstaan: de serviceproductie die binnen het Service Level Agreement (SLA) gedefinieerd is.

Workarounds

In sommige gevallen is het mogelijk om een workaround te vinden voor een incident – een tijdelijke oplossing om moeilijkheden te overwinnen. Het is belangrijk dat er gewerkt blijft worden aan een permanente oplossing. Een workaround is dus een middel om de impact van een incident of probleem, waarvoor nog geen volledige oplossing beschikbaar is, te verminderen of te elimineren.

Voorbeelden van workarounds zijn:

  • Opnieuw opstarten van een systeem
  • Handmatige doorstart van een programma

Workarounds voor problems worden gedocumenteerd in de Known Error Database (KED). Workarounds voor incidenten die niet gerelateerd zijn aan een problemrecord worden gedocumenteerd in het incidentrecord.

Prioriteit van incidenten

Het overeenkomen en alloceren van een passende prioriteit is een belangrijk aspect bij het registreren van elk incident. Dit bepaalt namelijk hoe het incident door de ondersteunende tool en medewerkers behandeld zal worden.

De prioriteit kan normaal gesproken bepaald worden aan de hand van de urgentie van het incident (hoe snel moet de service hersteld worden) en de impact die het incident veroorzaakt (hoe groot zijn de gevolgen). Een effectieve manier om deze componenten weer te geven is door een matrix te maken waarin de impact en urgentie tegen elkaar worden uitgezet.

Impact is vaak het aantal gebruikers dat last heeft van een incident. Soms kan een uitval van een service voor één gebruiker een hoge impact hebben. Aantallen alleen zeggen dus niet alles om de juiste impact te bepalen. Andere factoren die bij kunnen dragen om de impact te bepalen zijn:

  • Risicodreiging voor de gehele service of alleen een deel ervan
  • Aantal getroffen services
  • Mogelijke financiële schade
  • Mogelijke reputatie schade
  • Wet- en regelgeving

Het schema van de behandeltijden (incidentreactie en hersteltijd) van incidenten is afhankelijk van het prioriteitenlevel van het incident. De overeengekomen tijden worden opgenomen in het Service Level Agreement (SLA). Alle ondersteunende teams dienen op de hoogte te zijn van deze tijdschema’s.

Deel via:
LinkedInTwitterFacebookGoogle+WhatsAppEmail
  • Nieuwsbrief
  • Je bent met verschillende projecten bezig en krijgt daarnaast frequent spoedklusjes of verzoeken of je ‘even’ ergens mee naar wil kijken. Je probeert alle ballen in de lucht te houden
  • Referenties
Scroll