Implementação do SLA

O SLA serve para definir as responsabilidades de cada parte, os processos que serão realizados, as métricas de avaliação e as penalidades caso os níveis de serviço acordados não sejam alcançados.

Abaixo você irá conhecer o que é o SLA, e qual a importância de sua implementação.

I – ITIL na implementação de SLA 

  • O ITIL reúne um conjunto de rotinas para otimizar os processos do setor de TI, atuando como um guia de gestão de processos. É uma ferramenta facilitadora à implementação de SLA, uma vez que ajuda no gerenciamento de nível de serviço, alinhando os objetivos operacionais de forma eficiente

II – Classificação

A classificação consiste em:

  • Categoria: Ela define o tipo de item que foi afetado pelo incidente;
  • Prioridade: Para definir a prioridade de atendimento, outros dois fatores devem ser analisados:
  1. Impacto: quais consequências esse incidente pode trazer para as operações da empresa?
  2. Urgência: qual o tempo estimado para se solucionar este incidente?
  • A tabela abaixo apresenta a combinação de impacto x urgência. Esta combinação gera um número de prioridade, que vai de 1 a 9.
  • Impacto: Criticidade para o negócio
  • Urgência: Velocidade

 

Um exemplo de tempo para cada prioridade

 

III – Prioridades / Impacto

 

Exemplos de prioridades – P1 – Impacto Alto

  • Um incidente que definida na matriz de prioridade como P1, possui alto impacto e alta urgência. São tarefas que geralmente são críticas ou apresentam maior risco para ela. Na P1 podem incluir:
  1. Um sistema ou serviço muito importante que está indisponível.
  2. Uma grande quantidade de dados corrompidos
  3. Todos os usuários foram afetados e não conseguem trabalhar
  4. Usuários importantes sem conseguir utilizar o sistema
  5. Uma suspeita de falha de segurança de TI que pode afetas todos os usuários
  6. Potenciais violações legais ou regulamentares
  • Exemplos de falhas que podem obter como resultado uma P1 na matriz de prioridade são interrupções completas da rede, ataques generalizados de vírus, interrupções de e-mail e interrupções completas de aplicativos.

ACORDO DE NÍVEL OPERACIONAL – ALTO

Exemplos de prioridades – P2- Impacto Médio

  • Uma tarefa P2 na matriz de prioridade possui médio Impacto e Alta Urgência, ou alto Impacto e Média Urgência. São tarefas onde a resolução é importante, mas o efeito não é tão sério como na tarefa P1. As tarefas P2 na matriz de prioridade pode incluir:
  1. Um sistema ou serviço inteiro que está indisponível
  2. Dados que foram corrompidos, afetando vários usuários
  3. Uma grande proporção de usuários foi afetada e não consegue trabalhar
  4. Uma suspeita de falha de segurança de TI, afetando alguns usuários.
  • Exemplos de falhas que podem obter como resultado uma P2 na matriz de prioridade são interrupções parciais da rede, ataques generalizados de vírus, perda de algumas funções de e-mail e interrupções em aplicações não críticas.

ACORDO DE NÍVEL OPERACIONAL – MÉDIO

Exemplos de prioridades – P3- Impacto Baixo

  • Tarefas de prioridade “normal” têm prioridade P3 atribuída pela matriz de prioridade.
    São as tarefas onde:
  1. Funcionalidades básicas estão disponíveis, mas com algumas limitações
  2. Soluções alternativas estão disponíveis
  3. Um baixo número de usuários foi afetado
  4. Falha parcial

Resumindo, costumam ser problemas rotineiros de TI, como problemas na impressora ou em aplicações que afetam poucos usuários. Estes problemas ainda precisam ser resolvidos, porém, não são tão urgentes. Então, se há tarefas pendentes com prioridade mais alta, elas devem ser tratadas antes da P3.

ACORDO DE NÍVEL OPERACIONAL – BAIXO

Por fim, segundo a ITIL esses são alguns dos objetivos e responsabilidades no gerenciamento dos incidentes com SLA

  • ITIL – IT Infrastructure Library
  • ANS’s – Acordo de Nível de Serviços
  • SLA – Service Level Agreement
  • OLA – Operational Level Magreement ou Acordo de Nível de Serviço

Gerenciamento de incidentes

Objetivos

  • Restabelecer o serviço o mais breve possível, ao mesmo tempo minimizando o impacto;
  • Garantir que a qualidade do serviço e a disponibilidade atendam aos ANS’s

Responsabilidades

  • Detecção e registro de incidentes;
  • Classificação e suporte inicial;
  • Investigação e diagnóstico;
  • Resolução, recuperação e fechamento do incidente;
  • Controle de incidentes;
  • Propriedade, monitoração, rastreamento e comunicação dos incidentes

 

Tabela de Classificação de Prioridade