1. Home /
  2. OpMon – Escalação de Notificações

OpMon – Escalação de Notificações

Conceito

O escalonamento de notificações é um meio de garantir que alguém será notificado eventualmente. Se um contato não reconhecer um problema, podemos encaminhar as notificações para outra pessoa, mudando a forma como entregamos as mensagens se acharmos que é uma boa estratégia.

Importância

Por que isso pode ser um problema: O correto envio de alertas para os responsáveis e sua posterior escalação para outros responsáveis é fundamental para que a plataforma possa enviar os alarmes para as pessoas certas e no tempo certo. Se a plataforma não possuir uma cadeia de envio de alertas devidamente configurados, seus problemas podem ficar sem solução de forma prolongada e problemas sem responsáveis tornam um pequeno incidente em uma porta para a indisponibilidade de sistemas.

Como funciona

O OpMon suporta escalonamento opcional de notificações de contato para hosts e serviços. O escalonamento de notificações de host e serviço é realizado definindo escalonamentos de host e escalonamentos de serviço. Assim que uma notificação for escalonada, os contatos / grupos e opções de notificação para o objeto serão substituídos pelas configurações de escalonamento.

Nesta postagem, não discutiremos a sintaxe ou as opções em relação aos escalonamentos, veremos a lógica dos escalonamentos, como eles ocorrem e como funcionam. Isso pode ser visto aqui.

Aqui, o fluxo de trabalho para verificação / notificação / escalonamento é o seguinte:

  1. O serviço / host é verificado no estado OK com o tempo check_interval;
  2. Conforme o serviço / host entra em um estado NÃO OK, mas não atingiu os max_check_attempts, o serviço entra em um estado SOFT NÃO OK e a próxima verificação é agendada com o tempo retry_interval;
  3. Conforme o serviço / host entra em um estado NÃO OK e atinge o valor max_check_attempts, o serviço entra em um ESTADO HARD NÃO OK e a próxima verificação de serviço / host é agendada com o tempo check_interval;
  4. Agora, se você definir first_notification_delay, isso pode alterar o tempo para a primeira notificação a ser enviada (0 significa notificações a serem enviadas imediatamente);
  5. Se você não definiu first_notification_delay, a primeira notificação é enviada imediatamente e a seguinte será agendada com o tempo de notification_interval (0 significa que apenas a primeira notificação será enviada, a outra não será enviada);

Vejamos um exemplo prático!

Neste escalonamento, na terceira notificação (com o notification_interval ocorrendo), o intervalo de notificação muda para 45 minutos, então a primeira notificação será enviada depois que o valor max_check_attempts for alcançado (supondo que você não colocou nenhum atraso), então a segunda após 10 unidades de tempo, geralmente 10 minutos, a terceira 10 minutos após a segunda, a quarta 45 minutos após a terceira, a quinta 45 minutos após a quarta, a sexta 45 minutos após a quinta.

A partir da sexta notificação, o novo escalonamento entra em ação. A sétima notificação será enviada após 60 minutos e todas as outras notificações serão enviadas 60 minutos após a outra. Lembre-se de que tendo usado 0 como o valor de last_notification, sua escalação nunca terminará até que seu cheque retorne um status OK.

Material de apoio!!!

Updated on 04/11/2021

Esse artigo foi útil para você?

Ficou com alguma dúvida?

Perguntas & Respostas

Participe da nossa comunidade e tire dúvidas ou compartilhe respostas e ideias.

Participar

Professional Support

Não encontrou a resposta que procura? Não se preocupe, estamos aqui para ajudar!

Abrir chamado

Treinamento Online

Através da plataforma Udemy, você encontra todos os treinamentos das nossas soluções.

Inscreva-se