# Gestão centralizada de incidentes

A centralização dos incidentes permite uma busca fácil e ágil, permitindo o uso dos filtros de status, severidade, origens, identificadores e responders, trazendo total controle para que sejam acompanhados somente os incidentes ativos, ou seja consultado todo o histórico.

### **Métricas por incidente**

Um incidente possui diversas métricas como: Horário inicial, tempo de reconhecimento (MTTA), tempo de resolução (MTTR), e horário final.

### **Detalhes por incidente**

É possível entender a causa, e os recursos impactados.

### **Combate ao incidente**

Os responders deixa claro quem foi acionado para combater este incidente e também é viável a leitura da correlação deste com alertas com os quais a ele são relacionados.

### **Status update**

São registradas as ações realizadas por engenheiros dentro do seu ambiente, ficando registrado dentro deste incidente o que foi feito para reestabelecer o serviço impactado.

O update pode se tornar público, aparecendo na status page se o serviço impactado nela estiver registrado.

## **A origem dos incidentes**

São majoritáriamente automáticos, criados e encerrados por integrações com as ferramentas de Monitoramento e Observabilidade, porém podem ser abertas manualmente em casos onde o usuário reportou um problema diretamente, sem ser reconhecido por um sistema pró-ativo.&#x20;

### **Abrindo um Incidente Manualmente**

#### **Nome do Incidente**

Escolha um nome claro e objetivo que descreva o problema. Isso ajudará sua equipe a entender rapidamente o que está acontecendo.&#x20;

**Exemplo:** *“Falha de Conexão com API do Serviço X”*.&#x20;

#### **Causa do Incidente**&#x20;

Explique o que causou o problema para que todos saibam o contexto. Seja direto e inclua detalhes úteis.&#x20;

**Exemplo:** *“A API não conseguiu acessar o banco de dados devido a uma falha de rede.”*&#x20;

#### **Hora de Início**&#x20;

Informe a data e a hora em que o problema começou. Isso ajudará a rastrear o impacto e a linha do tempo do incidente.&#x20;

**Exemplo:** *12/03/2024, 01:41 PM*.&#x20;

#### **Status do Incidente**&#x20;

* **Alarmed:** O incidente foi identificado, mas ainda está aguardando ação.&#x20;
* **Resolved:** Se o problema já foi solucionado.&#x20;

**Nota:** Caso o incidente seja criado como “Resolved”, as métricas de tempo de reconhecimento e resolução serão zeradas, e todos os envolvidos receberão uma notificação.&#x20;

#### **Gravidade (Severity)**&#x20;

Defina a gravidade com base no impacto do problema:&#x20;

* **Sev 1 – Crítico:** Impacto grave e urgente.&#x20;
* **Sev 2 – Alto:** Alta prioridade, mas não crítica.&#x20;
* **Sev 3 – Médio:** Impacto moderado.&#x20;
* **Sev 4 – Baixo:** Impacto pequeno.&#x20;
* **Not classified:** Não pode classificar.&#x20;

#### **Relacione Origens e Alertas**&#x20;

* **Origens Vinculadas:** Identifique qual serviço, aplicação ou sistema está relacionado ao incidente.&#x20;
* **Alertas Vinculados:** Adicione os alertas associados para ajudar a equipe a entender melhor o que aconteceu.&#x20;

#### **Adicione os Responsáveis (Responders)**&#x20;

Inclua os membros da equipe que irão lidar com o incidente. Isso garante que todos saibam quem está cuidando do problema.&#x20;

## **Resposta a incidentes**

E possível **Reconhecer (Acknowledge)** o incidente, notificando a equipe de que ele foi reconhecido e está sendo investigado, ou **Resolver (Resolve)**, finalizando o incidente e notificando todas as partes envolvidas.&#x20;

## **Glossário de Termos Técnicos**

**Incident Center**: Central de monitoramento e gerenciamento de incidentes na Elven Platform. Permite a visualização, busca, criação e gerenciamento de incidentes, otimizando a resposta da equipe e facilitando a resolução de problemas.&#x20;

**Incidents**: Termo usado para se referir aos eventos ou problemas identificados nas aplicações ou sistemas, que precisam ser monitorados, investigados e resolvidos pela equipe.&#x20;

**Barra de Busca**: Ferramenta de pesquisa na plataforma que permite localizar incidentes rapidamente, utilizando o nome ou outros critérios de pesquisa.&#x20;

**Filtros Avançados**: Funcionalidade que permite refinar a busca por incidentes utilizando parâmetros como:&#x20;

* **Status**: Como “Alarmed” ou “Resolved”.&#x20;
* **Severidade**: Classificação da gravidade do incidente (SEV 1, SEV 2, etc.).&#x20;
* **Origem**: Sistema ou aplicação de onde o incidente se originou.&#x20;
* **Período**: Intervalo de tempo para filtrar incidentes com base em quando ocorreram.&#x20;

**Incidente Manual**: Um incidente criado de forma manual pela equipe, geralmente para relatar um problema que não foi detectado automaticamente pela plataforma.&#x20;

**Nome do Incidente**: Campo onde você descreve brevemente o incidente. Deve ser claro e objetivo para facilitar a compreensão rápida do problema.&#x20;

**Causa do Incidente**: Descrição do que causou o incidente. Esse campo ajuda a fornecer contexto e detalhes para a equipe entender o problema.&#x20;

**Hora de Início**: Data e hora em que o incidente começou, ajudando a rastrear o impacto e o tempo de resolução do problema.&#x20;

**Status do Incidente**: Indicador que mostra o estado atual do incidente. As opções incluem:&#x20;

* **Alarmed**: O incidente foi identificado, mas ainda está aguardando ação.&#x20;
* **Resolved**: O incidente foi resolvido.&#x20;

**Gravidade (Severity)**: Classificação do impacto do incidente, que ajuda a priorizar a resolução. As opções incluem:&#x20;

* **SEV 1 – Crítico**: Incidente grave, com impacto significativo.&#x20;
* **SEV 2 – Alto**: Alta prioridade, mas não crítico.&#x20;
* **SEV 3 – Médio**: Impacto moderado.&#x20;
* **SEV 4 – Baixo**: Impacto pequeno.&#x20;
* **Not classified**: Incidente não classificado.&#x20;

**Origens Vinculadas**: Campo onde você pode identificar qual serviço, aplicação ou sistema está relacionado ao incidente, ajudando a compreender sua origem.&#x20;

**Alertas Vinculados**: Alertas associados ao incidente, oferecendo mais contexto sobre o que gerou ou contribuiu para o problema.&#x20;

**Responsáveis (Responders)**: Membros da equipe responsáveis pela resolução do incidente. Incluí-los no incidente garante que todos saibam quem está lidando com o problema.&#x20;

**Gerenciando Resposta de Incidentes**: Ações realizadas para resolver ou monitorar o progresso do incidente, garantindo uma gestão eficiente e transparente. As principais ações incluem:&#x20;

* **Reconhecer (Acknowledge)**: Notificar a equipe que o incidente foi identificado e está sendo investigado.&#x20;
* **Resolver (Resolve)**: Concluir o incidente, indicando que o problema foi resolvido e notificando todos os envolvidos.&#x20;

**Comunicação via Slack**: Integração do Incident Center com o Slack, permitindo que a equipe se comunique diretamente sobre o incidente, facilitando o gerenciamento e a resolução em tempo real.&#x20;

**Notificação de Resolução**: Notificação enviada para todas as partes envolvidas quando um incidente é resolvido, garantindo transparência e fechamento adequado do evento.&#x20;


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.elven.works/elven-platform/elven-incident/gestao-centralizada-de-incidentes.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
