Severidades
| Nível |
Descrição |
Tempo de resposta |
| P0 · Crítico |
API fora, autenticação quebrada, leak de dados |
≤ 15 min |
| P1 · Alto |
1 módulo indisponível, pagamentos falhando |
≤ 30 min |
| P2 · Médio |
Degradação, webhook atrasado, latência alta |
≤ 2 horas |
| P3 · Baixo |
Bugs cosméticos, docs, relatórios |
≤ 48 horas |
Fluxo de resposta
- Detecção — alerta automático (probes internas + StatusMedicao) ou relato de cliente.
- Triagem — plantonista classifica severidade em até 5 minutos.
- Comunicação inicial — incidente publicado em /status e e-mail pra clientes afetados em no máx. 15 min (P0/P1).
- Mitigação — rollback, circuit breaker, ou bypass conforme runbook interno.
- Monitoring — verificação ativa por 30 min após correção.
- Resolved — update final com causa raiz + cronograma de post-mortem.
- Post-mortem público — publicado em até 15 dias (P0/P1).
Canais de comunicação
- Status page: finderpro.com.br/status (atualização em tempo real)
- E-mail incidentes: cada cliente configura destinatários no painel
- Webhook HMAC: eventos
incident.opened e incident.resolved
- Plantão: ops@finderpro.com.br — resposta 24/7 para contratos corporativos
Compromissos de tempo
- RTO (tempo máximo de indisponibilidade): 4 horas para P0
- RPO (perda máxima de dados): 5 minutos (backup incremental contínuo)
- Notificação de incidente com dados pessoais: ≤ 24 horas conforme DPA
- Crédito automático no SLA: no dia 1 do mês seguinte se uptime < 99,9%
Manutenções planejadas
Janelas preferenciais: domingo 02h–05h BRT. Comunicação
com 72 horas de antecedência via status page e e-mail. Não há cobrança de
SLA durante manutenção planejada.
Post-mortems publicados
Nenhum incidente P0/P1 registrado até o momento. Quando houver,
post-mortems aparecem aqui com causa raiz, impacto, ações tomadas
e prevenção futura.