Runbook · FinderPro

Severidades

Nível	Descrição	Tempo de resposta
P0 · Crítico	API fora, autenticação quebrada, leak de dados	≤ 15 min
P1 · Alto	1 módulo indisponível, pagamentos falhando	≤ 30 min
P2 · Médio	Degradação, webhook atrasado, latência alta	≤ 2 horas
P3 · Baixo	Bugs cosméticos, docs, relatórios	≤ 48 horas

Fluxo de resposta

Detecção — alerta automático (probes internas + StatusMedicao) ou relato de cliente.
Triagem — plantonista classifica severidade em até 5 minutos.
Comunicação inicial — incidente publicado em /status e e-mail pra clientes afetados em no máx. 15 min (P0/P1).
Mitigação — rollback, circuit breaker, ou bypass conforme runbook interno.
Monitoring — verificação ativa por 30 min após correção.
Resolved — update final com causa raiz + cronograma de post-mortem.
Post-mortem público — publicado em até 15 dias (P0/P1).

Canais de comunicação

Status page: finderpro.com.br/status (atualização em tempo real)
E-mail incidentes: cada cliente configura destinatários no painel
Webhook HMAC: eventos incident.opened e incident.resolved
Plantão: ops@finderpro.com.br — resposta 24/7 para contratos corporativos

Compromissos de tempo

RTO (tempo máximo de indisponibilidade): 4 horas para P0
RPO (perda máxima de dados): 5 minutos (backup incremental contínuo)
Notificação de incidente com dados pessoais: ≤ 24 horas conforme DPA
Crédito automático no SLA: no dia 1 do mês seguinte se uptime < 99,9%

Manutenções planejadas

Janelas preferenciais: domingo 02h–05h BRT. Comunicação com 72 horas de antecedência via status page e e-mail. Não há cobrança de SLA durante manutenção planejada.

Post-mortems publicados

Nenhum incidente P0/P1 registrado até o momento. Quando houver, post-mortems aparecem aqui com causa raiz, impacto, ações tomadas e prevenção futura.

Runbook público

Severidades

Fluxo de resposta

Canais de comunicação

Compromissos de tempo

Manutenções planejadas

Post-mortems publicados