Saltar a contenido

Runbook: Bomba del sótano

🚧 En construcción — este procedimiento se documentará cuando la infraestructura esté desplegada y el escenario pueda probarse.

Gravedad 🔴 Crítica — riesgo de inundación con daños físicos irreversibles
Tiempo de respuesta < 5 minutos
Roles implicados Terminus (resiliencia), Argos (detección), Vulcano (mantenimiento físico)

⚠️ Este es el escenario más grave de SmallCountry. Un fallo de la bomba del pozo puede causar inundación del sótano en minutos. La mitigación principal es por hardware (Shelly (actuador eléctrico WiFi) 1PM en modo power on default: ON), no por software.

Síntomas

  • Alerta crítica en ntfy: "🔴 Bomba del pozo no responde"
  • Alerta en Matrix (sala Casa Chapinería)
  • El dashboard de Grafana muestra la bomba en rojo
  • Posiblemente: agua en el sótano

Diagnóstico

  • [ ] PASO 0: Ir físicamente al sótano. Esto no se diagnostica en remoto.
  • [ ] Verificar si el Shelly 1PM tiene corriente (LED encendido)
  • [ ] Comprobar si la bomba está funcionando (ruido, vibración)
  • [ ] Verificar el nivel de agua en el pozo/sótano
  • [ ] Revisar estado del Shelly en Node-RED
  • [ ] Comprobar conectividad MQTT (protocolo de mensajería ligera para IoT) entre el Shelly y Mosquitto

Resolución

  • [ ] Si la bomba no arranca pero el Shelly tiene corriente: forzar arranque manual en el Shelly (pulsador físico)
  • [ ] Si el Shelly no tiene corriente: verificar diferencial y magnetotérmico
  • [ ] Si el agua sube: activar bomba de respaldo (si existe) o achique manual
  • [ ] Una vez contenida la emergencia: diagnosticar causa raíz (sensores, MQTT (protocolo de mensajería ligera para IoT), Node-RED, red, hardware)
  • [ ] Documentar el incidente en Forgejo

Verificación

  • El nivel de agua vuelve a la normalidad
  • La bomba responde a comandos desde Node-RED
  • El Shelly publica estado en MQTT
  • Alerta en ntfy: "🟢 Bomba del pozo operativa"

Prevención

  • Shelly 1PM en modo power on default: ON: si todo el software falla, la bomba sigue
  • Prueba mensual de parada/arranque de bomba
  • Sensor de nivel de agua con alerta independiente
  • SAI para el servidor (si la bomba depende del servidor en algún modo)
  • Principio 5: Resiliencia física delegada al hardware