Bloque 6: Runbooks de Emergencia¶
Cuando algo falla, no es momento de pensar: es momento de actuar. Cada runbook describe un escenario de fallo concreto y los pasos exactos para diagnosticarlo y resolverlo. Están escritos para que un administrador cansado un domingo por la noche pueda seguirlos.
🚧 La mayoría están en construcción — se completarán cuando la infraestructura esté desplegada y los escenarios puedan probarse.
1. VPN caída¶
Nadie puede acceder a SmallCountry desde fuera de casa. NetBird no conecta, los servicios no cargan.
2. Servicio caído¶
Un servicio concreto no responde. Genérico: aplica a cualquier LXC (contenedor ligero de Proxmox) o contenedor.
3. Bomba del sótano¶
⚠️ El escenario más grave. La bomba del pozo falla y el agua sube. Prevención por hardware, respuesta inmediata.
4. Backup fallido¶
PBS (sistema de copias de seguridad de Proxmox) o restic reportan fallo en las copias nocturnas. Una noche es un aviso, dos noches es una emergencia.