8. IA Degradable y Plan de Contingencia¶
La IA ayuda a diagnosticar, resumir y proponer, pero no es imprescindible. Este mecanismo garantiza que las capacidades de IA se reducen por escalones cuando los recursos no están disponibles, pero nunca desaparecen del todo.
Tres niveles de servicio¶
Nivel Completo — Horus GPU activo¶
- Modelos grandes: qwen3:30b (MoE), deepseek-r1:14b (diagnóstico)
- RAG (generación aumentada con documentos (IA)) completo con Qdrant: documentación, playbooks, métricas, farmOS
- Agentes nocturnos: análisis de infra, detección de anomalías
- Continue.dev con qwen2.5-coder:14b para desarrollo
Nivel Ligero — solo Ra CPU¶
- qwen2.5:3b en CPU (requiere 32 GB RAM en Ra (servidor principal de SmallCountry))
- RAG (generación aumentada con documentos (IA)) limitado, más lento
- Sin agentes nocturnos complejos
- Open WebUI sigue disponible 24/7; si Horus (servidor secundario con GPU para IA) está apagado, muestra "modelo no disponible"
Nivel Reglas — sin IA¶
- Playbooks estáticos en Forgejo y
docs.sc - Dashboards en Grafana (los datos siguen ahí)
- Runbooks de emergencia documentados
- Alertmanager sigue funcionando (no depende de IA)
Ciclo de vida de Horus¶
OFF → WoL (Node-RED/n8n) → encendido (~30s)
→ trabajo (inferencia, análisis, backups)
→ 15 min sin actividad → apagado automático
→ OFF
Ventanas programadas: backups y análisis nocturno a las 02:00. Horus se enciende solo, trabaja, y se apaga.
Degradación energética¶
- Conservación (batería < 50%): solo modelos CPU. Horus no se enciende
- Supervivencia (batería < 20%): sin IA. Solo reglas
Relaciones¶
- Degradación Independiente: la IA es un servicio más en la cadena de degradación
- Perfiles de Energía: la activación de Horus depende del perfil energético activo
- Presupuesto de Complejidad: Horus no recibe nuevas funcionalidades hasta 30 días de SLOs (objetivos de nivel de servicio) cumplidos