Saltar a contenido

8. IA Degradable y Plan de Contingencia

La IA ayuda a diagnosticar, resumir y proponer, pero no es imprescindible. Este mecanismo garantiza que las capacidades de IA se reducen por escalones cuando los recursos no están disponibles, pero nunca desaparecen del todo.


Tres niveles de servicio

Nivel Completo — Horus GPU activo

  • Modelos grandes: qwen3:30b (MoE), deepseek-r1:14b (diagnóstico)
  • RAG (generación aumentada con documentos (IA)) completo con Qdrant: documentación, playbooks, métricas, farmOS
  • Agentes nocturnos: análisis de infra, detección de anomalías
  • Continue.dev con qwen2.5-coder:14b para desarrollo

Nivel Ligero — solo Ra CPU

  • qwen2.5:3b en CPU (requiere 32 GB RAM en Ra (servidor principal de SmallCountry))
  • RAG (generación aumentada con documentos (IA)) limitado, más lento
  • Sin agentes nocturnos complejos
  • Open WebUI sigue disponible 24/7; si Horus (servidor secundario con GPU para IA) está apagado, muestra "modelo no disponible"

Nivel Reglas — sin IA

  • Playbooks estáticos en Forgejo y docs.sc
  • Dashboards en Grafana (los datos siguen ahí)
  • Runbooks de emergencia documentados
  • Alertmanager sigue funcionando (no depende de IA)

Ciclo de vida de Horus

OFF → WoL (Node-RED/n8n) → encendido (~30s)
  → trabajo (inferencia, análisis, backups)
  → 15 min sin actividad → apagado automático
  → OFF

Ventanas programadas: backups y análisis nocturno a las 02:00. Horus se enciende solo, trabaja, y se apaga.


Degradación energética

  • Conservación (batería < 50%): solo modelos CPU. Horus no se enciende
  • Supervivencia (batería < 20%): sin IA. Solo reglas

Relaciones


Secciones relacionadas