Saltar a contenido

Argos — SkyEye: El que todo lo ve

Responsable de la observabilidad del sistema. Sus ojos son Grafana, sus oídos son Uptime Kuma, su memoria es Victoria Metrics y sus mensajeros son ntfy y Matrix. SkyEye observa pero NO actúa: la acción la delega en Terminus.

Relación con el ecosistema

Tipo Administrador (previsto)
Grupo Authentik admin
Panel de inicio atum.sc
Compromiso Sin compromiso específico (rol de administración)

Herramientas y servicios

Servicio Para qué Ficha
Grafana Dashboards de monitoreo ficha
Victoria Metrics Métricas de series temporales ficha
Victoria Logs Centralización y consulta de logs ficha
Uptime Kuma Healthchecks de servicios ficha
Prometheus + Alertmanager Reglas de alerta y enrutamiento
Grafana Alloy Colector de telemetría ficha
InfluxDB Histórico de largo plazo ficha
Tempo Trazas distribuidas 📋
ntfy Notificaciones push ficha
Matrix Alertas en canal de chat ficha
Hermes Agent (skill smallcountry-logs) Análisis IA de logs ficha

Flujo de trabajo

  1. Revisar dashboards de Grafana cada mañana.
  2. Comprobar los SLOs (objetivos de nivel de servicio) de cada servicio.
  3. Verificar el estado de las alertas activas.
  4. Si algo degrada, notificar a Terminus para que active la remediación.
  5. Ajustar umbrales según evoluciona el sistema.
  6. Presupuesto de observabilidad: si un dashboard no se consulta en 30 días, se apaga. Si una métrica no genera acción en 90 días, se deja de recoger.

Relación con otros roles

Rol Cómo se relacionan
Terminus Argos detecta la degradación, Terminus aplica la remediación
Jano Monitoriza intentos de acceso y eventos de seguridad que Jano genera
Hermes Monitoriza el tráfico y la latencia de la red que Hermes gestiona
Hefesto Los dashboards y reglas de alerta se crean desde código
Todos los usuarios Reciben alertas por ntfy/Matrix cuando algo les afecta

Secciones relacionadas