Logging, Monitoring, and Observability in Google Cloud (GO-LMOGC)

Módulo 1: Introducción a las herramientas de supervisión de Google Cloud

  • Comprender el propósito y las capacidades de los componentes centrados en las operaciones de Google Cloud: registro, supervisión, informes de errores y supervisión del servicio.
  • Comprender el propósito y las capacidades de los componentes centrados en la administración del rendimiento de las aplicaciones de Google Cloud: depurador, seguimiento y generador de perfiles.

Módulo 2: Evitar el dolor del cliente

  • Construya una base de monitoreo en las cuatro señales de oro: latencia, tráfico, errores y saturación.
  • Mida el dolor del cliente con SLI.
  • Definir medidas de desempeño críticas.
  • Cree y use SLO y SLA.
  • Logre una armonía entre el desarrollador y la operación con los presupuestos de error.

Módulo 3: Políticas de alerta

  • Desarrolle estrategias de alerta.
  • Definir políticas de alerta.
  • Agrega canales de notificación.
  • Identifique tipos de alertas y usos comunes para cada uno.
  • Construir y alertar sobre grupos de recursos.
  • Administre las políticas de alerta de manera programática.

Módulo 4: Monitoreo de sistemas críticos

  • Elija arquitecturas de proyectos de supervisión de mejores prácticas.
  • Diferencia las funciones de Cloud IAM para la supervisión.
  • Utilice los paneles predeterminados de forma adecuada.
  • Cree paneles personalizados para mostrar el consumo de recursos y la carga de aplicaciones.
  • Defina comprobaciones de tiempo de actividad para realizar un seguimiento de la vida y la latencia.

Módulo 5: Configuración de los servicios en la nube de Google para la observabilidad

  • Integre agentes de registro y supervisión en las imágenes y las máquinas virtuales de Compute Engine.
  • Habilite y utilice Kubernetes Monitoring.
  • Amplíe y clarifique la supervisión de Kubernetes con Prometheus.
  • Exponga métricas personalizadas a través del código y con la ayuda de OpenCensus.

Módulo 6: Registro y análisis avanzados

  • Identificar y elegir entre los enfoques de etiquetado de recursos.
  • Defina sumideros de registros (filtros de inclusión) y filtros de exclusión.
  • Cree métricas basadas en registros.
  • Defina métricas personalizadas.
  • Vincule los errores de la aplicación al registro mediante el informe de errores.
  • Exporta registros a BigQuery.

Módulo 7: Monitoreo de la seguridad de la red y registros de auditoría

  • Recopile y analice los registros de flujo de VPC y los registros de reglas de firewall.
  • Habilite y supervise la duplicación de paquetes.
  • Explique las capacidades de Network Intelligence Center.
  • Utilice los registros de auditoría de la actividad del administrador para realizar un seguimiento de los cambios en la configuración o los metadatos de los recursos.
  • Utilice los registros de auditoría de acceso a datos para realizar un seguimiento de los accesos o cambios en los datos de recursos proporcionados por el usuario.
  • Utilice los registros de auditoría de eventos del sistema para realizar un seguimiento de las acciones administrativas de GCP.

Módulo 8: Gestión de incidentes

  • Definir roles de gestión de incidentes y canales de comunicación.
  • Mitigar el impacto del incidente.
  • Solucionar problemas de raíz.
  • Resuelve incidencias.
  • Documente los incidentes en un proceso post-mortem.

Módulo 9: Investigación de problemas de rendimiento de aplicaciones

  • Depurar código de producción para corregir defectos de código.
  • Rastree la latencia a través de capas de interacción de servicios para eliminar los cuellos de botella en el rendimiento.
  • Perfile e identifique funciones de uso intensivo de recursos en una aplicación.

Módulo 10: Optimización de los costos de monitoreo

  • Analice el costo de utilización de recursos para monitorear componentes relacionados dentro de Google Cloud.
  • Implemente las mejores prácticas para controlar el costo de monitoreo dentro de Google Cloud.