Logging, Monitoring, and Observability in Google Cloud
(GC-LMOGC)
Módulo 1: Introducción a las herramientas de supervisión de Google Cloud
- Comprender el propósito y las capacidades de los componentes centrados en las operaciones de Google Cloud: registro, supervisión, informes de errores y supervisión del servicio.
- Comprender el propósito y las capacidades de los componentes centrados en la administración del rendimiento de las aplicaciones de Google Cloud: depurador, seguimiento y generador de perfiles.
Módulo 2: Evitar el dolor del cliente
- Construya una base de monitoreo en las cuatro señales de oro: latencia, tráfico, errores y saturación.
- Mida el dolor del cliente con SLI.
- Definir medidas de desempeño críticas.
- Cree y use SLO y SLA.
- Logre una armonía entre el desarrollador y la operación con los presupuestos de error.
Módulo 3: Políticas de alerta
- Desarrolle estrategias de alerta.
- Definir políticas de alerta.
- Agrega canales de notificación.
- Identifique tipos de alertas y usos comunes para cada uno.
- Construir y alertar sobre grupos de recursos.
- Administre las políticas de alerta de manera programática.
Módulo 4: Monitoreo de sistemas críticos
- Elija arquitecturas de proyectos de supervisión de mejores prácticas.
- Diferencia las funciones de Cloud IAM para la supervisión.
- Utilice los paneles predeterminados de forma adecuada.
- Cree paneles personalizados para mostrar el consumo de recursos y la carga de aplicaciones.
- Defina comprobaciones de tiempo de actividad para realizar un seguimiento de la vida y la latencia.
Módulo 5: Configuración de los servicios en la nube de Google para la observabilidad
- Integre agentes de registro y supervisión en las imágenes y las máquinas virtuales de Compute Engine.
- Habilite y utilice Kubernetes Monitoring.
- Amplíe y clarifique la supervisión de Kubernetes con Prometheus.
- Exponga métricas personalizadas a través del código y con la ayuda de OpenCensus.
Módulo 6: Registro y análisis avanzados
- Identificar y elegir entre los enfoques de etiquetado de recursos.
- Defina sumideros de registros (filtros de inclusión) y filtros de exclusión.
- Cree métricas basadas en registros.
- Defina métricas personalizadas.
- Vincule los errores de la aplicación al registro mediante el informe de errores.
- Exporta registros a BigQuery.
Módulo 7: Monitoreo de la seguridad de la red y registros de auditoría
- Recopile y analice los registros de flujo de VPC y los registros de reglas de firewall.
- Habilite y supervise la duplicación de paquetes.
- Explique las capacidades de Network Intelligence Center.
- Utilice los registros de auditoría de la actividad del administrador para realizar un seguimiento de los cambios en la configuración o los metadatos de los recursos.
- Utilice los registros de auditoría de acceso a datos para realizar un seguimiento de los accesos o cambios en los datos de recursos proporcionados por el usuario.
- Utilice los registros de auditoría de eventos del sistema para realizar un seguimiento de las acciones administrativas de GCP.
Módulo 8: Gestión de incidentes
- Definir roles de gestión de incidentes y canales de comunicación.
- Mitigar el impacto del incidente.
- Solucionar problemas de raíz.
- Resuelve incidencias.
- Documente los incidentes en un proceso post-mortem.
Módulo 9: Investigación de problemas de rendimiento de aplicaciones
- Depurar código de producción para corregir defectos de código.
- Rastree la latencia a través de capas de interacción de servicios para eliminar los cuellos de botella en el rendimiento.
- Perfile e identifique funciones de uso intensivo de recursos en una aplicación.
Módulo 10: Optimización de los costos de monitoreo
- Analice el costo de utilización de recursos para monitorear componentes relacionados dentro de Google Cloud.
- Implemente las mejores prácticas para controlar el costo de monitoreo dentro de Google Cloud.