SRE: SLIs, SLOs y Automatizaciones Que Realmente Ayudan
Vamos a explorar cómo definir SLIs y SLOs como código, desplegarlos con ArgoCD, y usar servidores MCP para automatizar flujos de trabajo de SRE...
SRE: Gestión de Incidentes, Guardias y Postmortems como Código
Vamos a explorar cómo construir un flujo de gestión de incidentes efectivo, configurar guardias que no quemen a la gente, escribir runbooks como código y hacer postmortems sin culpar a nadie...
SRE: Observabilidad a Fondo: Trazas, Logs y Métricas
Vamos a explorar los tres pilares de la observabilidad, cómo instrumentar tus aplicaciones con OpenTelemetry, construir dashboards útiles en Grafana, y configurar agregación de logs que realmente ayude durante incidentes...
SRE: Chaos Engineering, Rompiendo Cosas a Propósito
Vamos a explorar chaos engineering en Kubernetes usando Litmus y Chaos Mesh, cómo planificar y ejecutar game days, y por qué romper cosas a propósito es la mejor forma de construir sistemas confiables...
SRE: Planificación de Capacidad, Autoescalamiento y Pruebas de Carga
Vamos a explorar cómo dimensionar correctamente tus workloads de Kubernetes, configurar HPA y VPA para escalamiento automático, usar KEDA para escalamiento basado en eventos, y hacer pruebas de carga con k6...