SRE: Chaos Engineering, Rompiendo Cosas a Propósito
Vamos a explorar chaos engineering en Kubernetes usando Litmus y Chaos Mesh, cómo planificar y ejecutar game days, y por qué romper cosas a propósito es la mejor forma de construir sistemas confiables...
SRE: Gestión de Dependencias y Degradación Elegante
Vamos a explorar cómo gestionar dependencias de servicios de forma confiable, desde circuit breakers y patrones bulkhead hasta estrategias de degradación elegante y SLOs de dependencias con ejemplos prácticos en Elixir y Kubernetes...
SRE: Confiabilidad de Bases de Datos
Vamos a explorar patrones de confiabilidad de bases de datos para PostgreSQL en Kubernetes, desde connection pooling y estrategias de backup hasta migraciones sin downtime, el operador CloudNativePG, y automatización de failover...
SRE: Recuperación ante Desastres y Continuidad del Negocio
Vamos a explorar la planificación de recuperación ante desastres para Kubernetes, desde objetivos de RPO y RTO hasta backups con Velero, recuperación de etcd, estrategias multi-región, simulacros de DR, y runbooks para recuperación completa del cluster...