SRE: Chaos Engineering, Rompiendo Cosas a Propósito

2026-03-02 | 11 min de lectura

Vamos a explorar chaos engineering en Kubernetes usando Litmus y Chaos Mesh, cómo planificar y ejecutar game days, y por qué romper cosas a propósito es la mejor forma de construir sistemas confiables...

SRE: Gestión de Dependencias y Degradación Elegante

2026-03-17 | 26 min de lectura

Vamos a explorar cómo gestionar dependencias de servicios de forma confiable, desde circuit breakers y patrones bulkhead hasta estrategias de degradación elegante y SLOs de dependencias con ejemplos prácticos en Elixir y Kubernetes...

SRE: Confiabilidad de Bases de Datos

2026-03-23 | 27 min de lectura

Vamos a explorar patrones de confiabilidad de bases de datos para PostgreSQL en Kubernetes, desde connection pooling y estrategias de backup hasta migraciones sin downtime, el operador CloudNativePG, y automatización de failover...

SRE: Recuperación ante Desastres y Continuidad del Negocio

2026-04-03 | 29 min de lectura

Vamos a explorar la planificación de recuperación ante desastres para Kubernetes, desde objetivos de RPO y RTO hasta backups con Velero, recuperación de etcd, estrategias multi-región, simulacros de DR, y runbooks para recuperación completa del cluster...