· Participar y mejorar todo el ciclo de vida de los servicios: desde el inicio y el diseño, la implementación, la operación y el refinamiento.
· Mantener los servicios una vez que estén activos midiendo y supervisando la disponibilidad, la latencia y el estado general del sistema.
· Hacer que los sistemas evolucionen, impulsando cambios que mejoren la confiabilidad y la velocidad.
· Realizar automatización constante respecto a errores comunes y mejoras recurrentes
· Practicar análisis postmortem sobre incidentes ocurridos.
· Asegurar cumplimiento de SLO establecido sobre las plataformas a administrar