Netmind - loader

Agilidad Empresarial

Site Reliability Engineering Foundation (SREF)

Introducción

El curso SRE (Site Reliability Engineering) Foundation es una introducción a los principios y prácticas que permiten que una organización escalar servicios críticos de manera confiable y económica. La introducción de una dimensión de confiabilidad del sitio (site-reliability) requiere realineación organizacional, un nuevo enfoque en ingeniería y automatización, y la adopción de una variedad de nuevos paradigmas de trabajo.

El curso destaca la evolución de SRE y su dirección futura y equipa a los participantes con las prácticas, métodos y herramientas para involucrar a la gente alrededor de la organización involucrada en la confiabilidad y la estabilidad evidenciada gracias al uso de escenarios y casos reales. Una vez completado el curso los alumnos tendrán elementos tangibles que podrán aplicar en su puesto de trabajo de cara a establecer y hacer seguimiento de los Objetivos a Nivel Operacional (SLO).

El curso se desarrolló aprovechando las fuentes clave de SRE, interactuando con líderes de opinión en el espacio de SRE y trabajando con organizaciones que adoptan SRE para extraer las mejores prácticas de la vida real y ha sido diseñado para enseñar los principios y prácticas clave necesarios para iniciar la adopción de SRE.

Objetivos

Al finalizar este curso los alumnos conocerán sobre:

  • La historia de SRE y su aparición en Google
  • La interrelación de SRE con DevOps y otros frameworks conocidos
  • Los principios detrás de SRE
  • Los objetivos de nivel de servicio (SLO) y su foco en el usuario
  • Los indicadores de nivel de servicio (SLI) y el panorama de monitorización actual
  • Presupuestos de error y políticas asociadas
  • Trabajo que provoca desgaste (toil) y su efecto en la productividad de la organización
  • Algunos pasos prácticos que ayudan a eliminar el trabajo que provoca desgaste (toil)
  • Herramientas SRE, técnicas de automatización y la importancia de la seguridad
  • Anti-fragilidad, la aproximación al fallo y a las pruebas de fallos
  • El impacto organizacional que introduce SRE

Perfil de los alumnos

  • Cualquier persona que esté comenzando en temas de confiabilidad (reliability)
  • Cualquier persona interesada en el liderazgo TI y las aproximaciones de cambio organizacional
  • Gestores de negocio
  • Agentes del cambio
  • Consultores
  • Ingenieros
  • Directores TI
  • Gerentes de TI
  • Propietarios de productos
  • Scrum Masters
  • Ingenieros de software
  • Ingenieros de confiabilidad de sitio (SRE)
  • Integradores de sistemas
  • Proveedores de herramientas

Requisitos previos

Conocimiento de la terminología y los conceptos DevOps.

Profesorado

Contamos con un equipo de instructores altamente cualificados que combinan la actividad formativa con el desarrollo de su actividad profesional como expertos en el campo de las TIC. Profesionales certificados por los principales fabricantes del sector capaces de transferir de forma amena y entendedora los conceptos técnicos más abstractos.

Documentación

Cada alumno recibirá un ejemplar de la Documentación oficial de DevOps Institute.

Contenidos del Site Reliability Engineering Foundation (SREF)

  1. Principios y prácticas de SRE
    • ¿Qué es la Site Reliability Engineering?
    • SRE y DevOps. ¿Cuál es la diferencia?
    • Principios y prácticas SRE
  2. Objetivos de Nivel de Servicio (SLO) y presupuestos de errores
    • Objetivos de Nivel de Servicio (SLO)
    • Presupuestos de errores
    • Políticas de presupuestos de errores
  3. Reducir el trabajo que genera desgaste (toil)
    • ¿Qué es el toil?
    • ¿Por qué es malo el toil?
    • Acciones ante el toil
  4. Monitorización e Indicadores de Nivel de Servicio (SLI)
    • Indicadores de Nivel de Servicio (SLI)
    • Monitorización
    • Observabilidad
  5. Herramientas SRE y automatización
    • Automatización definida
    • Foco en la automatización
    • Jerarquía de los tipos de automatización
    • Automatización segura
    • Herramientas de automatización
  6. Anti-fragilidad y aprender del fallo
    • Por qué aprender del fallo
    • Beneficios de la anti-fragilidad
    • Cambiar el balance organizacional
  7. Impacto organizacional de SRE
    • Por qué las organizaciones optan por SRE
    • Patrones para la adopción de SRE
    • Necesidades de guardia (on-call)
    • Post-mortem sin culpa
    • SRE y escalado

Metodología

Curso remoto, activo y participativo. El docente introducirá los contenidos haciendo uso del método demostrativo, los participantes asimilarán los conocimientos mediante las prácticas de aplicación real.

Certificaciones

Evaluación continua en base a las actividades realizadas en grupo y/o individualmente. El formador proporcionará feedback de forma continuada/al final de las actividades/individualmente a cada participante.

 

VER CERTIFICACIÓN

 

Las condiciones de los servicios adicionales de Certificación están sujetos a los términos del propietario de la licencia o de la entidad certificadora autorizada.

Acreditación

Se emitirá Certificado de Asistencia sólo a los alumnos con una asistencia superior al 75% y Diploma aprovechamiento si superan también la prueba de evaluación.