Empresa busca un Ingeniero Senior de Confiabilidad de Sitio (SRE) para liderar la arquitectura, gobernanza y eficiencia de costos de su infraestructura en la nube. El rol es remoto para candidatos en LATAM.
Si buscás un rol remoto con autonomía para definir la arquitectura y las mejores prácticas de infraestructura en la nube, este puesto es para vos. Ideal para ingenieros SRE con ganas de liderar la eficiencia y escalabilidad de sistemas en LATAM.
Buscamos un/a Ingeniero/a de Confiabilidad de Sitio (Site Reliability Engineer) Senior que se encargue de la arquitectura, gobernanza y eficiencia de costos de nuestra infraestructura en la nube y de plataforma. En este rol, diseñarás y evolucionarás nuestros entornos de producción, definirás estándares y mejores prácticas, y colaborarás con los equipos de ingeniería y TI para construir sistemas escalables y confiables que sean fáciles de operar y rentables. Serás un líder técnico práctico: diseñando arquitecturas de referencia, construyendo pipelines de CI/CD y automatización, liderando prácticas de respuesta a incidentes y estableciendo directrices para la seguridad, confiabilidad y gestión de costos en nuestras plataformas. Este es un puesto de contratista remoto. Buscamos candidatos ubicados en LATAM. Responsabilidades Clave: Arquitectura y Propiedad de Infraestructura - Diseñar, implementar y evolucionar arquitecturas de infraestructura en la nube para alta disponibilidad, confiabilidad, seguridad y escalabilidad. - Definir y mantener arquitecturas y patrones de referencia para servicios, aplicaciones y entornos en toda la organización. - Desarrollar procesos de flujo de trabajo y estándares para construir, desplegar y mantener aplicaciones dentro de una arquitectura distribuida. - Liderar iniciativas de modernización de infraestructura (ej. contenerización, adopción de Kubernetes, infraestructura como código, consolidación de plataformas). Gobernanza, Estándares y Gestión de Costos - Establecer y hacer cumplir estándares de gobernanza para infraestructura, CI/CD, observabilidad y prácticas operativas. - Definir y mantener políticas para la gestión de entornos, control de acceso, gestión de configuración y gestión de cambios. - Implementar prácticas de gestión de costos (ej. etiquetado, alertas de presupuesto, dimensionamiento correcto, reservas/uso comprometido, políticas de escalado automático) para optimizar el gasto en la nube. - Colaborar con el liderazgo de producto e ingeniería para equilibrar el rendimiento, la confiabilidad y la eficiencia de costos en todos los entornos. - Utilizar métricas DORA y benchmarks de la industria para impulsar la mejora continua en el rendimiento de entrega y operaciones. CI/CD, Automatización y Operaciones - Diseñar, implementar y mantener pipelines de CI/CD para múltiples aplicaciones y entornos utilizando herramientas como Git, Azure DevOps, GitLab o Jenkins. - Desarrollar y gestionar pipelines de automatización para despliegue, configuración y gestión de infraestructura. - Construir y mantener sistemas de monitoreo, alertas y registro para garantizar la visibilidad, alta disponibilidad y rendimiento de aplicaciones y servicios. - Gestionar recursos y servicios de infraestructura en la nube para garantizar confiabilidad, seguridad y escalabilidad. Gestión de Incidentes y Confiabilidad - Liderar esfuerzos de respuesta a incidentes, incluyendo triaje, análisis de causa raíz y revisiones post-incidente. - Contribuir y mantener procesos de respuesta a incidentes, runbooks y prácticas de guardia (on-call). - Colaborar con los equipos de ingeniería para diseñar sistemas resilientes y reducir el tiempo medio de recuperación (MTTR). Liderazgo, Mentoría y Colaboración Interfuncional - Colaborar con los equipos de ingeniería de software, QA, producto y TI para determinar la mejor manera de abordar desafíos complejos de infraestructura, seguridad y entrega. - Mentorear a ingenieros en prácticas, herramientas y estándares de DevOps y plataforma en toda la organización. - Liderar iniciativas departamentales relacionadas con DevOps, ingeniería de plataforma y disciplinas de infraestructura; presentar planes y progreso a los interesados. - Impulsar nuevas iniciativas departamentales basadas en las necesidades organizacionales y tu experiencia en tecnologías modernas y tendencias de la industria. - Mantenerse actualizado sobre tecnologías emergentes, herramientas y mejores prácticas; evaluar su posible aplicación dentro de nuestro stack tecnológico. Experiencia Requerida: - Licenciatura o Maestría en Ciencias de la Computación, Ingeniería o un campo técnico relacionado, o experiencia práctica equivalente. - Más de 6 años de experiencia con servicios de orquestación de contenedores (preferentemente Kubernetes). - Más de 6 años de experiencia administrando y desplegando herramientas de CI/CD (ej. Git, Azure DevOps, Jira, GitLab, Jenkins). - Más de 6 años de experiencia gestionando aplicaciones escalables en uno o más proveedores de nube importantes. - Más de 8 años de experiencia significativa con entornos de sistemas operativos Windows y Linux. - Más de 7 años de experiencia con scripting y automatización utilizando herramientas como PowerShell, Bash o Python. - Más de 4 años de experiencia con plataformas de infraestructura como código y orquestación (ej. Terraform, ARM/Bicep, CloudFormation, Ansible, etc.). - Experiencia demostrada en el diseño de arquitecturas para stacks tecnológicos escalables, confiables y seguros en sistemas distribuidos. - Experiencia demostrada en la implementación de procesos de flujo de trabajo para operar y mantener aplicaciones en arquitecturas distribuidas. Calificaciones y Habilidades: - Sólida experiencia trabajando en entornos de desarrollo de software con inclinación ágil y en diversos stacks de aplicaciones. - Profundo conocimiento de las mejores prácticas y operaciones de TI en arquitecturas distribuidas y nativas de la nube. - Experiencia en la definición e implementación de gobernanza y directrices en torno a infraestructura, CI/CD y seguridad. - Sólida comprensión de la gestión de costos en la nube y técnicas de optimización (ej. análisis de uso, dimensionamiento correcto, políticas de escalado). - Excelentes habilidades para la resolución de problemas, solución de problemas y gestión de incidentes. - Excelentes habilidades de comunicación oral y escrita; capaz de presentar conceptos técnicos complejos a audiencias técnicas y no técnicas. - Orientado a procesos con sólidas habilidades de documentación y atención al detalle. - Capacidad para traducir requisitos de producto o plataforma vagamente definidos en soluciones técnicas robustas y escalables. Compensación mensual total: $4,000 — $5,000 USD