Como Sr. Site Reliability Engineer (SRE), serás responsable de garantizar la confiabilidad, disponibilidad y rendimiento de nuestros sistemas y aplicaciones. Trabajarás estrechamente con los equipos de desarrollo y operaciones para implementar prácticas de confiabilidad y resiliencia, automatizar procesos y resolver incidentes críticos. Tu experiencia y conocimientos serán fundamentales para mejorar la infraestructura y los servicios de la empresa.
Responsabilidades:
* Diseñar, implementar y mantener infraestructuras de alta disponibilidad y escalabilidad en entornos de producción.
* Desarrollar y gestionar herramientas de monitoreo y alerta para asegurar la salud y el rendimiento de los sistemas.
* Implementar y optimizar pipelines de CI/CD para automatizar despliegues y pruebas.
* Colaborar con los equipos de desarrollo para diseñar aplicaciones resilientes y escalables.
* Resolver incidentes críticos y realizar análisis postmortem para prevenir problemas futuros.
* Gestionar la capacidad y el rendimiento del sistema para asegurar que cumplan con los SLAs establecidos.
* Desarrollar y mantener documentación técnica y procedimientos operativos.
* Aplicar principios de SRE, incluyendo la gestión de SLIs, SLOs y SLAs.
Habilidades y Tecnologías:
* Experiencia con plataformas de nube pública como AWS, Azure o Google Cloud Platform.
* Conocimiento avanzado de herramientas de monitoreo y alerta como Datadog, Prometheus, Grafana, ELK Stack.
* Habilidades en lenguajes de scripting y programación como Js, Python, Go o Bash.
* Experiencia en la implementación y gestión de contenedores y orquestadores de contenedores como Docker y Kubernetes.
* Conocimiento de prácticas de CI/CD y herramientas como Github actions, AWS Code Pipeline, Jenkins, GitLab CI.
* Experiencia en la implementación de soluciones de alta disponibilidad y recuperación ante desastres.
* Comprensión profunda de los principios de SRE, incluyendo gestión de la capacidad, SLIs, SLOs y SLAs.
* Experiencia en la automatización de tareas operativas y de infraestructura utilizando herramientas de infraestructura como Código (IaC) como Terraform, CloudFormation o Ansible.
* Conocimiento en bases de datos SQL y NoSQL, y experiencia en su gestión en entornos de nube.
* Familiaridad con sistemas de archivos distribuidos y almacenamiento de objetos como Amazon S3 o Google Cloud Storage.
* Experiencia en la implementación de políticas de seguridad y cumplimiento en entornos de nube.
* Conocimiento de arquitecturas de microservicios y su gestión en la nube.
Beneficios:
* 15 días de vacaciones desde el primer año.
* Equipo de trabajo.
* Aguinaldo de 15 días.
* Seguro de Gastos Médicos Mayores.
* 5 días de salud mental al año.
* 5 días personales al año.
* 90 días de maternidad y paternidad.
La equidad y diversidad importan
Orbi es un empleador igualitario. Es política de Orbi brindar igualdad de oportunidades en la carrera y el desarrollo. Creemos en la igualdad real para todos, por lo que, a través de nuestra política de inclusión, buscamos proporcionar un ambiente de trabajo diverso y equitativo para todos nuestros colaboradores.
#J-18808-Ljbffr