Ingeniero/a de Confiabilidad del Sitio (SRE) | Remoto
¿Estás buscando nuevos desafíos y un lugar donde puedas disfrutar de un ambiente cercano mientras aprendes constantemente?
¡Bienvenido a un equipo con un propósito claro: "TRANSFORMAR la vida de las personas siendo el aliado TECNOLÓGICO más confiable"! 🚀
¡Prepárate y únete a esta aventura!
¿Qué encontrarás?
- Retos técnicos y personales que te mantendrán en constante crecimiento.🤝 Un equipo conectado, enfocado en tu bienestar físico y mental.
- Cultura de mejora continua, fresca y colaborativa, con oportunidades de aprendizaje y gente dispuesta a apoyarte.
- KaizenHub, un programa diseñado para potenciar tus talentos, con feedback, mentorías y coaching a través de Sofka U. ¡Será un reto y un juego a la vez! 🧠🎮
- Programas como Happy Kaizen y WeSofka que cuidan tu bienestar físico y emocional.
¿Qué buscamos?
Solida experiencia en la implementación de estrategias de observabilidad y resiliencia. Eres el candidato/a ideal si te apasiona actuar como un embajador tecnológico, promoviendo las mejores prácticas en automatización, visibilidad y capacidad de respuesta ante fallas dentro de equipos ágiles y dinámicos. Tu dominio de los principios SRE, DevOps y arquitecturas Cloud será fundamental para el éxito.
Este rol es una oportunidad única para liderar la evolución de nuestras plataformas, asegurando que nuestros sistemas no solo sean robustos y escalables, sino que también cuenten con una capacidad de recuperación excepcional. Tu trabajo tendrá un impacto directo en la fiabilidad de nuestros servicios críticos, mejorando la experiencia de nuestros usuarios y fortaleciendo la columna vertebral tecnológica de nuestro negocio.
Responsabilidades
- Comprender y traducir las iniciativas de cada tribu y sus implicancias técnicas para asegurar la alineación tecnológica.
- Adaptar las necesidades de observabilidad a cada solución, garantizando una cobertura y visibilidad completas.
- Configurar y mantener dashboards, métricas, alertas y controles relevantes para una monitorización proactiva.
- Asegurar la calidad técnica de la observabilidad en los journeys críticos, validando la eficiencia y escalabilidad.
- Implementar patrones de resiliencia como circuit breakers, fallbacks y retries para fortalecer la arquitectura.
- Utilizar herramientas como Ansible y Terraform para automatizar tareas operativas y de infraestructura.
- Implementar flujos de autoremediación para reducir el Tiempo Medio de Recuperación (MTTR).
- Evangelizar y formar a los equipos sobre las mejores prácticas SRE, observabilidad y resiliencia.
Conocimientos Técnicos
- Herramientas de Observabilidad: Dynatrace (incluyendo extensiones custom), Grafana, Zabbix, ElasticSearch, Fluentd, Prometheus.
- Lenguajes y Automatización: Python, Ansible, Monaco, Terraform.
- Plataformas y Principios: ServiceNow CMDB, ITSM. Sólidos conocimientos en principios de arquitectura distribuida y resiliente (circuit breakers, fallbacks).
- Certificaciones (deseables): Observability Practitioner, Grafana Labs, Datadog, Chaos Engineering, o similares.
Condiciones
- Contrato a término indefinido ¡Queremos relaciones a largo plazo y que seas parte de nuestra familia por mucho tiempo!
- ¿Buscas crecimiento profesional? En Sofka, te ofrecemos un ecosistema de aprendizaje con múltiples herramientas para cerrar brechas y potenciar tus habilidades. ¡Tú decides cómo quieres crecer! 📚
- Área
- Cloud
- Ubicaciones
- Ecuador, LATAM, Uruguay
- Estado remoto
- Completamente remoto
¿Ya trabajas en Sofka?
Ayúdanos a encontrar a tu próximo compañero/a.