SRE Remoto
¿Estás buscando nuevos desafíos y un lugar donde puedas disfrutar de un ambiente cercano mientras aprendes constantemente?
¡Bienvenido a un equipo con un propósito claro: "TRANSFORMAR la vida de las personas siendo el aliado TECNOLÓGICO más confiable"! 🚀
¡Prepárate y únete a esta aventura!
¿Qué encontrarás?
Retos técnicos y personales que te mantendrán en constante crecimiento.🤝 Un equipo conectado, enfocado en tu bienestar físico y mental.
Cultura de mejora continua, fresca y colaborativa, con oportunidades de aprendizaje y gente dispuesta a apoyarte.
KaizenHub, un programa diseñado para potenciar tus talentos, con feedback, mentorías y coaching a través de Sofka U. ¡Será un reto y un juego a la vez! 🧠🎮
Programas como Happy Kaizen y WeSofka que cuidan tu bienestar físico y emocional.
¿Qué buscamos?
Solida experiencia en la implementación de estrategias de observabilidad y resiliencia. Eres el candidato/a ideal si te apasiona actuar como un embajador tecnológico, promoviendo las mejores prácticas en automatización, visibilidad y capacidad de respuesta ante fallas dentro de equipos ágiles y dinámicos. Tu dominio de los principios SRE, DevOps y arquitecturas Cloud será fundamental para el éxito.
Este rol es una oportunidad única para liderar la evolución de nuestras plataformas, asegurando que nuestros sistemas no solo sean robustos y escalables, sino que también cuenten con una capacidad de recuperación excepcional. Tu trabajo tendrá un impacto directo en la fiabilidad de nuestros servicios críticos, mejorando la experiencia de nuestros usuarios y fortaleciendo la columna vertebral tecnológica de nuestro negocio.
Responsabilidades
Comprender y traducir las iniciativas de cada tribu y sus implicancias técnicas para asegurar la alineación tecnológica.
Adaptar las necesidades de observabilidad a cada solución, garantizando una cobertura y visibilidad completas.
Configurar y mantener dashboards, métricas, alertas y controles relevantes para una monitorización proactiva.
Asegurar la calidad técnica de la observabilidad en los journeys críticos, validando la eficiencia y escalabilidad.
Implementar patrones de resiliencia como circuit breakers, fallbacks y retries para fortalecer la arquitectura.
Utilizar herramientas como Ansible y Terraform para automatizar tareas operativas y de infraestructura.
Implementar flujos de autoremediación para reducir el Tiempo Medio de Recuperación (MTTR).
Evangelizar y formar a los equipos sobre las mejores prácticas SRE, observabilidad y resiliencia.
Conocimientos Técnicos
Herramientas de Observabilidad: Dynatrace (incluyendo extensiones custom), Grafana, Zabbix, ElasticSearch, Fluentd, Prometheus.
Lenguajes y Automatización: Python, Ansible, Monaco, Terraform.
Plataformas y Principios: ServiceNow CMDB, ITSM. Sólidos conocimientos en principios de arquitectura distribuida y resiliente (circuit breakers, fallbacks).
Certificaciones (deseables): Observability Practitioner, Grafana Labs, Datadog, Chaos Engineering, o similares.
¡PRESENTATE y sé parte de esta historia!
Condiciones
Contrato a término indefinido ¡Queremos relaciones a largo plazo y que seas parte de nuestra familia por mucho tiempo!
¿Buscas crecimiento profesional? En Sofka, te ofrecemos un ecosistema de aprendizaje con múltiples herramientas para cerrar brechas y potenciar tus habilidades. ¡Tú decides cómo quieres crecer! 📚
- División
- Operaciones
- Ubicaciones
- Ecuador, Bogotá, Cali, Chile, Colombia, Medellín, Panamá, Uruguay
- Estado remoto
- Completamente remoto
¿Ya trabajas en Sofka?
Ayúdanos a encontrar a tu próximo compañero/a.