SRE Site Reliability Engineering
✨ ¿Estás buscando nuevos desafíos y un lugar donde puedas disfrutar de un ambiente cercano mientras aprendes constantemente?
¡Bienvenido a un equipo con un propósito claro: "TRANSFORMAR la vida de las personas siendo el aliado TECNOLÓGICO más confiable"! 🚀
¡Prepárate y únete a esta aventura!
¿Qué encontrarás?
Retos técnicos y personales que te mantendrán en constante crecimiento.
Un equipo conectado, enfocado en tu bienestar físico y mental.🌱
Cultura de mejora continua, fresca y colaborativa, con oportunidades de aprendizaje y gente dispuesta a apoyarte.
KaizenHub, un programa diseñado para potenciar tus talentos, con feedback, mentorías y coaching a través de Sofka U. ¡Será un reto y un juego a la vez! 🧠
Programas como Happy Kaizen y WeSofka que cuidan tu bienestar físico y emocional.
¿Qué buscamos?
Un estratega encargado de dar visibilidad total a servicios críticos, transformando millones de logs, métricas y trazas en decisiones de negocio. Si te apasiona la automatización, el troubleshooting avanzado y quieres liderar la cultura de Accountability técnica en un entorno de alta escala con Kubernetes y Multi-cloud, este es el lugar donde tu curiosidad técnica encontrará su mayor reto.
Tus Retos e Impacto
Tu rol es vital para la estabilidad para nuestro cliente, moviéndote entre la ingeniería profunda y la consultoría estratégica:
Ingeniería de Telemetría: Diseñarás y desplegarás pipelines de ingesta complejos (Kafka, Fluent Bit) y configurarás instrumentación avanzada con Dynatrace y Grafana.
Cultura de Datos (SLO/SLI): Traducirás necesidades de las tribus de negocio en indicadores de nivel de servicio (SLOs) que garanticen una experiencia de cliente superior.
Automatización & Self-healing: Crearás runbooks y automatizaciones (Python, Terraform, Ansible) para que el sistema aprenda a remediarse antes de que el usuario lo note.
Liderazgo en Crisis: Serás la voz experta en war-rooms y post-mortems, utilizando técnicas de tracing distribuido y AIOps para encontrar la causa raíz (RCA).
Eficiencia FinOps: Optimizarás la retención y cardinalidad de los datos, asegurando una visibilidad total sin disparar los costos de nube.
¿Qué necesitas?
Experiencia: 4 a 6 años liderando estrategias de monitoreo y observabilidad en entornos de alta disponibilidad.
Stack Especializado: Dominio experto de Dynatrace, Grafana y Zabbix.
Ingeniería de Datos: Diseño de pipelines de logs y transformación (Kafka, Fluent Bit).
Infraestructura Moderna: Gestión de performance en Kubernetes/EKS y servicios cloud (AWS, Azure o GCP).
Automatización: Scripting avanzado en Python o Bash y manejo de Infraestructura como Código (Terraform/Ansible).
Metodologías: Experiencia en marcos ágiles (Scrum/Kanban) y cultura SRE/DevSecOps.
Deseable
Conocimientos en FinOps aplicados a observabilidad.
Experiencia previa en el sector bancario o financiero (cumplimiento y seguridad).
Certificaciones oficiales en Dynatrace o Arquitectura Cloud.
Familiaridad con herramientas de AIOps para la supresión de ruido en alertas.
¡PRESENTATE y sé parte de esta historia!
Condiciones
Ubicación: Quito
Contrato a término indefinido o Contractor ¡Queremos relaciones a largo plazo y que seas parte de nuestra familia por mucho tiempo!
¿Buscas crecimiento profesional? En Sofka, te ofrecemos un ecosistema de aprendizaje con múltiples herramientas para cerrar brechas y potenciar tus habilidades. ¡Tú decides cómo quieres crecer!
- División
- Operaciones
- Área
- Desarrollo y Arquitectura
- Puesto
- Site Reliability Engineer
- Ubicaciones
- Ecuador
- Estado remoto
- Híbrido