Dados · PJ · Remoto
Engenheiro(a) de Dados Sênior
Sobre a vaga
A MedCof é uma edtech focada na preparação para residência médica, com ecossistema digital em escala (milhares de alunos ativos e grande volume de dados e interações).
O desafio
Evolução da plataforma de dados e consolidação de cultura orientada a dados, com autonomia, decisão técnica e influência no time. Ambiente colaborativo, ágil e remoto.
Responsabilidades
- Projetar, construir e evoluir pipelines escaláveis (batch e/ou streaming)
- Definir e disseminar padrões de modelagem e boas práticas
- Definir e evoluir arquitetura de dados (data lake, lakehouse)
- Traduzir necessidades de negócio em soluções de dados com stakeholders
- Qualidade, confiabilidade, observabilidade e governança dos dados
- Sustentação e melhoria contínua de pipelines e sistemas existentes
- Apoio a refinamento e planejamento de sprints
Diferenciais
- Processamento distribuído (ex.: Apache Spark)
- Orquestração com Apache Airflow
- Lakehouse (Iceberg, Delta Lake)
- dbt
- GCP
Stack atual (contexto)
AWS (S3, ECS, Lambda, Athena, Step Functions, entre outros), data lake/lakehouse, Python, Terraform.
Soft skills
Autonomia e ownership, comunicação com áreas técnicas e de negócio, pensamento crítico sobre qualidade dos dados, decisões técnicas justificadas.
Requisitos
Experiência avançada em SQL
Experiência com Python (ou linguagem equivalente para dados)
Construção e manutenção de pipelines ETL/ELT
Experiência profunda em serviços AWS
Orquestração de workflows de dados
Versionamento com Git
Infraestrutura como código com Terraform