MedCofMedCof Tech
← Voltar às vagas

Dados · PJ · Remoto

Engenheiro(a) de Dados Sênior

Sobre a vaga

A MedCof é uma edtech focada na preparação para residência médica, com ecossistema digital em escala (milhares de alunos ativos e grande volume de dados e interações).

O desafio

Evolução da plataforma de dados e consolidação de cultura orientada a dados, com autonomia, decisão técnica e influência no time. Ambiente colaborativo, ágil e remoto.

Responsabilidades

  • Projetar, construir e evoluir pipelines escaláveis (batch e/ou streaming)
  • Definir e disseminar padrões de modelagem e boas práticas
  • Definir e evoluir arquitetura de dados (data lake, lakehouse)
  • Traduzir necessidades de negócio em soluções de dados com stakeholders
  • Qualidade, confiabilidade, observabilidade e governança dos dados
  • Sustentação e melhoria contínua de pipelines e sistemas existentes
  • Apoio a refinamento e planejamento de sprints

Diferenciais

  • Processamento distribuído (ex.: Apache Spark)
  • Orquestração com Apache Airflow
  • Lakehouse (Iceberg, Delta Lake)
  • dbt
  • GCP

Stack atual (contexto)

AWS (S3, ECS, Lambda, Athena, Step Functions, entre outros), data lake/lakehouse, Python, Terraform.

Soft skills

Autonomia e ownership, comunicação com áreas técnicas e de negócio, pensamento crítico sobre qualidade dos dados, decisões técnicas justificadas.

Requisitos

  • Experiência avançada em SQL

  • Experiência com Python (ou linguagem equivalente para dados)

  • Construção e manutenção de pipelines ETL/ELT

  • Experiência profunda em serviços AWS

  • Orquestração de workflows de dados

  • Versionamento com Git

  • Infraestrutura como código com Terraform

Candidatura