Data Engineer (Python - PySpark - AWS)
Arelance
Data ScienceRemoto🇪🇸 España
💰 33K - 42K/€
pythonetlaws
7 horas, 11 minutos
Detalles de la oferta
En este momento buscamos un/a Data Engineer con fuerte componente backend y mínimo 3 años de experiencia para incorporarse a un proyecto orientado al procesamiento de datos, calidad, auditoría y evolución de un engine principal basado en Python y PySpark. El perfil trabajará en entornos AWS, con buenas prácticas DevOps y exposición a GenAI y desarrollo de APIs.
🎯 Responsabilidades
- Desarrollo, mantenimiento y optimización de flujos ETL en Python y PySpark.
- Evolución del engine principal de datos y su librería asociada.
- Diseño y ejecución de consultas SQL avanzadas para:
- Auditoría y control de calidad de datos
- Cruces entre tablas
- Validación de claves primarias
- Detección de duplicados
- Identificación de errores entre origen y proceso
- Uso de Git/GitHub para control de versiones, branching y revisión de código.
- Interpretación y soporte de pipelines CI/CD en Jenkins, ejecución de builds y diagnóstico de fallos.
Trabajo con servicios core de AWS:
- S3 (almacenamiento)
- Athena (consultas y depuración)
- SageMaker (revisión y despliegue de procesos)
✅ Requisitos imprescindibles
- Titulación en Informática, Telecomunicaciones, Ingeniería o similar.
Experiencia avanzada en:
- Python y PySpark (ETLs, optimización, procesamiento de datos)
- SQL avanzado aplicado a auditoría y control de calidad de datos
Conocimientos sólidos en:
- Git y GitHub
- CI/CD con Jenkins
- Experiencia práctica en AWS, especialmente: S3, Athena, SageMaker
⭐ Requisitos valorables
AWS y Arquitecturas
- Experiencia con AWS Lambda y AWS Fargate.
- Monitorización con CloudWatch.
- Gestión de flujos, métricas y trazas con Kinesis.
- GenAI y Desarrollo Backend
Experiencia en desarrollo de agentes basados en LLMs (OpenAI, LangGraph).
Prompt Engineering avanzado, especialmente para:
- Integraciones con búsquedas web
- Desarrollo de agentes inteligentes
- Desarrollo de APIs con FastAPI.
- Observabilidad y trazabilidad con OpenTelemetry.
Negocio y Gestión
- Familiaridad con conceptos financieros y negocio core para una correcta interpretación de los datos.
- Uso habitual de Jira para seguimiento de tareas e incidencias.
- Nivel avanzado de Excel para análisis rápidos y cruces ad-hoc.
Condiciones
- Contrato indefinido con Arelance
- Modalidad en remoto desde España
Salario
💰 33 000 - 42 000 €/anuales
Localización
🇪🇸 España
- 👉 Mencione que viene de RemotoList cuando solicite este trabajo. Esto hará que más empresas confien en nosotros.
- 💂♀️ ¡Cuidado con las estafas! Al solicitar un empleo, NUNCA debería tener que pagar por nada. Verifique siempre que realmente está hablando con la empresa y no con un impostor. Una buena idea es verificar que el nombre de dominio del sitio web y el correo electrónico conciden.
Empleos similares
C
Analista Funcional Senior PL/SQL
CAS TRAINING
C
Consultor/a en Power BI
CAS TRAINING
C
Big Data Developer
CAS TRAINING
S
Senior GenAI Engineer (Remote)
Social You
P
Ingeniero/a de IA en diseño 3D
PSS
M
Consultor/a de Datos con IA
Michael Page
P
Senior Data Engineer
Page Personnel
C
Arquitecto/a IA AZURE
CAS TRAINING
A
AI Engineer (3D Modeling & Computer Vision)
Arelance
P
AI Engineer
PSS
M
PM técnico Python/ Spypark (Sector Público)
Michael Page
C
Ingeniero/a Big Data AWS Senior
CAS TRAINING
C
Data Engineer / Backend Developer
CAS TRAINING
C
Analista Funcional Senior (PL/SQL)
CAS TRAINING
G
Data Engineer Python/Apache Spark/ Iceberg
Grupo NS
C
Ingeniero/a de Datos - Azure Databricks
CAS TRAINING
M
Data Engineer (h/m)
Michael Page
G
Data Engineer (Oracle OCI)
Grupo NS
G
Data Engineer (AWS/Spark/Python). Inglés
Grupo NS
C
Ingeniero/a Big Data AWS
CAS TRAINING