Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Se busca Ingeniero de Datos ETL con experiencia en Python (PySpark) y Azure Synapse Analytics para una consultora de software. El rol es 100% remoto para Latinoamérica.

Por qué aplicar

Ideal para desarrolladores apasionados que buscan un entorno dinámico y colaborativo. Aporta a proyectos desafiantes y crece en una comunidad que valora el trabajo en equipo.

Descripción del puesto

Bluelight es una consultora de software líder dedicada a diseñar y desarrollar tecnología innovadora que mejora la vida de los usuarios. Con un firme compromiso de brindar un servicio excepcional a nuestros clientes, Bluelight se destaca en su enfoque en la calidad y la satisfacción del cliente. Nuestra misión no es solo crear aplicaciones de vanguardia, sino también fomentar un entorno de trabajo colaborativo y enriquecedor donde cada miembro del equipo pueda crecer y prosperar. Con presencia en Estados Unidos y América Central/del Sur, Bluelight se encuentra en una emocionante fase de expansión, buscando continuamente talento excepcional para unirse a su comunidad dinámica y diversa. Como ETL Data Engineer, desempeñarás un papel fundamental en el equipo de ingeniería de datos de nuestro cliente, diseñando, desarrollando y manteniendo procesos de integración de datos principalmente utilizando Python (PySpark) y Azure Synapse Analytics para garantizar la precisión y disponibilidad de los datos analíticos. Trabajando en estrecha colaboración con científicos de datos, analistas y otras partes interesadas para entregar datos de alta calidad para insights y toma de decisiones, este puesto es ideal para un profesional apasionado por el desarrollo de software que prospera en un entorno dinámico y de ritmo rápido donde las opiniones y los esfuerzos de todos son valorados. Al unirte a la consultora de software en crecimiento de nuestro cliente, tendrás la oportunidad de contribuir a proyectos desafiantes y líderes en el mercado dentro de una comunidad colaborativa que valora profundamente el trabajo duro, el aprendizaje continuo, el crecimiento personal y el desarrollo profesional. Responsabilidades: - ETL Data Engineering: Desarrollar y mantener procesos de ETL Data Engineering utilizando Python (PySpark) dentro de Azure Synapse Analytics Notebooks y/o Azure Synapse Analytics Pipelines, para garantizar extracciones, transformaciones y cargas de datos eficientes. - Data Warehousing: Aplicar tu experiencia en data warehousing, comprendiendo esquemas en estrella, hechos y dimensiones, para diseñar y construir estructuras de almacenamiento de datos efectivas en un Massively Parallel Processing (MPP) SQL Pool. - Data Source Expertise: Extraer datos de diversas fuentes, incluyendo REST APIs, tablas de bases de datos SQL y archivos CSV. - Azure Synapse Analytics Expertise: Utilizar tu profundo conocimiento de Azure Synapse Analytics para diseñar y optimizar notebooks/pipelines de datos para escalabilidad y rendimiento. - Data Fabric Concepts: Contribuir a la implementación y comprensión de otros conceptos de Data Fabric, como data lakes, lakehouses, delta lakes y data cataloging, para mejorar las capacidades de gestión de datos. - Data Modeling: Colaborar con arquitectos de datos para crear modelos y esquemas de datos que se alineen con los requisitos del negocio. - Data Quality: Implementar procesos de validación y calidad de datos para mantener la precisión y consistencia de los datos. - Performance Tuning: Identificar y resolver cuellos de botella de rendimiento y optimizar notebooks/pipelines de ETL de datos para cumplir con los SLAs. - Monitoring and Troubleshooting: Monitorear trabajos de ETL, diagnosticar problemas e implementar soluciones para garantizar la confiabilidad de los pipelines de datos. - Documentation: Mantener documentación completa de los procesos de ETL Data Engineering, flujos de datos y transformaciones de datos. - Collaboration: Trabajar en estrecha colaboración con equipos multifuncionales para comprender los requisitos de datos y brindar soporte para iniciativas relacionadas con datos. - Security and Compliance: Garantizar la seguridad de los datos y el cumplimiento de los estándares de gobernanza y privacidad de datos. Calificaciones: - Título de Grado en Ciencias de la Computación, Tecnología de la Información o un campo relacionado; o experiencia laboral equivalente, con certificaciones relacionadas con data engineering o data science (ej. Azure Data Engineer) como un plus. - Experiencia comprobada en ETL Data Engineering con experiencia significativa en el uso de Python (PySpark) para realizar extracción, transformación y carga de datos desde REST APIs, tablas de bases de datos SQL y archivos CSV. - Dominio en el uso de recursos de Azure Synapse Analytics, incluyendo Notebooks, Pipelines, Linked Services y Azure Key Vault. - Capacidad demostrada para escribir consultas SQL complejas, optimizar el rendimiento de las consultas y trabajar tanto con SparkSQL como con MS SQL para extraer, transformar y cargar datos de manera efectiva. - Conocimiento de las mejores prácticas y herramientas de integración de datos. - Experiencia con sistemas de control de versiones, como Git (Azure DevOps). - Sólidas habilidades de resolución de problemas y analíticas, con una gran atención al detalle. - Excelentes habilidades de comunicación, tanto verbales como escritas, con la capacidad de trabajar en colaboración en un entorno de equipo con prioridades cambiantes. - Familiaridad con tecnologías de big data, machine learning y análisis de datos preferida. - Experiencia con herramientas de visualización de datos (ej. Power BI, Tableau) y Metodologías Ágiles como un plus.

Responsabilidades

Develop and maintain ETL data engineering processes using Python (PySpark) within Azure Synapse Analytics Notebooks, and/or Azure Synapse Analytics Pipelines, to ensure efficient data extractions, transformation, and loading.
Apply expertise in data warehousing, understanding star schemas, facts, and dimensions, to design and build effective data storage structures in a Massively Parallel Processing (MPP) SWL Pool.
Extract data from various sources, including REST APIs, SWL database tables, and CSV files.
Utilize deep knowledge of Azure Synapse Analytics to design and optimize data notebooks/pipelines for scalability and performance.
Contribute to the implementation and understanding of other Data Fabric concepts, such as data lakes, lakehouses, delta lakes, and data cataloging, to enhance data management capabilities.
Collaborate with data architects to create data models and schemas that align with business requirements.

Skills requeridas

ETL data engineeringPython (PySpark)Azure Synapse AnalyticsData WarehousingStar schemasFacts and DimensionsMPP SQL PoolREST APIsSQL database tablesCSV filesData Fabric conceptsData lakes

Trabajos similares

Data Engineer

AllataBuenos Aires

Remoto

Más ofertas de Bluelightconsulting

Azure Data Engineer - Remote, Latin America

BluelightconsultingMendoza

Remoto

Explorar empleos relacionados

Empleos remotos Empleos en Buenos Aires

¿Te interesa empleos en Buenos Aires? Creá una alerta y te avisamos.

Ingeniero de Datos ETL

Descripción del puesto

Responsabilidades

Skills requeridas

Trabajos similares

Data Engineer

Más ofertas de Bluelightconsulting

Azure Data Engineer - Remote, Latin America

Explorar empleos relacionados

Senior Azure Data Engineer

Data Engineer

Data Engineer

Data Engineer

Data Engineer

Data Engineer - Remote, Latin America

Azure Data Engineer - Remote, Latin America

Data Engineer - Remote, Latin America