Resilientco busca un Ingeniero de Datos Senior con experiencia en Python, procesamiento de datos a gran escala y desarrollo de aplicaciones backend. El rol implica diseñar, desarrollar y mantener pipelines de datos, APIs escalables y soluciones de machine learning, colaborando con equipos distribuidos globalmente.
Si sos un ingeniero de datos con experiencia en Python y te copan los desafíos de big data y machine learning, este puesto remoto te va a volar la cabeza. Vas a poder diseñar y desarrollar soluciones escalables colaborando con equipos de todo el mundo.
Buscamos un Ingeniero de Datos Senior de Python con profunda experiencia en procesamiento de datos a gran escala, computación distribuida y desarrollo de aplicaciones backend. Este rol es ideal para un ingeniero experimentado que haya construido aplicaciones intensivas en datos, implementado soluciones de ciencia de datos y aprendizaje automático, y desarrollado APIs altamente escalables capaces de manejar grandes volúmenes de datos. El candidato ideal poseerá sólidas habilidades de desarrollo en Python, experiencia práctica con PySpark y ecosistemas de big data, experiencia en bases de datos relacionales y NoSQL, y una sólida comprensión de los flujos de trabajo de ciencia de datos y aprendizaje automático. Esta persona colaborará estrechamente con científicos de datos, arquitectos, equipos de producto y equipos de ingeniería globales para ofrecer soluciones escalables y de alto rendimiento que impulsen los resultados del negocio. Este rol requiere tanto una sólida ejecución técnica como la capacidad de colaborar eficazmente en equipos distribuidos, incluidos stakeholders externos y globales. Responsabilidades Clave Desarrollo de Aplicaciones Python - Diseñar, desarrollar y mantener aplicaciones y servicios Python escalables. - Construir componentes de código reutilizables, mantenibles y bien documentados. - Desarrollar servicios y APIs backend utilizando Django y/o Flask. - Participar en revisiones de arquitectura y discusiones de diseño técnico. - Solucionar problemas y optimizar sistemas de producción. Ingeniería de Big Data - Desarrollar y optimizar pipelines de procesamiento de datos a gran escala utilizando PySpark. - Procesar, transformar y analizar grandes conjuntos de datos estructurados y no estructurados. - Construir frameworks escalables de ETL e ingesta de datos. - Optimizar cargas de trabajo de procesamiento de datos distribuidos para rendimiento y confiabilidad. - Manejar conjuntos de datos de gran volumen en entornos empresariales. Ciencia de Datos y Aprendizaje Automático - Implementar algoritmos de ciencia de datos y modelos predictivos en entornos de producción. - Colaborar con científicos de datos para operacionalizar soluciones de aprendizaje automático. - Desarrollar y optimizar pipelines de ML utilizando scikit-learn y bibliotecas relacionadas. - Apoyar procesos de despliegue, validación y monitoreo de modelos. - Traducir requisitos analíticos en soluciones de ingeniería escalables. Procesamiento y Análisis de Datos - Realizar actividades complejas de manipulación, limpieza y transformación de datos. - Construir pipelines de datos utilizando: - Pandas - NumPy - PyArrow - PySpark - Mejorar la calidad, consistencia y eficiencia del procesamiento de datos. - Desarrollar soluciones para manejar conjuntos de datos a gran escala y cargas de trabajo analíticas. Desarrollo de APIs - Diseñar y desarrollar APIs RESTful que soporten operaciones de datos de alto volumen. - Construir servicios seguros y escalables capaces de manejar un rendimiento significativo. - Implementar monitoreo, registro y optimización de rendimiento de APIs. - Apoyar integraciones con sistemas internos y externos. Desarrollo de Bases de Datos - Diseñar y optimizar patrones de acceso a datos en bases de datos relacionales y NoSQL. - Trabajar con: - PostgreSQL - MySQL - SQL Server - Oracle - Desarrollar consultas SQL eficientes e integraciones de bases de datos. - Trabajar con plataformas NoSQL como: - Cassandra - HBase - Almacenes de datos distribuidos similares Excelencia en Ingeniería de Software - Seguir estándares de codificación establecidos y mejores prácticas de desarrollo de software. - Desarrollar pruebas automatizadas unitarias, de integración y de regresión. - Participar en revisiones de código entre pares y revisiones de arquitectura. - Asegurar que las soluciones cumplan con los requisitos de rendimiento, escalabilidad y mantenibilidad. - Contribuir a las mejores prácticas de CI/CD y DevOps. Colaboración y Liderazgo - Asociarse con gerentes de producto, arquitectos, científicos de datos, stakeholders de negocio y equipos de ingeniería. - Colaborar con equipos presenciales y remotos en múltiples zonas horarias. - Participar en ceremonias y actividades de planificación Agile. - Mentorear a desarrolladores junior y proporcionar orientación técnica. - Impulsar discusiones técnicas e influir en la dirección de ingeniería. Calificaciones Requeridas Experiencia - Más de 8 años de experiencia profesional en desarrollo Python. - Experiencia comprobada en el desarrollo de aplicaciones a escala empresarial y soluciones de procesamiento de datos. - Experiencia trabajando con conjuntos de datos a gran escala y plataformas de big data. - Experiencia colaborando en equipos globales y distribuidos. Desarrollo Python - Habilidades de programación Python a nivel experto. - Sólida comprensión de los principios de programación orientada a objetos. - Experiencia en el desarrollo de aplicaciones escalables y mantenibles. Frameworks - Sólida experiencia con: - Django - Flask - Experiencia en la construcción de APIs REST de nivel de producción. Tecnologías de Big Data - Sólida experiencia práctica con: - PySpark - Procesamiento de datos distribuido - Pipelines ETL a gran escala - Experiencia en el manejo de conjuntos de datos de alto volumen. Ciencia de Datos y Aprendizaje Automático - Experiencia en la implementación y operacionalización de algoritmos de ciencia de datos. - Experiencia práctica con: - scikit-learn - Flujos de trabajo de aprendizaje automático - Integración y despliegue de modelos Bibliotecas de Procesamiento de Datos - Experiencia utilizando: - Pandas - NumPy - PyArrow - Otras bibliotecas de procesamiento de datos en Python Bases de Datos - Sólida experiencia con bases de datos relacionales: - PostgreSQL - SQL Server - Oracle - MySQL - Sólidas habilidades de desarrollo SQL. Bases de Datos NoSQL - Experiencia con: - Cassandra - HBase - Otras plataformas NoSQL distribuidas Prácticas de Ingeniería - Fuerte compromiso con: - Pruebas automatizadas - Revisiones de código - CI/CD - Control de versiones - Mejores prácticas de ingeniería de software Compromiso y Logística Duración del Compromiso: 12+ meses. Zona Horaria: PST - 8:00 AM - 5:00 PM Calendario de Feriados: Feriados del Cliente (EE. UU. – Obligatorio) Equipamiento: Proporcionado por el cliente. Proceso de Selección Reunión con el equipo de Resilient Co. con preguntas KO. Entrevista técnica 2 entrevistas con el cliente