Empresa de tecnología busca un Ingeniero/a de Datos Senior/Lead para diseñar, construir y escalar pipelines de datos para una plataforma de aftermarket impulsada por IA. Se requiere experiencia en SQL, modelado dimensional, Python y dbt, con habilidades de liderazgo técnico.
Atractivo para ingenieros de datos experimentados que buscan liderar y escalar pipelines de datos críticos en una plataforma innovadora de aftermarket impulsada por inteligencia artificial.
SOBRE TRUELOGIC En Truelogic, somos un proveedor líder de servicios de externalización de personal (staff augmentation) nearshore con sede en Nueva York. Durante más de dos décadas, hemos estado entregando soluciones tecnológicas de primer nivel a empresas de todos los tamaños, desde startups innovadoras hasta líderes de la industria, ayudándolas a alcanzar sus objetivos de transformación digital. Nuestro equipo de más de 600 profesionales tecnológicos altamente calificados, con base en Latinoamérica, impulsa la disrupción digital asociándose con empresas de EE. UU. en sus proyectos más impactantes. Ya sea colaborando con gigantes de Fortune 500 o escalando startups, entregamos resultados que marcan la diferencia. Al postularte a esta posición, estás dando el primer paso para unirte a un equipo dinámico que valora tu experiencia y aspiraciones. Nuestro objetivo es alinear tus habilidades con oportunidades que fomenten un crecimiento profesional y éxito excepcionales, al tiempo que contribuyes a proyectos transformadores que dan forma al futuro. NUESTRO CLIENTE Empresa de software nativa de IA, bien financiada, que está construyendo una plataforma conectada que maximiza el mercado global de posventa de equipos para OEMs, distribuidores y flotas. Respaldada por una incubadora de IA de primer nivel y una empresa líder en fabricación de maquinaria pesada, ofrecen información impulsada por machine learning para optimizar inventario, servicio y ventas. RESUMEN DEL PUESTO Buscamos un Ingeniero de Datos altamente calificado y motivado para construir, mantener y escalar los pipelines de datos críticos que potencian una plataforma innovadora nativa de IA. En este rol, diseñarás arquitecturas robustas, asegurarás la calidad prístina de los datos e implementarás soluciones modernas de data stack para impulsar modelos de machine learning y analíticas de alto impacto. El candidato ideal es un experto en modelado de datos e ingeniería en Python que prospera en un entorno colaborativo, demostrando la profundidad técnica para ser dueño de pipelines complejos de principio a fin y la capacidad de liderazgo para mentorizar a colegas, establecer estándares arquitectónicos y dirigir la estrategia de datos general del equipo. RESPONSABILIDADES - Diseñar y construir pipelines de datos robustos e idempotentes desde cero utilizando un data stack moderno. - Diseñar esquemas star y snowflake, escribiendo SQL preciso y consciente del grano para construir data marts escalables. - Escribir código Python de nivel de producción, con pruebas unitarias a nivel de módulo, adhiriéndose a disciplinas de ingeniería sólidas como type hinting y testing. - Construir y probar modelos dbt en las capas staging, intermediate y mart, gestionando la estructura general del proyecto. - Crear y desplegar trabajos utilizando Databricks Asset Bundles (DAB) siguiendo patrones arquitectónicos documentados. - Implementar rigurosos controles de calidad de datos en las capas de origen, intermedias y de destino para prevenir caídas silenciosas de nulos o duplicados. - Mantener la gobernanza de datos a través de pruebas dbt exhaustivas y una estricta disciplina de documentación al momento de hacer merge. - Operar de forma segura dentro de una arquitectura multi-repositorio, utilizando service principals y asegurando cero credenciales personales en despliegues de producción. - Ejecutar verificaciones de exposición entre repositorios antes de hacer merge de cambios que rompan el esquema. - Ser dueño de los pipelines de datos de principio a fin, tomando decisiones clave de diseño técnico y mentorizando a ingenieros de nivel medio a través de revisiones de código sustantivas. - Definir la dirección técnica general en los sistemas de datos centrales, incluyendo estándares de modelado, estrategias de branching, umbrales de observabilidad y políticas de gestión de secretos. - Actuar como líder técnico para desbloquear al equipo y participar activamente en paneles de contratación para escalar la organización de ingeniería. CALIFICACIONES Y REQUISITOS DEL PUESTO - Experiencia en SQL y metodologías de modelado dimensional, incluyendo arquitectura medallion, SCDs y gestión de grano. - Capacidad comprobada para diseñar pipelines idempotentes utilizando estrategias incrementales, de checkpoint y replaceWhere. - Amplia experiencia con ingeniería de Python de nivel de producción, incluyendo type hints, pytest y ruff. - Sólida capacidad para diagnosticar y resolver fallos en trabajos Spark / PySpark utilizando herramientas como Spark UI. - Profundo conocimiento de las características de Delta Lake como MERGE, OPTIMIZE, Z-ORDER y time travel. - Experiencia práctica con dbt, incluyendo modelos, pruebas y exposiciones. - Experiencia en la creación y despliegue de trabajos utilizando Databricks Asset Bundles (DAB) y operando dentro de un entorno Unity Catalog. - Compromiso con la calidad de los datos a través de pre-write asserts, verificaciones de esquema y mantenimiento de pruebas de relación y unicidad en dbt. - Fuerte adherencia a flujos de trabajo disciplinados de Git, conventional commits y prácticas estrictas de documentación. - Experiencia en el aprovisionamiento y utilización de Service Principals, secretos de entorno de GitHub y herramientas de gestión de secretos como Azure Key Vault o Databricks secret scopes. - Sólidas habilidades de comunicación técnica escrita para descripciones de PR y runbooks, con la capacidad de traducir el trabajo de pipeline en métricas de negocio. - Habilidades comprobadas de toma de decisiones para navegar la ambigüedad y equilibrar compensaciones entre costo, latencia y confiabilidad. - Se prefiere experiencia liderando iniciativas técnicas, estableciendo estándares arquitectónicos y contribuyendo a rúbricas de entrevistas. - Se prefiere experiencia leyendo o modificando pipelines de Azure Data Factory (ADF) y familiaridad con Azure Data Lake storage. - La familiaridad con herramientas de observabilidad de dbt, como Elementary, es un plus. - Se prefiere conocimiento de las mejores prácticas de detección y enmascaramiento de PII. - La experiencia con patrones de configuración multi-tenant para incorporar nuevos tenants sin cambios de código es una gran ventaja. - La competencia en la lectura y edición de flujos de trabajo de GitHub Actions para el despliegue de Databricks es preferible. - La capacidad de tomar decisiones de cómputo conscientes del costo, seleccionando la forma de cluster apropiada por carga de trabajo, es un plus. - La competencia en herramientas de desarrollo asistido por IA como Claude Code para el trabajo diario y la revisión de código es preferible. - La experiencia escribiendo post-mortems de incidentes y coordinando entregas de funcionalidades con equipos de Data Science es un plus. QUÉ OFRECEMOS - Trabajo 100% Remoto: Disfruta de la libertad de trabajar desde la ubicación que te ayuda a prosperar. Todo lo que necesitas es una laptop y una conexión a internet confiable. - Pago Competitivo en USD: Gana una compensación excelente y líder en el mercado en USD, que va más allá de las ofertas típicas del mercado. - Tiempo Libre Remunerado: Valoramos tu bienestar. Nuestras políticas de tiempo libre remunerado aseguran que tengas la oportunidad de desconectar y recargar cuando sea necesario. - Trabaja con Autonomía: Disfruta de la libertad de gestionar tu tiempo siempre que el trabajo se complete. Enfócate en los resultados, no en el reloj. - Trabaja con las Mejores Empresas Estadounidenses: Amplía tu experiencia trabajando en proyectos innovadores y de alto impacto con empresas líderes en la industria de EE. UU. POR QUÉ TE GUSTARÁ TRABAJAR AQUÍ - Una Cultura que te Valora: Priorizamos el bienestar y el equilibrio entre la vida laboral y personal, ofreciendo actividades de engagement y fomentando equipos dinámicos para asegurar que prosperes tanto personal como profesionalmente. - Red Global Diversa: Conéctate con más de 600 profesionales en más de 25 países, expande tu red y colabora con un equipo multicultural de Latinoamérica. - Únete a Profesionales Calificados: Forma equipo con talento senior. Todos nuestros miembros del equipo son expertos experimentados, lo que garantiza que trabajes con los mejores en tu campo. ¡Postúlate ahora!