Empresa busca Ingeniero/a de Datos Senior con 7+ años de experiencia para diseñar y operar infraestructura de datos en AWS, enfocándose en pipelines de RAG y sistemas de IA. Se requiere experiencia en AWS, sistemas distribuidos y modelos de lenguaje.
Si sos un/a Ingeniero/a de Datos con experiencia en AWS y te copan los desafíos de IA y RAG, este puesto remoto es para vos. Podés diseñar y operar infraestructura de datos a gran escala, trabajando con tecnologías de punta en un rol clave para la empresa.
Buscamos un Ingeniero de Datos Senior para diseñar y operar la infraestructura de datos en la nube que impulsa nuestras iniciativas de IA. Arquitectarás data lakes a escala de producción en AWS, construirás pipelines de ingesta y observabilidad en tiempo real, y serás responsable de las capas de búsqueda vectorial y embeddings que alimentan nuestros sistemas RAG y agentes autónomos. Experiencia General Requerida: - 7+ años en Ingeniería de Datos, Sistemas Distribuidos o Arquitectura de Datos - 4+ años arquitectando data lakes a escala de producción, niveles de almacenamiento y streaming de eventos en AWS - 2+ años construyendo sistemas RAG, gestionando embeddings y orquestando modelos fundacionales Conocimientos y Experiencia: - Arquitectura de Data Lake y Almacenamiento en AWS - Observabilidad en Tiempo Real y Análisis de Logs - Optimización, Vectorización y Embeddings en Elasticsearch & OpenSearch - Pipelines de IA Generativa y Amazon Bedrock - Ingeniería de Software e Ingesta de APIs - Nivel de producción en uno o más de los siguientes lenguajes: C# (.NET Core), Java, Python o Node.js Experiencia Preferida: - Estrategias de particionamiento de S3, políticas de ciclo de vida y formatos columnares (Parquet, Iceberg) en AWS - AWS Glue Data Catalog y Lake Formation para control de acceso multi-inquilino y granular - Optimización de consultas sobre datasets a escala de petabytes usando Amazon Athena y Redshift Spectrum - Configuración de collector oTel distribuido para captura y enrutamiento de logs, trazas y métricas a S3 - Streaming de alto volumen de logs de sistema, capturas de Datadog y eventos crudos de servidor a S3 - CDC en tiempo real desde PostgreSQL usando Debezium o AWS DMS - Clústeres de Amazon OpenSearch con búsqueda léxica y vectorial de alta dimensión simultánea - Gestión del ciclo de vida de índices de OpenSearch, estrategias de sharding y mapeos dinámicos a escala - APIs de modelos fundacionales de Amazon Bedrock (Claude, Titan) para enriquecimiento de datos, clasificación y análisis semántico - Knowledge Bases para Amazon Bedrock para chunking automático, extracción de metadatos y sincronización de índices vectoriales desde S3 - Pipelines ETL/ELT ingiriendo datos de eventos no estructurados desde APIs SaaS (ej. Pendo, Hotjar, Google Analytics) - Desarrollo de servidores MCP para exponer el contexto y utilidades del data lake a agentes de IA Beneficios: - Trabajo remoto. - 13 días feriados flotantes. - 15 días de vacaciones por año cumplido. - Buen ambiente de trabajo. Jalasoft es un empleador que ofrece igualdad de oportunidades. Consideramos a todos los candidatos calificados que cumplan con los requisitos descritos sin distinción. Nos comprometemos a tomar decisiones de empleo sin importar raza, edad, estado civil o social, origen nacional, discapacidad, sexo, identidad o expresión de género, u otras características o grupos de candidatos o empleados no relacionadas con sus calificaciones y idoneidad para el puesto.