Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Empresa busca Ingeniero/a de Datos Senior con 7+ años de experiencia para diseñar y operar infraestructura de datos en AWS, enfocándose en pipelines de RAG y sistemas de IA. Se requiere experiencia en AWS, sistemas distribuidos y modelos de lenguaje.

Por qué aplicar

Si sos un/a Ingeniero/a de Datos con experiencia en AWS y te copan los desafíos de IA y RAG, este puesto remoto es para vos. Podés diseñar y operar infraestructura de datos a gran escala, trabajando con tecnologías de punta en un rol clave para la empresa.

Descripción del puesto

Buscamos un Ingeniero de Datos Senior para diseñar y operar la infraestructura de datos en la nube que impulsa nuestras iniciativas de IA. Arquitectarás data lakes a escala de producción en AWS, construirás pipelines de ingesta y observabilidad en tiempo real, y serás responsable de las capas de búsqueda vectorial y embeddings que alimentan nuestros sistemas RAG y agentes autónomos. Experiencia General Requerida: - 7+ años en Ingeniería de Datos, Sistemas Distribuidos o Arquitectura de Datos - 4+ años arquitectando data lakes a escala de producción, niveles de almacenamiento y streaming de eventos en AWS - 2+ años construyendo sistemas RAG, gestionando embeddings y orquestando modelos fundacionales Conocimientos y Experiencia: - Arquitectura de Data Lake y Almacenamiento en AWS - Observabilidad en Tiempo Real y Análisis de Logs - Optimización, Vectorización y Embeddings en Elasticsearch & OpenSearch - Pipelines de IA Generativa y Amazon Bedrock - Ingeniería de Software e Ingesta de APIs - Nivel de producción en uno o más de los siguientes lenguajes: C# (.NET Core), Java, Python o Node.js Experiencia Preferida: - Estrategias de particionamiento de S3, políticas de ciclo de vida y formatos columnares (Parquet, Iceberg) en AWS - AWS Glue Data Catalog y Lake Formation para control de acceso multi-inquilino y granular - Optimización de consultas sobre datasets a escala de petabytes usando Amazon Athena y Redshift Spectrum - Configuración de collector oTel distribuido para captura y enrutamiento de logs, trazas y métricas a S3 - Streaming de alto volumen de logs de sistema, capturas de Datadog y eventos crudos de servidor a S3 - CDC en tiempo real desde PostgreSQL usando Debezium o AWS DMS - Clústeres de Amazon OpenSearch con búsqueda léxica y vectorial de alta dimensión simultánea - Gestión del ciclo de vida de índices de OpenSearch, estrategias de sharding y mapeos dinámicos a escala - APIs de modelos fundacionales de Amazon Bedrock (Claude, Titan) para enriquecimiento de datos, clasificación y análisis semántico - Knowledge Bases para Amazon Bedrock para chunking automático, extracción de metadatos y sincronización de índices vectoriales desde S3 - Pipelines ETL/ELT ingiriendo datos de eventos no estructurados desde APIs SaaS (ej. Pendo, Hotjar, Google Analytics) - Desarrollo de servidores MCP para exponer el contexto y utilidades del data lake a agentes de IA Beneficios: - Trabajo remoto. - 13 días feriados flotantes. - 15 días de vacaciones por año cumplido. - Buen ambiente de trabajo. Jalasoft es un empleador que ofrece igualdad de oportunidades. Consideramos a todos los candidatos calificados que cumplan con los requisitos descritos sin distinción. Nos comprometemos a tomar decisiones de empleo sin importar raza, edad, estado civil o social, origen nacional, discapacidad, sexo, identidad o expresión de género, u otras características o grupos de candidatos o empleados no relacionadas con sus calificaciones y idoneidad para el puesto.

Responsabilidades

Diseñar y operar la infraestructura de datos en la nube
Arquitectar data lakes a escala de producción en AWS
Construir pipelines de ingesta y observabilidad en tiempo real
Ser dueño de las capas de búsqueda vectorial y embeddings para sistemas RAG y agentes autónomos

Skills requeridas

Diseño de data lakesOperación de pipelines de datosSistemas distribuidosArquitectura de datosPipelines RAGGestión de embeddingsOrquestación de modelos fundacionalesIngeniería de softwareIngesta de APIsTrabajo en equipoResolución de problemas

Beneficios

13 días festivos flotantes
15 días de vacaciones por año completado
Buen ambiente de trabajo

Trabajos similares

Senior Data Engineer

Blend360Buenos Aires

Remoto

Más ofertas de Jalasoft

Technical Product Owner

Jalasoft

Remoto

Explorar empleos relacionados

Empleos remotos

Ingeniero/a de Datos Senior - Pipelines AWS y RAG

Descripción del puesto

Responsabilidades

Skills requeridas

Beneficios

Trabajos similares

Senior Data Engineer

Más ofertas de Jalasoft

Technical Product Owner

Explorar empleos relacionados

Senior AWS Data Engineer

Data Engineer

Data Engineer - Proserve

Data Engineer

Senior Data Engineer - LATAM Remote

Senior AI Integration Engineer

Automation Tester Engineer - Python + Pytest and AI experience

AI/ML Engineer: RAG & API Pipelines