Buscamos un AI Senior Engineer (Vision) para trabajar en Able, una empresa de tecnología en crecimiento, en modalidad remota dentro de LATAM. El rol implica trabajar en la intersección de Computer Vision y Logic, extrayendo datos complejos de documentos visuales y orquestando su uso con Large Language Models.
Aplicá si te apasiona la inteligencia artificial y la visión por computadora. Este puesto es ideal para aquellos que disfrutan trabajando en la vanguardia de la tecnología.
En 2012, éramos un grupo de ingenieros y diseñadores que decidimos construir cosas, así que lo hicimos. Able comenzó como un centro de ingeniería y producto que construía para una cartera de startups en etapas tempranas. Establecimos muchas relaciones mientras desarrollábamos productos que eran reflexivos, efectivos y genuinamente útiles. Pero desde entonces, hemos crecido... y nuestra ambición también. Ahora, estamos entrando en nuestro próximo capítulo, definido por la inteligencia artificial aplicada. La IA es una fuerza poderosa en el ciclo de desarrollo de software de extremo a extremo, y estamos creando prácticas que nos permiten entregar software de manera rápida y efectiva, creando valor significativo para nuestros socios. Hoy en día, nuestra mentalidad de constructores nos impulsa a convertirnos en una organización nativa de IA en todas las funciones. Todavía estamos evolucionando, y eso es parte de la oportunidad. Si quieres construir, aprender y enfrentar desafíos junto con un equipo ambicioso, construyamos juntos. Esta posición es 100% remota dentro de LatAm. Qué harás: Estamos buscando a alguien que disfrute trabajando en la frontera donde la visión artificial se encuentra con la lógica. Serás responsable de los "ojos" y el "cerebro" de nuestro sistema: extrayendo datos complejos de documentos visuales y luego orquestando cómo se utilizan esos datos por parte de Modelos de Lenguaje Grandes. En resumen, alguien que guste de: - Desbloquear datos visuales: construir pipelines que puedan "leer" documentos complejos, entender el diseño, las gráficas y el contexto visual utilizando Modelos de Visión-Lenguaje (GPT-4V, Claude 3.5) y Análisis de Diseño. - Orquestar inteligencia: poseer la capa de lógica de la aplicación. Utilizarás LangChain o LangGraph para construir agentes y cadenas que consulten nuestros datos, razonen sobre ellos y generen respuestas. - Manejo nativo de PDF: manejar la realidad compleja del procesamiento de PDF (PyMuPDF, análisis de diseño) para preservar la estructura antes de que la IA la vea. - Ingeniería de prompts y lógica: crear prompts complejos y flujos de control para asegurarte de que los modelos interpreten gráficas y diseños financieros con precisión sin alucinar. - Costo y escala: aplicar una mentalidad de optimización de costos (procesamiento por lotes, selección de modelos) para asegurarnos de que nuestras capas de visión y orquestación sean económicamente viables. Qué estamos buscando: Queremos trabajar con personas que tengan pasión por colaborar con sus equipos, construir software mientras cultivan relaciones inclusivas y respetuosas con sus compañeros de trabajo. Con aquellos que sean abiertos sobre sus deficiencias y lo que no saben ahora, pero que sigan estando ansiosos por crecer y cerrar esas brechas. Idealmente, también tendrían: - Orquestación de LLM (imprescindible): experiencia profunda con LangChain, LangGraph o frameworks similares. Sabes cómo manejar ventanas de contexto, llamadas a herramientas y flujos de trabajo agénicos. - Experiencia en IA multimodal: experiencia práctica integrando modelos de visión de última generación (GPT-4V, Claude 3.5 Sonnet) y modelos de inserción (CLIP). - Especialista en inteligencia de documentos: familiaridad con modelos especializados (por ejemplo, Donut, Pix2Struct) y herramientas como Unstructured.io o Docling. - Dominio del procesamiento de PDF: dominio sobre herramientas como PyMuPDF o pdfplumber para la extracción de elementos nativos. - Python ML Stack: fuerte dominio en PyTorch o TensorFlow. Agradable tener: - Ajuste fino: experiencia ajustando modelos de visión o lenguaje, específicamente para mejorar la precisión en artefactos específicos del dominio como gráficas o tablas financieras. - Conocimiento del dominio: experiencia previa manejando documentos en los sectores de bienes raíces o finanzas. Able está impulsado por personas curiosas y reflexivas que se preocupan por lo que construyen y cómo lo construyen. Estamos invirtiendo activamente en nuestro equipo a través de capacitación en IA, intercambio de conocimientos y experimentación práctica para asegurarnos de que todos crezcan junto con la tecnología. Esta posición es 100% remota dentro de LatAm. Se requiere una fuerte habilidad verbal y escrita en inglés. Como miembro del equipo, puedes esperar: - Trabajar 40 horas a la semana y estar disponible durante las horas normales de trabajo según sea necesario - Pagos realizados en USD - 18 días de PTO al año, observación de días festivos locales y un descanso anual entre Navidad y Año Nuevo - Un subsidio de bienestar mensual y cajas de snacks entregadas a tu hogar Sobre Able Able construye productos tecnológicos en un modelo de cartera. Creemos que las personas, los equipos y los procesos son más importantes que las ideas en sí mismas, por lo que nos hemos enfocado en reunir a grandes personas y invertir en su crecimiento. Hemos construido productos en diversas industrias, desde los medios hasta la financiación, juguetes y atención médica. A veces trabajamos con equipos de gestión para ayudar a sus negocios a crecer más rápido o desbloquear valor utilizando tecnología. Otras veces comenzamos o compramos negocios directamente. Cada vez, buscamos oportunidades para aprovechar la tecnología construida a nivel de cartera para impulsar el valor más rápidamente. Able está comprometido con la inclusión y la diversidad y es un empleador con igualdad de oportunidades. Todos los solicitantes recibirán consideración sin tener en cuenta la raza, el color, la religión, el género, la identidad de género, la orientación sexual, el origen nacional, la discapacidad o el estado de veterano. Esto es solo el comienzo de una conversación que nos encantaría tener contigo. ¡Aplica y comencemos esta aventura!