Se busca Senior Platform Engineer para trabajar en la infraestructura de agentes de IA a escala en AWS, liderando decisiones arquitectónicas, diseño de sistemas de mensajería, infraestructura y despliegue, y asegurando la confiabilidad y escalabilidad del sistema.
Atractivo para ingenieros experimentados que buscan desafíos en infraestructura de AI en AWS. Ideal para aquellos con experiencia en arquitectura orientada a eventos y observabilidad.
Latam · Europe · Remoto · Full Time · Individual Contributor · +4 Años de Experiencia Quiénes Somos En Yuno, estamos construyendo la infraestructura de pagos que permite que todas las empresas participen en el mercado global. Fundada por expertos experimentados de la industria de pagos y tecnología, nuestra tecnología proporciona acceso a capacidades de pago líderes, lo que permite a las empresas interactuar con los clientes de manera segura y mantener operaciones globales a través de integraciones fluidas. Empoderamos a equipos de alto rendimiento en marcas como InDrive, McDonald’s, Rappi y Viva Aerobus para integrar más de 1000 métodos de pago a través de una sola API. Al aprovechar la inteligencia artificial avanzada y las últimas tecnologías, orquestamos enrutamiento inteligente y prevención de fraude en más de 80 países. Sobre el Rol Yuno está construyendo una plataforma que aprovisiona, implementa y administra agentes de IA a escala en AWS. La plataforma está en producción y creciendo. Necesitamos a alguien que se encargue de la infraestructura, evolucione la arquitectura y asegure que el sistema sea confiable, observable y esté listo para escalar. Este no es un rol de 'mantener lo que existe'. Usted impulsará decisiones arquitectónicas — diseñando comunicación basada en eventos, mejorando la confiabilidad de la transmisión, construyendo observabilidad y dando forma a la infraestructura de la plataforma a medida que crece. Su Contribución Será Arquitectura de mensajería y eventos — diseñar e implementar la capa de mensajería para la comunicación entre servicios, reemplazando patrones sincrónicos con mensajería asincrónica duradera y confiable. Infraestructura e implementación — poseer la infraestructura en la nube, automatizar el aprovisionamiento con IaC y asegurar que la plataforma se escale de manera confiable. Observabilidad y confiabilidad — construir el monitoreo, seguimiento y alertas que mantienen la plataforma saludable. Cuando algo se rompe a las 3 am, sus paneles de control y alertas deberían explicar por qué antes de que alguien tenga que excavar. Evolución de la plataforma — evaluar e impulsar decisiones arquitectónicas a medida que la plataforma madura. Voz fuerte en la elección de tecnologías, diseño de sistemas y decisión de cuándo evolucionar la infraestructura. Habilidades que Necesita Calificaciones Mínimas Arquitectura de eventos y sistemas de mensajería — ha diseñado sistemas alrededor de colas de mensajes (Kafka, NATS, RabbitMQ o similar). Entiende entrega de al menos una vez, grupos de consumidores, letras muertas, contrapresión y, idealmente, ha migrado un sistema de mensajería sincrónica a asincrónica. AWS — experiencia profunda con EC2, VPC, IAM, S3, RDS. Entiende la red porque la comunicación entre servicios se ejecuta sobre VPC interna. Bases de datos — conocimiento sólido tanto de SQL (PostgreSQL) como de NoSQL (MongoDB, Redis). Entiende cuándo usar cada uno, estrategias de indexación, replicación y ajuste de rendimiento. Docker — ciclo de vida del contenedor, límites de recursos, comprobaciones de estado, montajes vinculados, compilaciones de varias etapas. Depuración de sistemas distribuidos — ha depurado flujos asincrónicos y fallas en cascada en servicios en producción y puede explicar qué falló y cómo lo solucionó. Infraestructura como Código — Terraform o Pulumi. Cree que la infraestructura debe revisarse en PR, no hacer clic en consolas. Observabilidad — fluidez en Datadog o equivalente (paneles de control, monitores, APM, pipelines de registro, seguimiento distribuido). Tech Stack — experiencia práctica con Go, AWS (EC2, S3, VPC, RDS PostgreSQL), Docker, PostgreSQL, MongoDB, Redis y Datadog. Calificaciones Preferidas Infraestructura de AI / MLOps — experiencia en la ejecución de cargas de trabajo de IA en producción (servicio de modelo, inferencia LLM, administración de recursos de GPU, herramientas de evaluación y observabilidad de agentes como LangFuse, LangSmith, Braintrust, MLflow). Plataformas de contenedores multiinquilinos — experiencia con plataformas que ejecutan cargas de trabajo de clientes/usuarios en contenedores (Replit, Railway, Fly.io o sistemas PaaS internos). Kubernetes — ha realizado la migración de 'Docker en EC2 desnudo' a K8s al menos una vez y sabe qué se rompe durante la transición. Pipelines de datos y orquestación — Airflow, Prefect o similar. El conocimiento de almacenes de datos (Databricks, Snowflake, BigQuery) es una ventaja. Agradable Tener Experiencia con ECS. s6-overlay para la supervisión de procesos de contenedores. Experiencia con ecosistemas de marco de agentes de IA. Qué Ofrecemos en Yuno Compensación Competitiva. Trabajo Remoto – ¡Puedes trabajar desde cualquier lugar! Bonificación de Oficina en Casa – Una asignación única para ayudarte a crear tu oficina en casa ideal. Equipo de Trabajo. Opciones de Acciones. Plan de Salud dondequiera que estés. Días Libres Flexibles. Cursos de Idioma, Profesional y Crecimiento Personal.