Telnyx busca un Ingeniero Senior de Infraestructura con experiencia en bare metal, plataformas AI/HPC y redes de alto rendimiento para desplegar y mantener centros de datos edge, gestionar Kubernetes y Ceph, y desarrollar plataformas de infraestructura de próxima generación.
Aprovechá para trabajar en infraestructura de vanguardia con una empresa líder en conectividad global. Ideal para profesionales que buscan innovar y crecer.
Acerca de Telnyx Telnyx es líder en la industria que no solo imagina el futuro de la conectividad global, sino que lo está construyendo. Desde la arquitectura y amplificación del alcance de una red IP privada, global y multi-nube, hasta poner la tecnología de borde hiperlocal al alcance de tu mano a través de APIs intuitivas, estamos dando forma a una nueva era de interconexión fluida entre personas, dispositivos y aplicaciones. Nos impulsa el deseo de transformar y modernizar lo anticuado, automatizar lo manual y resolver problemas del mundo real a través de soluciones de conectividad innovadoras. Como testimonio de nuestro éxito, estamos orgullosos de ser una empresa financieramente estable y rentable. Nuestra sólida rentabilidad nos permite no solo invertir en tecnologías pioneras, sino también fomentar un entorno de aprendizaje y crecimiento continuo para nuestro equipo. Nuestra visión colectiva es un mundo donde la conectividad sin fronteras impulse la innovación ilimitada. Al unirte a nosotros, puedes ser parte de la creación de las bases para este futuro interconectado. Actualmente, buscamos personas apasionadas que estén entusiasmadas con la oportunidad de contribuir a una empresa que está marcando la industria, mientras desarrollan sus propias habilidades y carreras. Buscamos ingenieros apasionados por la infraestructura bare metal, plataformas de IA/HPC, sistemas nativos de Kubernetes y tecnologías de redes de alto rendimiento. Serás responsable de implementar y mantener nuestros centros de datos de borde para cargas de trabajo de cómputo, IA y almacenamiento, contribuir a la instalación, migración, actualizaciones e integración de servicios y módulos de infraestructura de Kubernetes, y participar en el desarrollo de plataformas de infraestructura distribuida de próxima generación. Responsabilidades: - Diseñar, implementar y gestionar soluciones de infraestructura altamente disponibles, escalables y seguras, incluyendo Kubernetes en bare metal y plataformas de almacenamiento Ceph gestionadas por Rook. - Diseñar y mantener plataformas de Kubernetes y Rook/Ceph para el consumo del equipo de ingeniería. - Implementar y operar infraestructura acelerada por GPU para cargas de trabajo de IA y cómputo de alto rendimiento utilizando GPUs de centros de datos NVIDIA y AMD, incluyendo hardware de las series H200, B200/B300 y AMD MI300. - Arquitectar y mantener stacks de redes de alto rendimiento aprovechando RoCE, InfiniBand, NVLink, Mellanox SR-IOV, funciones virtuales (VFs) y tecnologías avanzadas de NIC. - Diseñar y operar arquitecturas de almacenamiento de alto rendimiento utilizando tecnologías NVMe-oF (NVMe over Fabrics) para cargas de trabajo de almacenamiento distribuido de baja latencia. - Desarrollar y operar infraestructura de almacenamiento utilizando Rook para la gestión del ciclo de vida de Ceph dentro de entornos Kubernetes. - Construir y mantener plataformas de infraestructura nativas de Kubernetes utilizando KubeVirt, redes definidas por software (SDN), WireGuard y tecnologías de redes de contenedores como Calico, Flannel y Cilium con eBPF. - Diseñar e implementar políticas de red de Kubernetes para aislar cargas de trabajo, asegurar el tráfico este-oeste y mantener las mejores prácticas de seguridad de la infraestructura. - Desarrollar Operadores de Kubernetes, controladores y servicios de automatización para la gestión del ciclo de vida de la infraestructura y la orquestación de plataformas. - Contribuir a los esfuerzos de ingeniería de software de infraestructura centrados en la reconciliación de la infraestructura, la automatización idempotente y la gestión declarativa de sistemas. - Desarrollar herramientas internas, APIs y frameworks de automatización para soportar operaciones de infraestructura bare metal y de IA a gran escala. - Gestionar la optimización del rendimiento a nivel del kernel de Linux, la habilitación de hardware y la resolución de problemas de sistemas de bajo nivel. - Implementar y mantener drivers de GPU, redes y hardware utilizando Operadores de Kubernetes y técnicas de gestión de ciclo de vida en contenedores. - Evaluar y recomendar nuevas tecnologías y herramientas para mejorar la eficiencia, el rendimiento y la escalabilidad de las plataformas de infraestructura. - Asegurar la fiabilidad, el rendimiento y la escalabilidad de nuestros centros de datos de borde. - Solucionar y resolver problemas complejos de infraestructura en las capas de cómputo, redes, almacenamiento y Kubernetes. - Participar en el diseño de arquitectura, planificación técnica y documentación para nuevas iniciativas de infraestructura. Cualificaciones Esenciales: - Título de Grado o Máster en Ciencias de la Computación, Ingeniería o un campo relacionado. - 3-5 años de experiencia en ingeniería de infraestructura de producción. - Sólida experiencia en producción con Kubernetes, preferiblemente en entornos bare metal. - Experiencia en el desarrollo de Operadores de Kubernetes, controladores u otros componentes de automatización nativos de Kubernetes. - Sólida experiencia en programación e ingeniería de software centrada en la automatización de infraestructura, bucles de reconciliación y gestión de sistemas idempotentes. - Experiencia en la construcción de sistemas distribuidos, automatización de infraestructura o herramientas de ingeniería de plataformas. - Experiencia en la implementación y operación de clústeres Ceph gestionados por Rook y plataformas de almacenamiento de alto rendimiento basadas en NVMe en entornos Kubernetes de producción. - Sólidos conocimientos de administración de sistemas Linux y resolución de problemas del kernel de Linux. - Conocimiento profundo de redes Linux y sistemas distribuidos. - Experiencia con plataformas de virtualización nativas de contenedores como KubeVirt. - Experiencia con tecnologías SDN, WireGuard y tecnologías de redes de contenedores, incluyendo Calico, Flannel y/o Cilium eBPF. - Experiencia en la implementación de políticas de red de Kubernetes y estrategias de aislamiento de cargas de trabajo. - Experiencia en la implementación y gestión de infraestructura habilitada para GPU y sus drivers/operadores asociados en entornos Kubernetes. - Sólida comprensión de las tecnologías de redes de alto rendimiento, incluyendo RoCE, InfiniBand, Mellanox SR-IOV y redes de funciones virtuales (VF). - Sólidas habilidades de resolución de problemas y diagnóstico. Cualificaciones Preferidas: - Experiencia con GPUs de centros de datos NVIDIA, incluyendo las plataformas H200 y B200/B300. - Experiencia con aceleradores AMD de la serie MI300. - Familiaridad con NVLink y tecnologías de interconexión de GPU. - Experiencia con arquitecturas NVMe-oF (NVMe over Fabrics) y redes de almacenamiento de alto rendimiento. - Experiencia con VXLAN, redes definidas por software, tecnologías SR-IOV y descarga avanzada de NIC. - Familiaridad con el protocolo BGP y la configuración de FRR o Bird. - Experiencia contribuyendo a proyectos de código abierto en el ecosistema de infraestructura o Kubernetes. - Experiencia diseñando u operando plataformas de infraestructura de IA/HPC. - Familiaridad con herramientas de observabilidad, redes o seguridad basadas en eBPF. - Experiencia con flujos de trabajo GitOps y modelos operativos de Kubernetes. #LI-Brazil #LI-ARGENTINA