Deepgram busca un Investigador de Staff con experiencia en Modelos de Lenguaje Grandes (LLMs) y arquitectura Transformer para unirse a su equipo de investigación. El rol implica investigación aplicada, desarrollo y despliegue de LLMs, con un fuerte enfoque en IA y aprendizaje continuo.
Atractivo para investigadores senior en IA, ofrece oportunidades de desarrollo en modelos de lenguaje y transformadores
SOBRE DEEPGRAM Deepgram es la plataforma líder que sustenta la emergente economía de la IA de voz, valorada en un billón de dólares. Ofrecemos APIs en tiempo real para conversión de voz a texto (STT), texto a voz (TTS) y para la creación de agentes de voz de nivel de producción a escala. Más de 200.000 desarrolladores y más de 1.300 organizaciones crean ofertas de voz que funcionan con Deepgram, incluyendo Twilio, Cloudflare, Sierra, Decagon, Vapi, Daily, Cresta, Granola y Jack in the Box. Los modelos fundacionales de Deepgram, nativos de la voz, se acceden a través de APIs en la nube o como software autoalojado y local, con precisión, baja latencia y eficiencia de costos inigualables. Respaldada por una reciente Serie C liderada por inversores globales y socios estratégicos líderes, Deepgram ha procesado más de 50.000 años de audio y transcrito más de 1 billón de palabras. No hay organización en el mundo que entienda la voz mejor que Deepgram. RITMO OPERATIVO DE LA EMPRESA En Deepgram, esperamos una mentalidad centrada en la IA. El uso y la comodidad con la IA no son opcionales, son fundamentales para cómo operamos, innovamos y medimos el rendimiento. Se espera que cada miembro del equipo que trabaja en Deepgram utilice y experimente activamente con herramientas avanzadas de IA, e incluso integre las suyas propias en su trabajo diario. Medimos la eficacia con la que se aplica la IA para obtener resultados, y el uso constante y creativo de las últimas capacidades de IA es clave para el éxito aquí. Los candidatos deben sentirse cómodos adoptando nuevos modelos y modos rápidamente, integrando la IA en sus flujos de trabajo y ampliando continuamente los límites de lo que estas tecnologías pueden hacer. Además, nos movemos al ritmo de la IA. El cambio es rápido y puedes esperar que tu trabajo diario evolucione con la misma rapidez. Este podría no ser el rol adecuado si no te entusiasma experimentar, adaptarte, pensar con agilidad y aprender constantemente, o si buscas algo muy prescriptivo con un horario tradicional de 9 a 5. LA OPORTUNIDAD La voz es la modalidad más natural para la interacción humana con las máquinas. Sin embargo, los paradigmas actuales de modelado de secuencias, basados en la escalada conjunta de modelos y datos, no pueden ofrecer una IA de voz capaz de una interacción humana universal. Los desafíos radican en problemas fundamentales de datos que presenta el audio: los datos de audio del mundo real son escasos y enormemente diversos, abarcando un vasto espacio de voces, estilos de habla y condiciones acústicas. Incluso si hubiera miles de millones de horas de audio accesibles, su alta dimensionalidad inherente crea costos computacionales y de almacenamiento que hacen que el entrenamiento y la implementación sean prohibitivamente caros a escala mundial. Creemos que se necesitan paradigmas completamente nuevos para la IA de audio para superar estos desafíos y hacer que la interacción por voz sea accesible para todos. EL ROL Deepgram está buscando actualmente un investigador experimentado que haya trabajado extensamente con Modelos de Lenguaje Grandes (LLMs) y tenga una profunda comprensión de la arquitectura Transformer para unirse a nuestro equipo de Investigación. Como miembro del personal de investigación, este individuo debe tener una amplia experiencia trabajando en los aspectos técnicos difíciles de los LLMs, como la curación de datos, el entrenamiento distribuido a gran escala, la optimización de la arquitectura Transformer y el entrenamiento con Aprendizaje por Refuerzo (RL). EL DESAFÍO Buscamos investigadores que: - Vean los problemas "no resueltos" como oportunidades para ser pioneros en enfoques completamente nuevos. - Puedan identificar el experimento crítico que validará o descartará una idea en días, no en meses. - Tengan la visión de escalar pruebas de concepto exitosas 100 veces. - Estén obsesionados con usar la IA para automatizar y amplificar su propio impacto. Si te sientes energizado en lugar de intimidado por estas expectativas, si ya estás pensando en cinco ideas para probar mientras lees esto, podrías ser el investigador que necesitamos. Este rol exige obsesión con los problemas, creatividad en el enfoque y un impulso implacable hacia soluciones elegantes y escalables. Los desafíos técnicos son inmensos, pero el impacto potencial es transformador. QUÉ HARÁS - Lluvia de ideas y colaboración con otros miembros del personal de investigación para definir nuevas iniciativas de investigación de LLMs. - Amplia revisión de literatura, evaluación, clasificación y destilación de métodos actuales. - Diseño y ejecución de programas experimentales para LLMs. - Impulsar trabajos de entrenamiento de Transformer (LLM) con éxito en infraestructura de cómputo distribuida y desplegar nuevos modelos en producción. - Documentar y presentar resultados y conceptos técnicos complejos de manera clara para una audiencia objetivo. - Mantenerse al día con los últimos avances en aprendizaje profundo y LLMs, con especial atención a sus implicaciones y aplicaciones dentro de nuestros productos. TE ENCANTARÁ ESTE ROL SI: - Te apasiona la IA y te entusiasma trabajar en investigación de LLMs de vanguardia. - Tienes interés en producir y aplicar nueva ciencia para ayudarnos a desarrollar y desplegar modelos de lenguaje grandes. - Disfrutas construyendo desde cero y te encanta crear nuevos sistemas. - Tienes sólidas habilidades de comunicación y eres capaz de traducir conceptos complejos con claridad. - Eres muy analítico y disfrutas profundizando en análisis detallados cuando es necesario. ES IMPORTANTE PARA NOSOTROS QUE TENGAS: - Más de 3 años de experiencia en investigación aplicada de aprendizaje profundo, con una sólida comprensión de las aplicaciones e implicaciones de diferentes tipos de redes neuronales, arquitecturas y mecanismos de pérdida. - Experiencia comprobada trabajando con modelos de lenguaje grandes (LLMs), incluyendo experiencia con curación de datos, entrenamiento distribuido a gran escala, optimización de la arquitectura Transformer y Aprendizaje por Refuerzo (RL). - Sólida experiencia en codificación en Python y trabajando con PyTorch. - Experiencia con diversas arquitecturas Transformer (autorregresivas, secuencia a secuencia, etc.). - Experiencia con computación distribuida y procesamiento de datos a gran escala. - Experiencia previa en la conducción de programas experimentales y el uso de resultados para optimizar modelos. SERÍA GENIAL SI TUVIERAS: - Profunda comprensión de los Transformers, LMs causales y su arquitectura subyacente. - Comprensión de esquemas de entrenamiento e inferencia distribuidos para LLMs. - Familiaridad con pipelines de etiquetado y entrenamiento RLHF. - Conocimiento actualizado de técnicas y desarrollos recientes de LLMs. - Publicaciones en investigación de aprendizaje profundo, particularmente relacionadas con LLMs y redes neuronales profundas. BENEFICIOS Y PREBENDAS* SALUD HOLÍSTICA - Beneficios médicos, dentales y de visión. - Estipendio anual de bienestar. - Apoyo a la salud mental. - Planes de seguro de ingresos vitalicios, por discapacidad a corto y largo plazo. EQUILIBRIO TRABAJO/VIDA - PTO ilimitado. - Generosa licencia parental remunerada. - Horario flexible. - 12 días festivos pagados de la empresa en EE. UU. - Estipendio trimestral de productividad personal. - Estipendio único para mejoras de oficina en casa. - Plan 401(k) con contrapartida de la empresa. - Programas de ahorro de impuestos. APRENDIZAJE CONTINUO - Estipendio de aprendizaje/educación. - Participación en charlas y conferencias. - Grupos de Recursos para Empleados. - Talleres/sesiones de habilitación de IA. *Para candidatos fuera de EE. UU., utilizamos un modelo de Empleador de Registro en muchos países, lo que significa que los beneficios se administran localmente y se rigen por las regulaciones específicas de cada país. Debido a esto, los beneficios diferirán según la región; en algunos casos, los empleados internacionales reciben beneficios que los empleados de EE. UU. no tienen, y viceversa. A medida que escalemos, continuaremos evaluando dónde podemos crear más alineación, pero una estructura de beneficios global 1:1 no siempre es legal u operativamente posible. Respaldada por inversores prominentes como Y Combinator, Madrona, Tiger Global, Wing VC y NVIDIA, Deepgram ha recaudado más de $215 millones en financiación total. Si buscas trabajar en tecnología de vanguardia y tener un impacto significativo en la industria de la IA, ¡nos encantaría saber de ti! Deepgram es un empleador que ofrece igualdad de oportunidades. Queremos que todas las voces y perspectivas estén representadas en nuestra fuerza laboral. Somos un grupo curioso enfocado en la colaboración y en hacer lo correcto. Ponemos a nuestros clientes primero, crecemos juntos y nos movemos rápido. No discriminamos por motivos de raza, religión, color, origen nacional, género, orientación sexual, identidad o expresión de género, edad, estado civil, condición de veterano, condición de discapacidad, embarazo, estado parental, información genética, afiliación política o cualquier otro estado protegido por las leyes o regulaciones en las ubicaciones donde operamos. Estamos felices de proporcionar adaptaciones para los solicitantes que las necesiten.