¿Cómo puedo hacer pivot hacia ingeniería de machine learning?

xguru · 2024-07-02T11:16:02+09:00

Soy ingeniero de software con más de 10 años construyendo aplicaciones intensivas en datos. Principalmente backend (legacy, cloud) (1) ¿Vale la pena hacer el pivot? (2) ¿Alguien lo ha hecho? (3) Si no hay ML en mi trabajo, ¿cómo puedo hacerlo? ¿Existe trabajo práctico de ingeniería de ML más enfocado en la gestión/despliegue/escalado de modelos que en construir modelos? Es decir, ¿se puede hacer sin aprender todas las matemáticas que hay por debajo? arnabgho Trabaja como tech lead de MLE en Snap y ayudó a sentar las bases de la infraestructura de IA generativa de Snap Lo recomendaría mucho como una trayectoria profesional muy gratificante El libro "Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications" es una muy buena introducción al diseño de sistemas de machine learning para producción También recomienda mucho este blog escrito por esa autora (Chip Huyen) como introducción a la construcción de sistemas de IA y ML de nivel producción Construir aplicaciones de LLM para producción (incluye enlaces a resumen y traducción) Respuestas a las preguntas (1) Sí, especialmente en un punto de inflexión del espíritu de la época como el actual, hacer esta transición es una decisión inteligente (2) Sí (3) Para recursos sobre cómo empezar y dominar habilidades de ingeniería de ML, revisa lo anterior breckenedge Hace unos 7 meses se metió en un proyecto de 3 meses para crear recomendaciones de contenido usando ML Empezó con una librería de collaborative filtering ya hecha y terminó con PyTorch, y ChatGPT fue de gran ayuda Podría haber seguido por ese camino, pero la dirección quería resultados más rápidos y mejores, y cuando empiezas sin experiencia, 3 meses son tiempo suficiente para agarrar ritmo Gran parte del ML consistió en limpiar y preparar datasets, lo cual no fue tan divertido Un ejecutivo le recomendó probar Amazon Personalize; lo intentó seriamente, pero al final no tuvo éxito. No está claro si fue por problemas de datos o por el modelo base El problema central al usar servicios de ML de caja negra es que no puedes analizar qué está pasando Amazon Personalize dificulta cambiar la capa de datos, así que no puedes saber si te estás acercando a una mejor solución Un especialista experimentado en ML podría acercarse más a una mejor solución usando Personalize Por eso, si puedes trabajar con ML, conviene hacer primero un proyecto piloto de ML para ver si realmente te gusta antes de convertirlo en carrera nsyptras ¿Existe ingeniería de ML más enfocada en la gestión/despliegue/escalado de modelos que en construir modelos? Yo hice esa transición en 2018. Se llama MLOps. Antes era desarrollador móvil En ese momento fue una transición bastante fácil (aunque ahora la competencia podría ser más dura) Lo que hice: Llevé por mi cuenta un proyecto intensivo de ML y me di cuenta de que disfrutaba trabajar en todo el stack de ML También escribí una [publicación de blog]((https://www.nicksypteras.com/blog/aisu.html) sobre ese proyecto Luego postulé a un equipo de MLOps y usé ese proyecto para demostrar habilidades/experiencia Tal vez puedas evitar parte de las matemáticas, pero aprender los fundamentos hará que todo sea mucho más fácil Creo que sin matemáticas básicas de ML habría estado avanzando completamente a ciegas ilaksh Parece que estás pensando en "MLOps". MLOps también es importante Practicaría desplegando modelos en Python con HuggingFace y RunPod También buscaría tutoriales sobre preentrenamiento, fine-tuning y evaluación de LLM, y revisaría Predibase Ahora mismo, probablemente lo más importante sean los diffusion transformers Si puedes encontrar documentación que explique cómo correr trabajos de entrenamiento para eso, podría ser útil para la gente Si quieres hacer "trampa", revisa replicate.com. cog también puede servir para autoalojar modelos de ML fuera de replicate.com nottorp Yo no "hice transición a ingeniero de ML", pero en los últimos 2.5 meses aprendí más o menos a usar modelos públicos, y a entrenarlos y ejecutarlos usando herramientas y APIs Casi no escribí código y leí muchos libros Ayuda trabajar con una organización pequeña (donde no te encasillan en un rol y solo te dan cosas por hacer) trybackprop De hecho escribió y compartió una publicación de blog sobre esto para ingenieros de software con experiencia que estén considerando seriamente cambiarse a ML You Don't Need a Masters/PhD – How These 9 Engineers Broke Into ML Presenta casos de distintos ingenieros que hicieron la transición mientras trabajaban en Meta, Google, Amazon y OpenAI Puedes ver qué estrategias y tácticas usaron Respuestas Si disfrutas experimentar en tu tiempo personal, se puede decir que es una decisión "inteligente". En mi caso, pasé un año estudiando material por las noches y fines de semana antes de pensar por primera vez que quería dedicarme a esto de tiempo completo Sí, y ya llevo 7 años trabajando como ingeniero de ML desde que hice la transición. Actualmente soy responsable técnico de ML en una FAANG. Antes trabajaba en infraestructura y producto Uno de los consejos que recibí hace unos años fue unirme a un equipo adyacente al trabajo de ML para familiarizarme con cómo se ve el ML en producción. También puedes empezar a practicar pensamiento de ML en Kaggle.com En otras publicaciones de su blog se pueden consultar recursos para aprender IA/ML y las matemáticas necesarias para esta profesión Linear Algebra 101 for AI/ML – Part 1 (incluye un quiz interactivo, fundamentos de vectores/matrices y una breve introducción a PyTorch, un framework de ML open source ampliamente usado en la industria). deepGem Vale la pena revisar fast.ai y su curso "Practical Deep Learning for Coders" Aunque el material es de 2022, los principios que enseña siguen siendo muy válidos hoy y son muy útiles Esto aplica especialmente a Self Attention, transformers y las arquitecturas modernas basadas en estos conceptos Muchas personas que completaron el curso de fast.ai hicieron transición de carrera no solo a ingeniería de ML sino también a investigación científica Dicho eso, no es un curso fácil, así que hay que dedicarle tiempo libre Si te interesa el despliegue/escalado, incluso puedes saltar directamente a la lección 2 de la parte 1. Jeremy es un gran profesor Como no vengo del mundo académico, creo que su estilo de enseñanza es muy sano

(news.ycombinator.com)

38 puntos por xguru 2024-07-02 | 2 comentarios | Compartir por WhatsApp

Soy ingeniero de software con más de 10 años construyendo aplicaciones intensivas en datos. Principalmente backend (legacy, cloud)
(1) ¿Vale la pena hacer el pivot? (2) ¿Alguien lo ha hecho? (3) Si no hay ML en mi trabajo, ¿cómo puedo hacerlo?
¿Existe trabajo práctico de ingeniería de ML más enfocado en la gestión/despliegue/escalado de modelos que en construir modelos?
- Es decir, ¿se puede hacer sin aprender todas las matemáticas que hay por debajo?

arnabgho

Trabaja como tech lead de MLE en Snap y ayudó a sentar las bases de la infraestructura de IA generativa de Snap
- Lo recomendaría mucho como una trayectoria profesional muy gratificante
El libro "Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications" es una muy buena introducción al diseño de sistemas de machine learning para producción
También recomienda mucho este blog escrito por esa autora (Chip Huyen) como introducción a la construcción de sistemas de IA y ML de nivel producción
Construir aplicaciones de LLM para producción (incluye enlaces a resumen y traducción)
Respuestas a las preguntas
- (1) Sí, especialmente en un punto de inflexión del espíritu de la época como el actual, hacer esta transición es una decisión inteligente
- (2) Sí
- (3) Para recursos sobre cómo empezar y dominar habilidades de ingeniería de ML, revisa lo anterior

breckenedge

Hace unos 7 meses se metió en un proyecto de 3 meses para crear recomendaciones de contenido usando ML
Empezó con una librería de collaborative filtering ya hecha y terminó con PyTorch, y ChatGPT fue de gran ayuda
Podría haber seguido por ese camino, pero la dirección quería resultados más rápidos y mejores, y cuando empiezas sin experiencia, 3 meses son tiempo suficiente para agarrar ritmo
Gran parte del ML consistió en limpiar y preparar datasets, lo cual no fue tan divertido
Un ejecutivo le recomendó probar Amazon Personalize; lo intentó seriamente, pero al final no tuvo éxito. No está claro si fue por problemas de datos o por el modelo base
El problema central al usar servicios de ML de caja negra es que no puedes analizar qué está pasando
Amazon Personalize dificulta cambiar la capa de datos, así que no puedes saber si te estás acercando a una mejor solución
Un especialista experimentado en ML podría acercarse más a una mejor solución usando Personalize
Por eso, si puedes trabajar con ML, conviene hacer primero un proyecto piloto de ML para ver si realmente te gusta antes de convertirlo en carrera

nsyptras

¿Existe ingeniería de ML más enfocada en la gestión/despliegue/escalado de modelos que en construir modelos?
Yo hice esa transición en 2018. Se llama MLOps. Antes era desarrollador móvil
En ese momento fue una transición bastante fácil (aunque ahora la competencia podría ser más dura)
Lo que hice:
- Llevé por mi cuenta un proyecto intensivo de ML y me di cuenta de que disfrutaba trabajar en todo el stack de ML
- También escribí una [publicación de blog]((https://www.nicksypteras.com/blog/aisu.html) sobre ese proyecto
- Luego postulé a un equipo de MLOps y usé ese proyecto para demostrar habilidades/experiencia
- Tal vez puedas evitar parte de las matemáticas, pero aprender los fundamentos hará que todo sea mucho más fácil
- Creo que sin matemáticas básicas de ML habría estado avanzando completamente a ciegas

ilaksh

Parece que estás pensando en "MLOps". MLOps también es importante
Practicaría desplegando modelos en Python con HuggingFace y RunPod
También buscaría tutoriales sobre preentrenamiento, fine-tuning y evaluación de LLM, y revisaría Predibase
Ahora mismo, probablemente lo más importante sean los diffusion transformers
- Si puedes encontrar documentación que explique cómo correr trabajos de entrenamiento para eso, podría ser útil para la gente
Si quieres hacer "trampa", revisa replicate.com. cog también puede servir para autoalojar modelos de ML fuera de replicate.com

nottorp

Yo no "hice transición a ingeniero de ML", pero en los últimos 2.5 meses aprendí más o menos a usar modelos públicos, y a entrenarlos y ejecutarlos usando herramientas y APIs
Casi no escribí código y leí muchos libros
Ayuda trabajar con una organización pequeña (donde no te encasillan en un rol y solo te dan cosas por hacer)

trybackprop

De hecho escribió y compartió una publicación de blog sobre esto para ingenieros de software con experiencia que estén considerando seriamente cambiarse a ML
- You Don't Need a Masters/PhD – How These 9 Engineers Broke Into ML
- Presenta casos de distintos ingenieros que hicieron la transición mientras trabajaban en Meta, Google, Amazon y OpenAI
- Puedes ver qué estrategias y tácticas usaron
Respuestas
- 1. Si disfrutas experimentar en tu tiempo personal, se puede decir que es una decisión "inteligente". En mi caso, pasé un año estudiando material por las noches y fines de semana antes de pensar por primera vez que quería dedicarme a esto de tiempo completo
- 1. Sí, y ya llevo 7 años trabajando como ingeniero de ML desde que hice la transición. Actualmente soy responsable técnico de ML en una FAANG. Antes trabajaba en infraestructura y producto
- 1. Uno de los consejos que recibí hace unos años fue unirme a un equipo adyacente al trabajo de ML para familiarizarme con cómo se ve el ML en producción. También puedes empezar a practicar pensamiento de ML en Kaggle.com
En otras publicaciones de su blog se pueden consultar recursos para aprender IA/ML y las matemáticas necesarias para esta profesión
Linear Algebra 101 for AI/ML – Part 1
(incluye un quiz interactivo, fundamentos de vectores/matrices y una breve introducción a PyTorch, un framework de ML open source ampliamente usado en la industria).

deepGem

Vale la pena revisar fast.ai y su curso "Practical Deep Learning for Coders"
Aunque el material es de 2022, los principios que enseña siguen siendo muy válidos hoy y son muy útiles
Esto aplica especialmente a Self Attention, transformers y las arquitecturas modernas basadas en estos conceptos
Muchas personas que completaron el curso de fast.ai hicieron transición de carrera no solo a ingeniería de ML sino también a investigación científica
Dicho eso, no es un curso fácil, así que hay que dedicarle tiempo libre
Si te interesa el despliegue/escalado, incluso puedes saltar directamente a la lección 2 de la parte 1. Jeremy es un gran profesor
- Como no vengo del mundo académico, creo que su estilo de enseñanza es muy sano

2 comentarios

rawoon89 2024-07-03

Lo leí con mucho interés. Gracias.

ahwjdekf 2024-07-02

En Corea, basta con saber algo tan básico como llamar a una API; en las empresas no quieren invertir mucho dinero, pero aun así quieren subirse a la moda de lo que está en tendencia... un ambiente así de ambiguo.