38 puntos por xguru 2024-07-02 | 2 comentarios | Compartir por WhatsApp
  • Soy ingeniero de software con más de 10 años construyendo aplicaciones intensivas en datos. Principalmente backend (legacy, cloud)
  • (1) ¿Vale la pena hacer el pivot? (2) ¿Alguien lo ha hecho? (3) Si no hay ML en mi trabajo, ¿cómo puedo hacerlo?
  • ¿Existe trabajo práctico de ingeniería de ML más enfocado en la gestión/despliegue/escalado de modelos que en construir modelos?
    • Es decir, ¿se puede hacer sin aprender todas las matemáticas que hay por debajo?

arnabgho

  • Trabaja como tech lead de MLE en Snap y ayudó a sentar las bases de la infraestructura de IA generativa de Snap
    • Lo recomendaría mucho como una trayectoria profesional muy gratificante
  • El libro "Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications" es una muy buena introducción al diseño de sistemas de machine learning para producción
  • También recomienda mucho este blog escrito por esa autora (Chip Huyen) como introducción a la construcción de sistemas de IA y ML de nivel producción
    Construir aplicaciones de LLM para producción (incluye enlaces a resumen y traducción)
  • Respuestas a las preguntas
    • (1) Sí, especialmente en un punto de inflexión del espíritu de la época como el actual, hacer esta transición es una decisión inteligente
    • (2) Sí
    • (3) Para recursos sobre cómo empezar y dominar habilidades de ingeniería de ML, revisa lo anterior

breckenedge

  • Hace unos 7 meses se metió en un proyecto de 3 meses para crear recomendaciones de contenido usando ML
  • Empezó con una librería de collaborative filtering ya hecha y terminó con PyTorch, y ChatGPT fue de gran ayuda
  • Podría haber seguido por ese camino, pero la dirección quería resultados más rápidos y mejores, y cuando empiezas sin experiencia, 3 meses son tiempo suficiente para agarrar ritmo
  • Gran parte del ML consistió en limpiar y preparar datasets, lo cual no fue tan divertido
  • Un ejecutivo le recomendó probar Amazon Personalize; lo intentó seriamente, pero al final no tuvo éxito. No está claro si fue por problemas de datos o por el modelo base
  • El problema central al usar servicios de ML de caja negra es que no puedes analizar qué está pasando
  • Amazon Personalize dificulta cambiar la capa de datos, así que no puedes saber si te estás acercando a una mejor solución
  • Un especialista experimentado en ML podría acercarse más a una mejor solución usando Personalize
  • Por eso, si puedes trabajar con ML, conviene hacer primero un proyecto piloto de ML para ver si realmente te gusta antes de convertirlo en carrera

nsyptras

  • > ¿Existe ingeniería de ML más enfocada en la gestión/despliegue/escalado de modelos que en construir modelos?
  • Yo hice esa transición en 2018. Se llama MLOps. Antes era desarrollador móvil
  • En ese momento fue una transición bastante fácil (aunque ahora la competencia podría ser más dura)
  • Lo que hice:
    • Llevé por mi cuenta un proyecto intensivo de ML y me di cuenta de que disfrutaba trabajar en todo el stack de ML
    • También escribí una [publicación de blog]((https://www.nicksypteras.com/blog/aisu.html) sobre ese proyecto
    • Luego postulé a un equipo de MLOps y usé ese proyecto para demostrar habilidades/experiencia
    • Tal vez puedas evitar parte de las matemáticas, pero aprender los fundamentos hará que todo sea mucho más fácil
    • Creo que sin matemáticas básicas de ML habría estado avanzando completamente a ciegas

ilaksh

  • Parece que estás pensando en "MLOps". MLOps también es importante
  • Practicaría desplegando modelos en Python con HuggingFace y RunPod
  • También buscaría tutoriales sobre preentrenamiento, fine-tuning y evaluación de LLM, y revisaría Predibase
  • Ahora mismo, probablemente lo más importante sean los diffusion transformers
    • Si puedes encontrar documentación que explique cómo correr trabajos de entrenamiento para eso, podría ser útil para la gente
  • Si quieres hacer "trampa", revisa replicate.com. cog también puede servir para autoalojar modelos de ML fuera de replicate.com

nottorp

  • Yo no "hice transición a ingeniero de ML", pero en los últimos 2.5 meses aprendí más o menos a usar modelos públicos, y a entrenarlos y ejecutarlos usando herramientas y APIs
  • Casi no escribí código y leí muchos libros
  • Ayuda trabajar con una organización pequeña (donde no te encasillan en un rol y solo te dan cosas por hacer)

trybackprop

  • De hecho escribió y compartió una publicación de blog sobre esto para ingenieros de software con experiencia que estén considerando seriamente cambiarse a ML
  • Respuestas
      1. Si disfrutas experimentar en tu tiempo personal, se puede decir que es una decisión "inteligente". En mi caso, pasé un año estudiando material por las noches y fines de semana antes de pensar por primera vez que quería dedicarme a esto de tiempo completo
      1. Sí, y ya llevo 7 años trabajando como ingeniero de ML desde que hice la transición. Actualmente soy responsable técnico de ML en una FAANG. Antes trabajaba en infraestructura y producto
      1. Uno de los consejos que recibí hace unos años fue unirme a un equipo adyacente al trabajo de ML para familiarizarme con cómo se ve el ML en producción. También puedes empezar a practicar pensamiento de ML en Kaggle.com
  • En otras publicaciones de su blog se pueden consultar recursos para aprender IA/ML y las matemáticas necesarias para esta profesión
  • Linear Algebra 101 for AI/ML – Part 1
  • (incluye un quiz interactivo, fundamentos de vectores/matrices y una breve introducción a PyTorch, un framework de ML open source ampliamente usado en la industria).

deepGem

  • Vale la pena revisar fast.ai y su curso "Practical Deep Learning for Coders"
  • Aunque el material es de 2022, los principios que enseña siguen siendo muy válidos hoy y son muy útiles
  • Esto aplica especialmente a Self Attention, transformers y las arquitecturas modernas basadas en estos conceptos
  • Muchas personas que completaron el curso de fast.ai hicieron transición de carrera no solo a ingeniería de ML sino también a investigación científica
  • Dicho eso, no es un curso fácil, así que hay que dedicarle tiempo libre
  • Si te interesa el despliegue/escalado, incluso puedes saltar directamente a la lección 2 de la parte 1. Jeremy es un gran profesor
    • Como no vengo del mundo académico, creo que su estilo de enseñanza es muy sano

2 comentarios

 
rawoon89 2024-07-03

Lo leí con mucho interés. Gracias.

 
ahwjdekf 2024-07-02

En Corea, basta con saber algo tan básico como llamar a una API; en las empresas no quieren invertir mucho dinero, pero aun así quieren subirse a la moda de lo que está en tendencia... un ambiente así de ambiguo.