- Se busca entender el mercado laboral actual y sus tendencias a través de los hilos de "Ask HN: Who Is Hiring" de Hacker News
- Se usó Selenium para buscar cada mes en Google "ask hn who is hiring {month} {year}" y recopilar los IDs de los hilos
- Se usó la HN-API para recopilar los IDs de los comentarios principales y guardarlos en una base de datos sqlite3
- Se usó GPT-4o para clasificar los comentarios
- Se usó el método
llm.batch(array) de LangChain para procesar en paralelo y manejar los datos rápidamente
Resultados
¿Cuántos empleos permiten trabajo remoto?
- Durante la pandemia, solo una quinta parte de los empleos no ofrecía trabajo remoto
- La proporción de empleos que permiten trabajo remoto no cayó tanto como se esperaba
¿Cuántos empleos patrocinan visas?
- La proporción de empleos con patrocinio de visa se ha mantenido relativamente estable durante los últimos 2 años
- Sigue siendo difícil encontrar empleos con patrocinio de visa
¿Cómo cambia la distribución por nivel de experiencia?
- Será importante acumular más de 8 años de experiencia en los próximos 6 a 12 meses
¿Cuántos empleos hay por estado dentro de EE. UU.?
- Hay muchos más empleos disponibles en el Bay Area y NYC que en otras regiones
¿Qué bases de datos se usan?
- PostgreSQL supera ampliamente al resto de las bases de datos en uso
¿Qué frameworks de JavaScript tienen mayor demanda?
- La demanda de React es muy alta
- Se creó un gráfico de burbujas interactivo con
three.js sin usar escala logarítmica
¿Cómo es la distribución salarial?
- No se proporcionan detalles concretos sobre la distribución salarial
Lecciones aprendidas
- Hay que describir los campos del modelo con la mayor precisión posible
- Al clasificar, hay que indicar explícitamente las clases en la descripción
- Al extraer conjuntos, hay que especificar los delimitadores en la descripción
Trabajo futuro
- A partir del trabajo inicial, parece posible construir un mini SaaS que clasifique lo que busca un usuario en los hilos de "Ask HN: Who is hiring?" y lo empareje por mes
Opinión de GN⁺
- Este artículo muestra bien cómo analizar el mercado laboral usando ciencia de datos y técnicas de procesamiento de lenguaje natural
- El procesamiento en paralelo con GPT-4o y LangChain es útil para manejar grandes volúmenes de datos rápidamente
- Refleja la realidad de lo difícil que sigue siendo encontrar empleos con patrocinio de visa, por lo que será útil para quienes buscan ese tipo de información
- La alta demanda de React y PostgreSQL sirve como una buena referencia para quienes quieren aprender esas tecnologías
- La idea del mini SaaS podría ser de gran ayuda para muchas personas que buscan empleo si llega a implementarse
1 comentarios
Comentarios de Hacker News
El análisis con GPT-4o es interesante
Es una lástima no poder encontrar el código fuente del proyecto en GitHub
Gracias por invertir tiempo y dinero en el proyecto
Es una excelente combinación de LLM y análisis tradicional
No es buena idea apilar barras en una gráfica
Habría que usar escala logarítmica para que la gráfica no se vea rara
Sería interesante hacer el mismo análisis usando Claude 3 Haiku
Sería interesante compararlo con una muestra aleatoria de Indeed o LinkedIn
En la gráfica de frameworks de JS aparecen tanto la burbuja de "React Native" como la de "React-Native"
Me gustaría ver un análisis similar de "Who Wants to be Hired"