10 puntos por GN⁺ 2025-07-17 | 2 comentarios | Compartir por WhatsApp
  • Resumen de la discusión y respuestas publicadas en el subreddit /r/DataScience
  • El autor expresa escepticismo ante la realidad de que la ciencia de datos se ejecuta solo bajo el nombre de “IA generativa”, sin validación ni evaluación
  • En la práctica, solo se realizó un cálculo simple de z-score con código generado por ChatGPT, y se avanzó hasta justo antes del despliegue sin ninguna evaluación del rendimiento del modelo
  • En la comunidad se señaló repetidamente una cultura empresarial de “si funciona, despleguémoslo”, falta de validación, evasión de responsabilidades y sacrificio de la ética científica
  • Distintos profesionales dicen estar viviendo problemas similares y expresan fuerte preocupación por una tendencia a degradarse en “pseudociencia”
  • Pero algunos también plantean que hay que entender la utilidad práctica de experimentar rápido y de las soluciones simples, subrayando una visión equilibrada

Data Science Has Become a Pseudo-Science

  • Tras completar maestría y doctorado en Europa, el autor ha trabajado durante 10 años entre industria y academia en ciencia de datos
  • En los últimos 2 años ha aumentado el fenómeno de presentar resultados “en nombre de la IA generativa” sin ningún tipo de validación
  • Como ejemplo, en un proyecto orientado a la detección de anomalías en series temporales, con código generado por ChatGPT solo se calculó el z-score de la diferencia de medias, y aun así se discutía su despliegue sin ninguna métrica de rendimiento
  • Esta forma de trabajo es pseudociencia: se consulta a una caja negra sin pensamiento científico y se sigue su respuesta al pie de la letra, e incluso hacer preguntas se vuelve tabú
  • Por eso el autor incluso considera volver a la academia, y publica el post para preguntar si otros colegas también están viviendo este mismo fenómeno

Resumen de comentarios

Principales puntos de coincidencia

  • La filosofía de “si simplemente funciona, despleguémoslo” está muy extendida (u/Illustrious-Pound266)
  • También hay casos de startups que fracasaron por insistir en la IA sin validación ni roadmap (u/gothicserp3nt)
  • No se revisan adecuadamente los sesgos o discriminaciones no intencionales (u/tehMarzipanEmperor)
  • En la mayoría de las empresas, RAG o la IA se venden con exageración y se operan más para lucirse que para maximizar la precisión (u/castleking, u/flowanvindir)
  • El ambiente laboral se describe como “performance theater” (u/Ty4Readin, u/faulerauslaender)
  • Se ha normalizado desplegar apresuradamente, hacer reportes vistosos por fuera e introducir IA sin medir nada para mostrar resultados (u/glittering_tiger8996, u/Emergency-Job4136)
  • Muchos también sostienen que esto ya existía desde antes, y que GenAI solo lo volvió más evidente (u/RoomyRoots, u/303uru, u/TARehman)
  • Se adopta por velocidad, aunque tenga poca explicabilidad y baja confiabilidad
  • La rendición de cuentas en las decisiones empresariales está desapareciendo (u/empathic_psychopath8, u/Jollyhrothgar)

Otras miradas

  • Si un enfoque simple puede resolver el problema, también hay que reconocer su valor práctico (u/AnarkittenSurprise)
  • En muchos comentarios aparece la idea de que la ciencia de datos siempre tuvo elementos poco científicos, o incluso que solo era “ciencia” en el nombre (u/TaiChuanDoAddct, u/Time-Combination4710, u/LighterningZ)
  • Más importante que usar herramientas de IA es la capacidad de usarlas con responsabilidad (u/Dror_sim, u/ResearchMindless6419)
  • Críticas del tipo “hay datos, pero no lógica” o “solo ejecutan paquetes sin conocimientos de estadística” (u/gyp_casino, u/tmotytmoty)
  • Muchos opinan que lo verdaderamente importante es el conocimiento de dominio y el pensamiento matemático, y que la IA o la programación son solo herramientas (u/MightBeRong, u/Dror_sim)

Problemas institucionales y educativos

  • Los programas de MSDS son útiles académicamente, pero muchas veces no tienen relación con conseguir empleo (u/throwaway_ghost_122)
  • El nivel educativo está bajando, y al crecer la demanda de títulos por sí mismos, cae la calidad general del trabajo en el sector (u/Yam_Cheap)
  • La academia tampoco está exenta: también aumentan los papers no validados y los análisis superficiales (u/joule_3am, u/Mishtle)

Experiencias por industria

  • Seguros y salud siguen exigiendo revisiones de validez y evaluación legal estricta por sus fuertes regulaciones (u/Mishtle, u/mikka1)
  • En cambio, startups, ventas, gaming y parte de manufactura priorizan la velocidad y la apariencia (u/Vercingetorex89, u/Brackens_World)
  • Incluso en el sector público, la introducción de ChatGPT está debilitando los sistemas de validación que existían antes (u/TheFluffyEngineer, u/joule_3am)

Escepticismo y ganas de escapar

  • Muchos profesionales dicen estar pensando en dejar el sector o pasarse a la academia (u/thro0away12, u/Emotional_Plane_3500, u/candidFIRE)
  • También existe una visión positiva: para la gente realmente capaz, esto puede ser una oportunidad para destacar (u/OddEditor2467, u/sideshowbob01)

Sátira y resignación

  • “Hoy en día, con solo hacer import pandas ya eres científico de datos” (u/vesnikos)
  • La realidad actual parece centrarse más en complacer al jefe que en el pensamiento probabilístico y la validación científica (u/tmotytmoty, u/WignerVille)
  • También abundan las opiniones de que antes ya era así y ahora también: en el mundo corporativo, cuesta llamar ‘ciencia’ a la ciencia de datos (u/TaiChuanDoAddct, u/LighterningZ)

Conclusión

  • Este texto y sus comentarios muestran bien cómo la práctica reciente de la ciencia de datos está siendo arrastrada más por la entrega rápida y el marketing de IA que por la consistencia científica y la validación
  • Hay una preocupación profunda por cómo la etiqueta “IA generativa” bloquea críticas razonables y por una estructura donde código sin validar termina pasando directo a despliegue
  • Aunque ni la academia ni la industria son perfectas, la discusión sugiere que, para que la ciencia de datos sea realmente una “ciencia”, hará falta más pensamiento crítico dentro de la comunidad, mejor formación y una revisión seria de la cultura de trabajo

2 comentarios

 
ytuniverse 2025-07-17

Parece que el enlace no funciona.
https://reddit.com/r/datascience/…

 
xguru 2025-07-17

Gracias. Ya lo corregí.