12 puntos por GN⁺ 2025-08-22 | 1 comentarios | Compartir por WhatsApp
  • Según un informe del MIT, el 95% de las empresas en todo el mundo no obtiene ganancias reales de la adopción de IA generativa
  • Las empresas experimentaron a gran escala con modelos de lenguaje grandes como ChatGPT y Copilot, pero la mayoría de los usos se limita a mejoras de productividad
  • Los casos de éxito solo se confirmaron en el 5% de los pilotos de IA integrados, y en la mayoría no hubo impacto en ventas ni en ganancias
  • Las principales razones son que la IA generativa no encaja bien con los procedimientos reales de trabajo, no recuerda la retroalimentación y no logra adaptarse al contexto
  • El informe descarta los temores de una sustitución masiva de empleos y analiza que, aunque es posible reducir costos externos, por ahora es poco realista una reestructuración interna o despidos masivos
  • En conclusión, la IA tiene fortalezas en tareas específicas más que como estrategia, y recomienda que las empresas se concentren en áreas limitadas donde puedan obtener resultados inmediatos, en lugar de buscar una innovación a escala de toda la organización

Inversión empresarial en IA generativa y retorno

  • En los últimos 3 años, las empresas han invertido entre 30 y 40 mil millones de dólares en proyectos de IA generativa
  • Sin embargo, son muy pocas las empresas que han obtenido retornos de negocio reales
  • Según una nueva investigación del MIT, el 95% de las empresas respondió que no tiene beneficios medibles pese a adoptar IA
  • Solo el 5% de los proyectos piloto de IA está generando valor por millones de dólares

Estado de adopción y límites de los modelos de lenguaje grandes

  • Más del 80% de las grandes empresas está probando o ejecutando como piloto LLM principales como ChatGPT y Copilot
  • Cerca del 40% de las empresas ha adoptado estos sistemas en cierta medida, pero en la mayoría de los casos se limita a reforzar la productividad individual de los empleados
  • Casi no hay impacto en la mejora de los ingresos o las ganancias totales de la empresa

Limitaciones técnicas de la IA generativa

  • Muchas veces, las herramientas de IA generativa no encajan bien con los procesos reales de trabajo
    • Entre los problemas más representativos se señalan flujos de trabajo inestables, falta de aprendizaje contextual e integración ineficiente con las tareas
  • La mayoría de los modelos de IA generativa no logra conservar retroalimentación pasada ni transferir fácilmente aprendizajes entre contextos y tareas
  • Según el informe, la mayoría de los sistemas de GenAI no puede mantener retroalimentación, adaptarse al contexto ni mejorar a largo plazo
  • Por estas características, solo aumentan los costos de integración a largo plazo dentro de las empresas, mientras que la mejora real de eficiencia sigue siendo insuficiente

Diferencia entre las expectativas de negocio y la realidad

  • Aunque las expectativas y la escala de inversión en IA generativa fueron altas, esto no se tradujo en reducción de costos ni en generación de ingresos reales
  • En la práctica, se usa para tareas limitadas como servicio al cliente, marketing y redacción de documentos; ahorra tiempo, pero tiene poco efecto directo en el aumento de ingresos

Impacto en el empleo y en la estructura organizacional

  • Las preocupaciones de que la IA generativa provoque una reducción masiva de empleos en el corto plazo tienen poco sustento
  • Se prevé que el efecto de la IA se limite más a optimizar costos externos, como reducir gastos de subcontratación, que a cambiar la estructura interna del personal
  • Se espera que, más que sustituir de inmediato a gran escala a los trabajadores, se quede en una reducción de costos de outsourcing

Malentendidos técnicos y límites del avance

  • Muchos casos de fracaso ocurrieron porque las empresas no entendieron con precisión las posibilidades reales y los límites de la IA
  • La IA generativa puede crear texto o código rápidamente, pero carece de aprendizaje continuo y flexibilidad como la de un ser humano
  • Por ejemplo, un empleado puede responder de manera flexible a errores previos o a nuevas exigencias, pero la IA no puede transferir ese tipo de memoria continua

Inversión y dirección futura

  • Inversionistas y directivos esperan un avance continuo de la tecnología de IA, pero en el corto plazo el progreso va más lento de lo previsto
  • El informe sugiere que todavía es prematuro introducir IA de inmediato en todas las industrias y flujos de trabajo
  • Las organizaciones necesitan concentrar su adopción en áreas acotadas donde sea posible obtener efectos inmediatos y medibles
    • Ejemplos: automatización de soporte al cliente, herramientas de apoyo al desarrollo y redacción de borradores de documentos
  • La integración de IA en toda la empresa sigue siendo muy riesgosa y con alta probabilidad de fracaso

Conclusión e implicaciones

  • La materialización del valor empresarial de la IA generativa se limita a unos pocos casos exitosos
  • La mayoría de las empresas apenas obtiene una ayuda marginal en tareas cotidianas
  • El informe enfatiza que las empresas deben ver la IA generativa no como un motor de crecimiento total, sino como una herramienta limitada
  • Aunque las expectativas son altas, mientras los sistemas actuales no logren adaptarse como un ser humano, será difícil que las empresas obtengan grandes ganancias de la IA

1 comentarios

 
GN⁺ 2025-08-22
Opiniones de Hacker News
  • Hubo una discusión duplicada esta semana (162 comentarios) https://news.ycombinator.com/item?id=44941118 El reporte fuente real, que el artículo no enlazó, es https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf
  • Dicen que ese reporte es completamente distinto a lo que plantea el artículo; comparten algunos datos: 50% del presupuesto fallido se usó en marketing y ventas, se estima que la IA podría automatizar 2.3 billones de dólares de valor laboral, afectar 39 millones de puestos, y se enfatiza que las principales causas del fracaso son el rechazo a adoptar nuevas herramientas y la falta de apoyo de la dirección. Creo que están llegando demasiado rápido a la conclusión de que la IA no funciona. Eso no es lo que dice el reporte.
    • Dicen que la "IA automatiza 2.3 billones de dólares de valor laboral y afecta 39 millones de puestos", pero la automatización posible del valor laboral en EE. UU. actualmente es de 2.27%. El PIB de EE. UU. es ahora de 27 billones de dólares, así que supuestamente optimizando 61 mil millones de dólares en valor laboral estadounidense y reemplazando a alrededor del 15% de la población trabajadora de EE. UU. se generarían 2.3 billones de dólares de valor; no estoy seguro de que esas cuentas realmente cuadren. También me pregunto quién va a comprar todo eso (si no son los trabajadores, ¿entonces quién?). La inversión en IA de 2025 ya supera la mitad de esa cifra. En esta situación no sé cómo habría que medir el "valor laboral". El PIB no parece una métrica adecuada.
    • La impresión que me dejó también coincide con el reporte. Algunas noticias simplemente empujan una narrativa sensacionalista para generar clics. Están malinterpretando gravemente el contenido real del reporte. No es que la IA esté fallando, sino que el problema es más bien que los empleados actuales no están adoptando bien las herramientas, o al menos no las herramientas que les da la empresa. Esa "economía de Shadow AI" que mencionan también es un problema real. La gente está usando suscripciones personales a LLM en lugar de las herramientas que ofrece la empresa. En nuestra universidad también dimos ChatGPT Enterprise a todos los estudiantes y al personal, pero se queda bastante corto frente a las versiones más recientes en la nube (por ejemplo, GPT-5). Por eso la adopción del sistema y la retención de usuarios son bajas. En la mayoría de los casos de uso, la nube permite usar datos cuyo uso no es ilegal, así que no hay tantas restricciones.
    • Esta parte del reporte me llamó especialmente la atención: un abogado de un bufete mediano compró una herramienta de análisis de contratos por 50 mil dólares para la empresa, pero en la práctica sigue usando ChatGPT. La herramienta de IA que compró la empresa hace resúmenes demasiado rígidos y es difícil de personalizar, pero con ChatGPT puede llevar la conversación y obtener iterativamente el resultado que quiere. O sea, la paradoja es que una herramienta de 20 dólares resulta mucho mejor, en satisfacción real del usuario, que una solución enterprise de decenas de miles de dólares. Por eso explican que muchas empresas terminan del lado equivocado de la brecha de GenAI.
    • Que afecte a 39 millones de puestos realmente es una cifra sorprendente. La población trabajadora de EE. UU. es de 163 millones, así que significaría que casi una cuarta parte estaría en riesgo.
    • Sobre el comentario de que "mucha gente está llegando demasiado rápido a la conclusión de que la IA no sirve", comparten la famosa frase: "Es difícil lograr que una persona entienda algo cuando su salario depende de no entenderlo".
  • Actualmente lidero un equipo de ingeniería de IA, así que naturalmente la idea de que la IA genera valor encaja con mi experiencia. En nuestra empresa la adopción de IA nos permitió ahorrar millones de dólares. Operamos un gran call center y antes los empleados escribían manualmente resúmenes de 3 a 5 minutos por cada llamada. Hace poco automatizamos con IA el resumen de llamadas. La calidad de los resúmenes también mejoró y la gente puede concentrarse en tareas de más valor. No es revolucionario, pero sí es un aumento de eficiencia real y medible.
    • Tip útil: sugiero no escribir resúmenes en sí y generarlos solo cuando se necesite consultar el material. El audio de las llamadas puede guardarse en Opus a 24Kb/s, lo que da 180KB por minuto, y con un proceso de almacenamiento por cierto tiempo y eliminación posterior se pueden ahorrar varios millones de dólares adicionales al año.
    • En nuestra empresa usamos Google Meet y Gemini para generar transcripciones de las reuniones. Pero en la práctica el contenido es muy inexacto. Confunde quién dijo qué, a veces invierte el sentido de lo dicho, y carece de contexto. Tampoco entiende nuestra terminología interna, así que en realidad está a un nivel que no se puede usar.
    • Me pregunto si los agentes del call center realmente sienten que los resúmenes de IA son mejores que los suyos. En mi caso pienso que sería difícil usarlo para resúmenes de reuniones. Parece que esto solo funciona bien en llamadas unidireccionales.
    • Nosotros también probamos IA para resumir reuniones, pero los resultados fueron tan pobres que volvimos a hacerlos manualmente. Me pregunto si hubo casos concretos en los que funcionó bien, o si hubo capacitación/personalización específica.
    • Me pregunto por qué un agente de call center tendría que dedicar de entrada 3 a 5 minutos a redactar un resumen de cada llamada. Entre los muchos casos de uso de IA, a menudo veo que en realidad se automatizan tareas innecesarias. Si nadie lee los reportes, entonces la calidad del resumen no importa, así que da lo mismo si la IA lo escribe mal. En la eficiencia operativa, lo importante no es automatizar procesos innecesarios, sino eliminarlos. Al final, parece que muchas veces la IA solo tapa trabajo desperdiciado dentro de la organización. Si esa optimización no se puede hacer, entonces incluso esto podría seguir siendo necesario.
  • Este es el momento en que entramos en el “Trough of disillusionment”. Este ciclo de hype es predecible. Como GPT-5, tras enormes expectativas, está recibiendo comentarios de decepción, esto podría convertirse en el “ya se acabó” de la GenAI. Cuando se empieza a preguntar por el ROI, la realidad sale a la luz. La gente lista ya se está preparando para la siguiente transformación, y todavía quedan quienes van a seguir bajando hasta el fondo del valle. El PR cada vez más desesperado va a insistir en que "sí tiene valor real".
    • No me sorprendería que la mayoría de las empresas hubieran invertido obligadas por el precio de la acción, aun sabiendo que era tirar dinero.
    • Gemini da una impresión bastante buena con cada actualización, pero últimamente se ha desacelerado mucho tanto en velocidad de mejora como en calidad del contenido. Eso me parece una señal de que se acerca una pared. En el patrón de estancamiento seguido de un nuevo salto, creo que los LLM tienen un futuro mejor que computer vision.
    • Sam Altman promocionó demasiado las capacidades de GPT-5. Desde la perspectiva del usuario no se siente como un gran salto frente a GPT-4. Pero el hecho de que el enfoque de dynamic router entrenable haya reducido bastante el costo de inferencia sí es muy importante. Es una innovación que beneficia más a OpenAI y a la red eléctrica que a los usuarios.
    • Cuando OpenAI pasó de GPT-3.5-Turbo a GPT-4 fue un cambio revolucionario y no había otros modelos. Pero antes de que saliera GPT-5 ya habían aparecido muchísimos modelos, como la serie o, Llama, DeepSeek, Gemini, etc. En adelante no habrá saltos como el de GPT-3.5 a 4. GPT-5 integra varios modelos en uno, pero no tiene el título de "primero".
    • Me pregunto si esa será la razón por la que el equipo de Windsurf vendió temprano y se fue.
  • Preguntan cuáles son algunos casos de uso realistas de IA que de verdad generen ingresos o reduzcan costos. 1. Generación de contenido online (ya sobresaturada) 2. Reemplazo de desarrolladores junior (productividad limitada) 3. Reemplazo de personal de atención al cliente (reduce costos, pero con poco impacto en ingresos) 4. Herramientas de apoyo (escritura, análisis, etc., con límites) 5. Interacciones de nueva generación como videojuegos/personajes robóticos 6. Novias virtuales de IA y NSFW, un mercado que parece que seguirá siendo rentable por un tiempo. Preguntan si hay casos más realistas.
    • Estoy trabajando en un proyecto con LLM para extraer información específica de documentos semiestructurados y luego clasificarlos/archivarlos automáticamente; ya tiene más de 95% de precisión y ni siquiera lo hemos fine-tuneado todavía. Al final pasará por aprobación manual, pero ya está ahorrando cientos de horas al año. La IA es muy efectiva para extracción y clasificación de información.
    • En healthcare, las notas clínicas, los datos y la interpretación de imágenes están todos directamente vinculados a ingresos. Cada año se gastan miles de millones de dólares en costos administrativos en esta parte. Si con GenAI se puede elevar mucho la calidad/precisión de las notas, es posible aumentar ingresos de forma directa. En seguros pasa algo parecido: se necesita muchísimo trabajo documental y verificación. Al final quizá las IAs solo se pasen documentos entre sí mientras las personas están sentadas junto a la alberca.
    • La atención al cliente con IA es una experiencia irritante desde el punto de vista del usuario.
    • Mejorar la productividad 50% por 200 dólares al mes es un valor enorme. La tasa anual de crecimiento de productividad en la mayoría de los países es de 0 a 2%.
    • Me gustaría que existiera una IA que conectara con RAG la documentación interna, la wiki y la base de código de la empresa para facilitar el onboarding y la búsqueda de información. Más que reemplazar personas, sería mejor buscar formas de hacer el trabajo más fácil.
  • El mayor error que comete la gente es que la IA debe verse como una feature, no como un servicio. Nadie piensa "¡Hoy quiero hablar con una IA!". Los usuarios quieren terminar bien su trabajo sin aburrirse demasiado ni sentirse abrumados. Ahí es donde la IA debería ayudar silenciosamente. Pero como lo que vendemos no es una feature sino un servicio (=producto), en marketing no queda otra que poner a la IA al frente. Notion/Slack/Airtable y todos los demás ponen la IA en el titular, pero la esencia no es la IA, sino la naturaleza del trabajo al que ayuda.
    • Yo ni siquiera diría que la IA es una feature; al final la IA es una tecnología. No es tanto "ojalá este producto tuviera IA", sino "ojalá pudiera hacer esta tarea". Si el producto resuelve mi trabajo, me da igual por qué método lo haga. Demasiadas empresas intentan meter IA por meterla fácilmente, pero no se enfocan en resolver el problema que el usuario realmente quiere solucionar.
    • Lo que dices es cierto, pero en la práctica si se hace así desaparecen las altas valuaciones del mercado y el ambiente de sobrecalentamiento. Cuando llegue ese momento de despertar, incluso las áreas de software "hot" que queden se apagarán y el sector completo tendrá que aceptar la realidad de que ya no es el mismo mercado de hace 5 a 10 años.
    • Ojalá la IA se presentara como una herramienta más. Bastaría con una sola notificación tipo "estos son los casos de uso". La realidad es que toda la UI está empapelada con logos de IA, autocompletado, etc., y eso rompe la concentración. Se siente como si la herramienta no fuera la protagonista, sino el dueño. En realidad bastaría con guiar al usuario para que la use cuando la necesite, pero se siente demasiado forzado. Estas empresas deberían parar un poco y dejarle más espacio al usuario.
    • Coincido totalmente; al final lo importante es el valor del producto en sí, no qué se usó debajo para construirlo.
    • Hoy en día casi todas las aplicaciones con IA parecen "una solución en busca de un problema".
  • El enlace al PDF del reporte redirige a una landing page y el CTA dice "haz que tu producto de IA tenga éxito más rápido", así que más que un reporte objetivo parece contenido de marketing bastante común. Hice clic en el nombre del autor y no salió nada. No me inspira confianza ni el sitio ni el autor. HN ahora también parece Reddit: la gente entra, lee solo el título y deja comentarios para decir si está de acuerdo o no.
  • Me pregunto qué pasaría si la gente leyera directamente el informe real https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf. Solo 40% de las empresas tiene suscripciones oficiales a LLM, pero más de 90% de los empleados de las empresas usa herramientas personales de IA de forma cotidiana en el trabajo. En la práctica, casi todos los empleados están usando LLM de alguna manera. Los usuarios de "Shadow AI" usan LLM varias veces al día incluso mientras los proyectos oficiales de la empresa siguen estancados en fase piloto. Se da la situación paradójica de que las iniciativas oficiales de IA empresarial fracasan, mientras que en la práctica el uso de LLM se expande dentro de la empresa. Esta historia, más que una nueva bomba informativa como la presenta el artículo, podría ser en realidad algo completamente distinto.
  • Parece que así es como EE. UU. siempre se adelanta en cada ola de innovación tecnológica. Gasta mucho dinero y también pierde mucho, pero como asume el riesgo, al final avanza hasta un punto en que ya no se le puede alcanzar. Es peligroso declarar victoria demasiado pronto contra la IA o contra las empresas estadounidenses.
    • No creo que se pueda generalizar que EE. UU. va delante en todo. En muchas áreas, como finanzas, va por detrás de otros países. China lleva la delantera en vehículos eléctricos, energía solar, etc. En software sí, pero el muro defensivo de EE. UU. está construido con monopolios, lock-in y regulaciones hechas a la medida de los ricos.
    • Esa forma de pensar es demasiado simplista. De hecho puede distorsionar la realidad.
    • Mencionan ejemplos como energía solar, vehículos eléctricos y drones para decir que no necesariamente se puede afirmar que EE. UU. siempre va por delante.
    • También se menciona la historia de GSM para plantear que no siempre EE. UU. ha liderado la innovación.
  • Es interesante que la autoevaluación de la propia productividad puede no coincidir con la realidad. En un estudio de METR, los desarrolladores sintieron que eran 20% más rápidos gracias a la IA, pero en realidad fueron 19% más lentos https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
    • Incluso con estudios así hay muchos matices que son difíciles de captar. El tipo de IA usada, las herramientas, la familiaridad, el proceso de desarrollo, el tamaño del equipo y hasta el nivel jerárquico o la minuciosidad del usuario influyen en el resultado. Ahora mismo los inversionistas están subsidiando agresivamente el precio de la IA para ganar market share, pero cuando eso termine creo que los precios podrían incluso bajar más. Yo siento que ya me he beneficiado bastante gracias al avance de la IA; en adelante creo que lo central serán las mejoras graduales y la experiencia de usuario. Por ahora no tengo intención de invertir en empresas de IA.
    • A veces la IA parece leerme perfectamente la mente, como un autocompletado ideal; otras veces propone cosas totalmente absurdas y solo estorba.
    • También me pregunto si la IA no estará haciendo que la gente se concentre demasiado en mejoras pequeñas y "in the weeds", perdiendo de vista el panorama general. La velocidad de desarrollo al final depende más de decisiones estratégicas globales (¿debería usar esta herramienta?, ¿esta feature realmente hace falta?, etc.).
    • Aunque el tamaño de muestra es pequeño, sigue siendo un estudio mucho más significativo que la evidencia anecdótica o los datos autorreportados.