7 puntos por GN⁺ 2025-09-15 | 2 comentarios | Compartir por WhatsApp
  • Este año, las cuatro grandes tecnológicas globales están gastando 344 mil millones de dólares en IA, invirtiendo la mayor parte en centros de datos para entrenar y operar modelos de lenguaje de gran escala (LLM)
  • Los LLM ya lograron masificarse, al punto de que más de 700 millones de personas usan ChatGPT cada semana, pero su avance se está desacelerando y están quedando expuestas limitaciones como alucinaciones, altos costos y mejoras de rendimiento marginales
  • La china DeepSeek sorprendió al mercado al presentar un modelo más pequeño y eficiente, y empresas como Covariant (robótica) y Atman Labs (enfoque no basado en deep learning) están explorando una IA que responda al mundo físico
  • Según investigaciones recientes, la capacidad de razonamiento social de los LLM depende de unas pocas características y es vulnerable incluso a cambios pequeños, y OpenAI también reconoció la posibilidad de fallas en las salvaguardas para grupos vulnerables
  • Expertos critican que los LLM no son más que ‘generadores de tokens’, y advierten que la obsesión con una sola tecnología puede aumentar la inestabilidad del mercado, por lo que hay que prepararse para el posible surgimiento de nuevos enfoques

La enorme inversión en IA y el centralismo de los LLM

  • Todo inversionista sabe que “no hay que poner todos los huevos en una sola canasta”, entonces ¿por qué Silicon Valley está apostando por un solo método para construir inteligencia artificial (IA)?
  • Las cuatro mayores tecnológicas del mundo invertirán 344 mil millones de dólares en IA en 2025, concentrándose principalmente en construir centros de datos para entrenar y ejecutar modelos de lenguaje de gran escala (LLM)
  • Los LLM procesan entradas multimodales como texto, audio y contenido visual, y dependen de la técnica de predecir el siguiente token dentro de una secuencia
  • Los chatbots personales están creciendo rápidamente, algunas startups de IA ya comenzaron a generar ingresos y las empresas también están mejorando su productividad inicial con IA generativa
  • Los LLM son la primera tecnología de IA que logró adopción masiva, y ChatGPT tiene más de 700 millones de usuarios semanales
  • Algunas startups alcanzaron el punto de equilibrio, pero en sectores sensibles como salud y derecho siguen existiendo límites para ganar confianza debido al problema de las alucinaciones

El riesgo de obsesionarse con una sola tecnología

  • Sin embargo, concentrarse en una sola tecnología es riesgoso, y hay precedentes de fracaso, como BlackBerry, que insistió en el teclado físico y fue desplazada por la pantalla táctil de Apple, o Yahoo, cuya apuesta por el portal perdió frente al dominio de búsqueda de Google
  • Los LLM también corren el riesgo de seguir ese mismo camino, y si surge un nuevo enfoque de IA, la inversión masiva podría quedar varada
  • La china DeepSeek demostró en enero la posibilidad de un enfoque no tradicional al presentar un LLM más pequeño y eficiente y abrir su arquitectura, sorprendiendo al mercado

Explorando enfoques alternativos

  • El avance de la IA ocurre combinando ideas del pasado con nuevas propuestas, y la búsqueda de máquinas superinteligentes también requiere un enfoque diversificado
  • Startups como Covariant se alejan del enfoque centrado en LLM al desarrollar software de percepción espacial en lugar de basarse en el análisis de patrones de datos
  • Empresas de robótica, drones, descubrimiento de fármacos y modelado climático se están apartando del centralismo de los LLM porque necesitan respuesta física en tiempo real
  • La británica Atman Labs está rescatando ideas olvidadas de antes del deep learning, reflejando el enfoque inicial de múltiples vías de Google DeepMind (por ejemplo, AlphaGo y aprendizaje por refuerzo)

Límites de los LLM y problemas de confiabilidad

  • Ahora están apareciendo grietas en la lógica de los modelos de lenguaje de gran escala: desde costos exorbitantes hasta perspectivas de rendimientos decrecientes
  • Los modelos más recientes de OpenAI o Google son apenas un poco mejores que los anteriores, incluso después de invertir mucho más dinero
  • Aun así, las alucinaciones no desaparecen, lo que sigue siendo un obstáculo para su adopción en empresas dedicadas a tareas como análisis médico o legal
  • Un estudio reciente en Nature señaló que la capacidad de razonamiento social de los modelos de lenguaje depende de muy pocas características y puede colapsar con cambios pequeños, lo que plantea preguntas fundamentales sobre su confiabilidad
  • OpenAI reconoció que, en conversaciones prolongadas, podrían colapsar las salvaguardas para grupos vulnerables, y de hecho ocurrió un caso en que se entregaron instrucciones de autolesión a un adolescente

Críticas de la industria y panorama

  • Fei-Fei Li: “En la naturaleza no existe el lenguaje, y el mundo sigue leyes físicas”, señalando así los límites del enfoque centrado en el lenguaje
  • Alex Karp (CEO de Palantir): criticó que “Silicon Valley exageró la promoción de los LLM”
  • Yann LeCun: los LLM son un ‘callejón sin salida’ para construir máquinas más inteligentes, no pasan de ser ‘generadores de tokens’ y no pueden entender su entorno físico ni planificar con anticipación
  • En conclusión, los LLM seguirán existiendo, pero obsesionarse con una sola solución es riesgoso, y tanto inversionistas como empresas deben prepararse para la posibilidad de un cambio hacia un nuevo paradigma tecnológico

2 comentarios

 
mhj5730 2025-09-15

Desde GPT-5, se nota que están intentando exprimir mejoras de rendimiento a la fuerza con el razonamiento, pero incluso eso tampoco parece fácil. Respuestas que podrían quedarse en una contestación razonable ahora llegan en decenas de líneas, y se siente demasiado pesado. snif snif

 
GN⁺ 2025-09-15
Opiniones en Hacker News
  • Ver en https://archive.is/2rFK4

  • Esta tecnología se ve increíblemente impresionante en las demos; se nota que todo el mundo está muy emocionado, y ver a colegas o ejecutivos presumirla con orgullo o seguir haciendo bromas sin parar me recuerda a cuando la gente recibió por primera vez los celulares y se los enseñaba a los demás. Por eso tiende a percibirse como algo más grande de lo que realmente vale; será un avance significativo, como el teléfono móvil, pero en el corto plazo no tendrá tanto impacto como sugiere el hype. Sobre todo en foros anónimos se señala mucho que “esto está sobrevendido”, pero en los roles profesionales todos terminan siguiéndole la corriente al ambiente, como si todos supieran lo que está pasando pero igual quisieran que la fiesta continúe.

    • Si mi jefe exagera demasiado con la AI y dice que toda la empresa debe apostarlo todo, en un mercado laboral tan difícil como el actual mucha gente se alineará por miedo, especialmente porque sienten que la AI ya está reduciendo empleos. Algunos simplemente siguen usando en silencio herramientas realistas que sí les sirven, como LSP o refactorización. En entornos profesionales, solo unos pocos se atreven a decir “el emperador está desnudo”.

    • Es interesante que en foros anónimos más bien se vea mucha gente diciendo que la AI es una innovación que cambiará su vida. Al menos, cuando no están fingiendo ser expertos, esa postura aparece con más facilidad. En el trabajo, la gente se divide en dos grupos: quienes venían usando AI en áreas fuera de su especialidad la elogian en exceso, como si estuvieran viendo por primera vez la revolución del teléfono móvil; pero cuando aplican la AI en su propio campo, sienten directamente que está sobrevalorada en algunos aspectos y se vuelven optimistas más cautelosos. En cambio, quienes desde el inicio la usan mejor dentro de su propia área suelen ser positivos, pero por lo general con calma, en el sentido de que funciona bien en entornos limitados.

    • Es fácil olvidar que todavía hay mucha fruta al alcance de la mano para sacarle el máximo provecho a esta tecnología. La gente sigue intentando integraciones muy básicas. Incluso en esta etapa temprana ya se pueden hacer cosas muy buenas con los LLM; por ejemplo, modernizar una base de código antigua con Cursor y crear funciones nuevas que llevabas mucho tiempo queriendo. Yo invertí unas pocas horas en algo que con el método anterior me habría tomado una o dos semanas. El potencial es enorme. Dicho eso, el hype en realidad me queda algo lejos, así que puede que mi percepción sea distinta.

    • Este sistema no tiene barras de error ni intervalos de confianza. Al final, no deja de ser un charlatán que tiene una sola “habilidad”: producir resultados que a simple vista parecen plausibles. Claro que tiene muchas áreas de uso adecuadas, pero sigue teniendo huecos cuyo tamaño ni siquiera puede predecirse y que no se pueden corregir, así que su eficiencia tiene límites.

    • Es interesante la comparación con los smartphones. Los smartphones definitivamente cambiaron el mundo y también estuvieron rodeados de mucho hype, pero al final el cambio fue real. Me pregunto si creen que los LLM y la AI también producirán un cambio real.

  • Me pregunto cuál es el plan para recuperar toda esta inversión. Incluso si todas las grandes empresas de EE. UU. pagaran 100 mil dólares al año en suscripciones y todos los hogares pagaran 20 dólares al mes, parece muy insuficiente para recuperar la inversión si se consideran los costos de inferencia y otros gastos asociados. ¿Tendría que aparecer algún descubrimiento nuevo en medicina? Por ejemplo, lo de gpt-bio e iPSC de OpenAI fue realmente impresionante, pero todavía falta muchísimo para su comercialización. Me pregunto cuál es el plan real.

    • Según recuerdo, el objetivo original era AGI. No se trataba de buscar ROI con los servicios actuales de AI. La idea era que, si llegaba AGI, quien la lograra tendría un monopolio, así que todos metieron dinero como quien compra boletos de lotería. Pero como en el último año no hubo un avance exponencial, se siente que el sueño de AGI se ha enfriado un poco.

    • El plan de juego siempre apuntó desde el principio al trabajo humano. Algunos empleos ya están siendo reemplazados por completo por AI, y en el resto la productividad aumenta mucho. Ese valor económico es enorme. Incluso sin AGI, la automatización basada en AI ya está reemplazando seriamente la mano de obra “más barata y más fácil de sustituir”. Tareas que antes se tercerizaban a call centers en India poco a poco se están moviendo a centros de datos. Las principales empresas de AI creen que, si siguen invirtiendo en I+D y cómputo, al final llegarán a AGI.

    • Si la AI no te despide, no puede pagar su propio costo.
      If AI Doesn’t Fire You, It Can’t Pay For Itself

    • Si los LLM realmente pudieran duplicar la eficiencia de todo el trabajo de oficina, las grandes empresas tendrían que pagar muchísimo más que 100 mil dólares al año. Si pagaran aunque sea el 25% del ahorro obtenido por reemplazar la mitad de los puestos, generarían ingresos suficientes como para que las valuaciones actuales parecieran muy baratas.

    • 100 mil dólares al año no es prácticamente nada. Es, más o menos, 10 mil dólares por empleado; incluso asumiendo 100 mil dólares por persona entre salario y prestaciones, si la productividad del personal aumenta apenas 10%, el efecto ya es enorme. En una empresa de 10 mil personas, eso equivale a 100 millones de dólares al año.

  • No tengo una intuición clara de qué tan grande es 344 mil millones de dólares, pero la capitalización total del mercado bursátil estadounidense es de 62.8 billones de dólares. La razón CAPE de Shiller (precio actual / ganancias promedio de 10 años) ronda las 38 veces. Es decir, la ganancia anual promedio durante 10 años sería de alrededor de 1.7 billones de dólares. Por lo tanto, 344 mil millones equivalen aproximadamente a una quinta parte de las ganancias anuales promedio del mercado accionario de EE. UU. Así es una cifra un poco más fácil de dimensionar.

    • Últimamente administro directamente mi portafolio y calculo rendimientos esperados por país o región ajustando el riesgo sobre la base de rendimiento esperado (PIB + dividendos). Lo rebalanceo una o dos veces al año. Si asumimos que casi todo esto es una burbuja, me pregunto cómo habría que ajustar las ganancias del mercado estadounidense, especialmente para aplicarlo al seguir acciones centradas en AI.

    • Pero esos 344 mil millones de dólares no son una cifra anual, sino acumulada.

  • Lo que existe hoy es una gran interfaz que permite a los usuarios acceder sin fricción a sistemas muy complejos para trabajo o uso personal. Pero eso no es la esencia misma del asunto; por ahora no deja de ser una capa delgada. Dudo que esta revolución termine valiendo billones de dólares, pero por suerte no es mi problema, así que vivo tranquilo.

  • Este “artículo” es puro clickbait: tiene un título provocador, pero casi nada de sustancia. Solo lanza preguntas vacías del tipo “en algunos casos es útil, entonces ¿por qué las grandes empresas están invirtiendo tanto?, tal vez sería mejor hacer I+D pura”.

  • Así como cuando aparecieron las películas la gente se preocupaba por si el tren iba a atropellarlos, ahora yo también estoy del lado de quienes creen que las máquinas piensan.

  • Definitivamente hay una burbuja en el mercado actual. Últimamente explotó la cantidad de startups que usan AI y, como todas intentan diferenciarse dentro de categorías de producto similares, cada detalle técnico termina convertido en frase de marketing. Desde la perspectiva de un ejecutivo, aunque diez startups prometan “si entrenas con nuestros datos tendrás el mejor chatbot”, es difícil distinguir si realmente están entrenando algo o solo están retocando prompts. Esto ya había pasado antes, y un ejemplo representativo es “deep research” y demás. Este tipo de marketing ayuda a crecer, pero destruye la confianza. De hecho, una startup que recientemente levantó una Serie A mejoró el rendimiento simplemente añadiendo memoria al prompt y vendiéndolo como “aprendizaje basado en experiencia” (puedes buscarla por tu cuenta). Eso no significa que no haya ideas innovadoras. Personalmente, creo que el pretraining ya cumplió suficientemente bien con su propósito original. Antes ni siquiera estaba claro cuál era ese propósito, pero con el auge de RL se volvió más evidente de manera vaga. El pretraining y el cómputo en entornos de prueba son la clave para acumular priors generales, es decir, conocimiento previo general, lo que permite resolver distintos problemas como lo hace un ser humano. A veces, cuando no funciona bien, todavía hace falta entrenamiento adicional con RLVR. Aún estamos en una etapa temprana, pero soy optimista en que por esa vía veremos otra curva de escalado.

  • Las empresas tienen que invertir en AI sí o sí, tengan mucho dinero o poco, porque los LLM están amenazando los modelos de negocio existentes y tienen que actuar de forma preventiva. Si no logran ir por delante, existe incluso el riesgo de que toda la economía estadounidense se tambalee. Si la gran tecnología de EE. UU. pierde los ingresos publicitarios globales (Meta, Google), podría quedarse reducida a un cascarón de un día para otro, porque si cada país o bloque económico crea y adopta sus propios productos, reemplazar los de EE. UU. sería demasiado fácil. La economía estadounidense en la práctica ha dependido demasiado de los flujos de caja de FAANG, y ese dinero ha sido el motor que también movía otras industrias. Por eso también se entiende que hubiera cenas con Trump. Si esta posición de la AI se debilita, EE. UU. enfrentará un futuro económicamente muy inestable.

  • La razón de los enormes movimientos de Oracle en el mercado es la noticia de que OpenAI prometió trasladar a gran escala sus cargas de trabajo a su nube. En realidad, es una estrategia de “ingeniería” financiera que prioriza ingresos sobre ganancias, especialmente aplazando el gasto de capital (CapEx) lo más posible hacia el futuro. En resumen, es un ejemplo de qué tan excesiva es la burbuja actual de la AI. Según un análisis reciente de The Economist, el mercado ya no se mueve por “riesgo”, sino por “miedo a las pérdidas” o miedo a quedarse fuera (FOMO), y ahora mismo ese FOMO está completamente desatado.
    Want better returns? Forget risk, focus on fear (Economist)

    • Esta subida explosiva reciente de Oracle y su perspectiva de ingresos se siente totalmente como jumping the shark. Por la naturaleza misma de Oracle como empresa, soy cauteloso a la hora de apostarle, pero esta vez hasta me tienta probar una posición corta.

    • El FOMO realmente está gravísimo. La bolsa actual se está moviendo como la burbuja cripto de antes.