3 puntos por GN⁺ 10 일 전 | 1 comentarios | Compartir por WhatsApp
  • AI Index 2026 es un informe que reúne las tendencias generales de la IA con métricas como rendimiento en benchmarks, inversión, percepción pública, cómputo y emisiones de carbono
  • Los lanzamientos de modelos de IA destacados siguieron concentrándose en Estados Unidos y en la industria, mientras que China registró una clara ventaja en instalación de robots industriales
  • La capacidad global de cómputo para IA ha crecido más de 3 veces por año desde 2022, y las GPU de Nvidia representan actualmente más del 60 por ciento de la capacidad total
  • El rendimiento en benchmarks de los LLM multimodales y de la agentic AI aumentó rápidamente, pero siguió habiendo baja precisión en tareas generales como leer relojes analógicos
  • La inversión en IA superó los 581 mil millones de dólares en 2025 y marcó un nuevo máximo, mientras que el impacto en el empleo, la confianza en la regulación y la aceptación pública mostraron grandes diferencias según el país y la métrica

Indicadores clave del reporte AI Index 2026

  • El informe AI Index 2026 de Stanford, de más de 400 páginas, reúne el estado de la IA desde varios ángulos, incluidos puntajes de benchmarks, inversión y percepción pública
  • El rendimiento de los modelos líderes de IA sigue acelerándose, y grandes empresas de IA como OpenAI y Anthropic avanzan hacia una IPO más adelante este año
  • También persiste el rechazo hacia la IA; en particular, en Estados Unidos los gobiernos locales han comenzado a aceptar restricciones o prohibiciones totales a nuevos desarrollos de centros de datos
  • Siguiendo la cobertura de años anteriores de 2021 a 2025, se seleccionan tendencias que condensan el estado de la IA en 2026

Ventaja de Estados Unidos en modelos de IA

  • Estados Unidos ha liderado durante la última década el lanzamiento de modelos de IA destacados, y mantuvo esa tendencia en 2025
    • Según Epoch AI, las organizaciones con sede en Estados Unidos lanzaron 50 modelos destacados en 2025
    • La producción de China comenzó a cerrar la brecha
  • Casi todos los modelos destacados surgieron de la industria
    • En 2025, la industria lanzó 87 modelos destacados
    • Otras fuentes combinadas, incluidas academia y organismos gubernamentales, lanzaron 7
  • La participación de la industria se ha ampliado fuertemente a largo plazo
    • Los modelos lanzados por la industria ya representan más del 90 por ciento de los modelos destacados
    • En 2015 era menos del 50 por ciento, y en 2003 era 0

Ventaja de China en despliegue de robótica

  • Aunque las empresas estadounidenses van adelante en número de modelos de IA destacados, China tiene una ventaja clara en despliegue de robótica
    • Según datos de la International Federation of Robotics, China instaló 295,000 robots industriales en 2024
    • Japón instaló alrededor de 44,500 y Estados Unidos 34,200

Aumento explosivo del cómputo global para IA

  • La métrica de capacidad total de cómputo para IA de Epoch AI se presenta como un indicador representativo de la expansión de la infraestructura de IA
  • En la gráfica, que usa el rendimiento del H100e de Nvidia como referencia, la capacidad global de cómputo para IA se ha multiplicado por más de 3 cada año desde 2022
    • Tomando 2021 como primer año de seguimiento, el cómputo total para IA aumentó 30 veces
  • Nvidia ha sido el mayor beneficiario de esta expansión
    • Las GPU de Nvidia representan actualmente más del 60 por ciento de la capacidad total global de cómputo para IA
    • Le siguen Amazon y Google, que diseñan su propio hardware para IA

Emisiones de carbono del entrenamiento y la inferencia de IA

  • Las emisiones de carbono del entrenamiento de IA ya habían sido señaladas en años anteriores, y la preocupación continuó en 2026
  • Se estima que el entrenamiento de los más recientes modelos de lenguaje grandes de frontera genera emisiones muy elevadas
    • La estimación de emisiones por el entrenamiento de Grok 4 de xAI supera las 72,000 toneladas de CO₂ equivalente
    • Se estima que GPT-4 de OpenAI emitió 5,184 toneladas y Llama 3.1 405B de Meta 8,930 toneladas
  • Ray Perrault aclara que estas cifras son estimaciones y pide cautela al interpretarlas
    • “These estimates should be interpreted with caution”
    • En el caso de Grok, existe incertidumbre porque depende en gran medida de valores de entrada inferidos a partir de un artículo de Forbes, declaraciones de xAI y otras fuentes no verificables
    • Epoch AI estima de forma independiente que las emisiones de Grok 4 fueron aún mayores, de cerca de 140,000 toneladas de CO₂
  • Las emisiones por inferencia de IA también van en aumento, y además hay grandes diferencias entre modelos
    • El modelo de inferencia menos eficiente emite más de 10 veces que el más eficiente
    • Se estima que DeepSeek V3 consume unos 23 watts al responder prompts de longitud media
    • Se estima que Claude 4 Opus consume cerca de 5 watts

Aceleración del rendimiento en benchmarks de LLM

  • Durante la última década, el rendimiento de los modelos de IA ha mejorado muy rápido, y en las gráficas el ritmo de avance parece acelerarse aún más
  • En particular, los LLM multimodales avanzan al punto de conquistar casi de inmediato los benchmarks recién creados
  • El mayor salto se observa en el área de la agentic AI
    • Las dos líneas de fuerte pendiente al lado derecho del gráfico corresponden al benchmark OSWorld, que evalúa uso autónomo de computadoras
    • Y al benchmark de ingeniería de software SWE-Bench Verified, que evalúa coding autónomo
  • El rendimiento también mejoró rápidamente en Humanity’s Last Exam
    • En el Stanford AI Index 2025, el modelo número 1, o1 de OpenAI, tenía una tasa de acierto de 8.8 por ciento
    • Después, la precisión subió hasta 38.3 por ciento
    • A abril de 2026, modelos con las puntuaciones más altas como Claude Opus 4.6 de Anthropic y Gemini 3.1 Pro de Google superan el 50 por ciento
  • Ray Perrault advierte sobre la correspondencia entre benchmarks y desempeño real
    • “We generally lack measures of how well a system (or agent) needs to function in a particular setting”
    • Menciona que una precisión de 75 por ciento en un benchmark de razonamiento jurídico no basta para saber si el sistema sirve para el trabajo real de un bufete

Expansión de la investigación en IA aplicada a la salud

  • La adopción de IA en la investigación médica está creciendo rápidamente
  • El número de papers sobre descubrimiento de fármacos basado en IA se ha más que duplicado en los últimos 2 años
  • El número de papers sobre IA biomédica multimodal, que trabaja con imágenes médicas y texto al mismo tiempo, es 2.7 veces mayor que hace 2 años

Límites para leer relojes analógicos

  • A diferencia de la rápida mejora en algunas áreas, siguen las debilidades en tareas generales como leer relojes analógicos y entender calendarios
  • En ClockBench, que mide la capacidad de los LLM multimodales para leer relojes analógicos, incluso el mejor modelo apenas tiene una probabilidad de éxito cercana a la mitad
    • La probabilidad de acierto de GPT-5.4 de OpenAI es 50-50
  • La mayoría de los modelos obtienen resultados mucho peores
    • La precisión de Claude Opus 4.6 de Anthropic es de 8.9 por ciento
    • También se menciona que ese mismo modelo logró una puntuación de primer nivel en Humanity’s Last Exam
  • Ray Perrault relaciona esto con un problema más general
    • Incluso cuando se pregunta por combinaciones de otras modalidades como lenguaje, imagen y tono de voz, el componente lingüístico pesa más de lo esperado
    • Menciona una línea de investigación según la cual esto puede llegar al punto de ignorar por completo la información no lingüística

Récord de inversión en IA en 2025

  • Junto con la mejora del rendimiento de los modelos, también aumentó la inversión en IA
  • Según datos de la firma de análisis de IA Quid, la inversión en IA superó los 581 mil millones de dólares en 2025 y marcó un récord
    • Es más del doble de los 253 mil millones de dólares de 2024
    • También supera ampliamente el máximo anterior de 360 mil millones de dólares registrado en 2021
  • A diferencia de 2021, el récord de 2025 no fue impulsado por fusiones y adquisiciones, sino por inversión privada en empresas de IA
  • La mayor parte del capital llegó a Estados Unidos
    • El año pasado, la inversión en IA dentro de Estados Unidos superó los 344 mil millones de dólares

Enfoque de los ingenieros de software en la IA

  • En GitHub, la cantidad de proyectos relacionados con IA se disparó hasta 5.58 millones para 2025
    • Aproximadamente 5 veces más que en 2020
    • Un aumento de 23.7 por ciento respecto de 2024
  • Este crecimiento no parece explicarse solo por una avalancha de proyectos generados por IA
    • La cantidad de proyectos con 10 estrellas o más también creció a un ritmo similar
    • El total de stars recibidas por los proyectos de IA también aumentó a un ritmo parecido
    • Eso sugiere participación humana
  • Como caso popular representativo se menciona el software open source de agentic AI OpenClaw
    • Obtuvo 352,000 stars en GitHub
  • Ray Perrault reconoce que los proyectos de bots o agentes de IA podrían influir en parte en este entusiasmo
    • “probably the intensity of GitHub use is highly correlated with the intensity of AI use”
    • También comenta que, según el sitio de seguimiento de actividad Agents in the Wild, que no aparece en el informe de Stanford, gran parte de la actividad en GitHub todavía parece ser realizada por humanos
  • La fiebre por la IA también domina en los papers de ciencias de la computación
    • La cantidad de papers de ciencias de la computación relacionados con IA pasó de 102,000 a 258,000 en los últimos 10 años, más del doble
    • En 2024, más del 68 por ciento de ellos provenía de la academia
    • La proporción del gobierno y de la industria era de aproximadamente 11.5 por ciento y 12.5 por ciento, respectivamente
    • El crecimiento fue impulsado por machine learning, computer vision y generative AI

Incertidumbre sobre el impacto de la IA en el empleo

  • Con la expansión de la IA generativa, aumentó la ansiedad laboral, pero los datos actuales muestran resultados mixtos
  • Se presenta una gráfica del número normalizado de personas por grupo de edad en ocupaciones consideradas de alto riesgo de sustitución por IA, como software developers y customer support agents
    • Los puestos de entrada disminuyeron
    • Los cargos intermedios y senior se mantuvieron o crecieron
  • Es difícil interpretar estos cambios por separado de las tendencias económicas más amplias
    • El informe menciona un aumento del desempleo en muchas ocupaciones
    • Contra lo esperado, el aumento del desempleo fue mayor entre los trabajadores con menor exposición a la IA que entre quienes tienen mayor exposición

Cambios en la percepción pública sobre la IA

  • En la encuesta de Ipsos, el optimismo respecto a la IA aumentó ligeramente pero de forma visible en los últimos años
    • La respuesta “benefits outweigh the drawbacks” subió de 55 por ciento en 2024 a 59 por ciento
    • La respuesta de que entienden bien la IA, “good understanding”, pasó de 67 por ciento a 68 por ciento
  • En preguntas similares, la aceptación general sigue inclinándose más hacia lo positivo que hacia lo negativo, aunque también crecieron algunas emociones negativas
    • El 52 por ciento de los encuestados respondió que los productos y servicios que usan IA los hacen sentir “nervous”
  • Hay grandes diferencias entre países
    • China y países del Sudeste Asiático como Malaysia, Thailand, Indonesia y Singapore muestran una orientación más positiva
    • Los mayores cambios positivos interanuales fueron Germany 12 por ciento, France 10 por ciento y the Netherlands 10 por ciento
    • Colombia registró el mayor cambio negativo con -6 por ciento

Diferencias por país en la confianza hacia la regulación de la IA

  • Junto con el aumento en la percepción de que la IA tendrá efectos positivos, en algunos países también aparece una profunda desconfianza hacia la regulación gubernamental
  • En particular, aunque Estados Unidos lidera la inversión en IA, también está entre los peores en confianza regulatoria
    • En la encuesta de Ipsos, solo 31 por ciento de los estadounidenses dijo confiar en la regulación gubernamental de la IA
  • Muchos países europeos y Japón también muestran niveles bajos de confianza
  • Los países de Asia y Sudamérica son los que más confían en la capacidad de sus gobiernos para regular la IA
  • El contraste entre Estados Unidos y Colombia es especialmente llamativo
    • En Estados Unidos hay una profunda desconfianza hacia la regulación de la IA, pero la mayoría cree que sus beneficios superarán sus desventajas
    • En Colombia hay alta confianza en la regulación de la IA, pero el sentimiento general hacia la IA ha empeorado
  • Como una versión condensada de la narrativa de la IA en 2025, la calidad del rendimiento de los modelos y la percepción de su impacto social varían ampliamente según la tarea y la pregunta

1 comentarios

 
GN⁺ 10 일 전
Comentarios en Hacker News
  • Quisiera señalar que la percepción de la IA entre la gente joven no es tan positiva como uno pensaría. Si se ve la encuesta de Gallup, el escepticismo parece bastante claro

    • Yo lo veo como un proceso de ir entendiendo poco a poco las limitaciones inherentes de la IA
    • Yo creo que este ambiente es temporal. Como pasó con cada transición tecnológica nueva en la historia, al final todos se adaptarán y encontrarán formas de aprovecharla
  • Incluso si entrenar un LLM frontier reciente genera más de 72 mil toneladas de emisiones de carbono, sigo pensando que es relativamente poco comparado con los 38 mil millones de toneladas anuales a nivel mundial

    • A mí no me parece nada trivial que las emisiones de entrenamiento de un solo LLM equivalgan a las emisiones anuales de 17 mil personas. Según el artículo, fue un aumento de 8 veces respecto al año pasado y hasta podría estar subestimado por casi el doble. Además, quedan fuera el hardware, los bots que recopilan datos de entrenamiento y el procesamiento de prompts, es decir, gran parte del uso total; también hay varios modelos grandes y decenas de miles de modelos pequeños. Si la estimación de que las emisiones totales de la IA este año superan los 80 millones de toneladas de CO2e es correcta, eso ya es más que países enteros como Austria o Israel, así que no es algo menor
    • También se puede ver así. Si entrenar un modelo cuesta 72 mil toneladas y lo usan 100 millones de personas, eso da unas 0.00072 toneladas por persona. Según el artículo, el promedio anual de emisiones por ser humano es de más de 5 toneladas, y en EE. UU. ronda las 18, así que sumarle 0.00072 casi ni se sentiría. Claro, el costo de inferencia va aparte
    • Incluso considerando que xAI parece haber elevado a propósito la intensidad de carbono, me sigue pareciendo que esta cifra es básicamente insignificante. Además, escoger dos modelos principales de 2025 y que ambos sean Grok se siente medio ridículo, como si hubieran elegido modelos que ese año estaban entre los menos útiles, menos usados y menos interesantes
  • Yo al final creo que nadie va a tener un foso moat, así que más bien lo leo como una gráfica que solo agranda las ilusiones de los inversionistas

    • Yo sí creo que se forma un foso claro. Puedes concentrar presupuesto en la calidad de los tokens, o usar menos tokens pero mejores. Si a eso le sumas base de usuarios y engagement, se crea un flywheel difícil de alcanzar para nuevos competidores. El mercado es complejo y se pierden muchas cosas cuando se simplifica de más
    • Yo también creo que el capital y el momentum en sí mismos son un foso. Es cierto que los modelos chinos usan destilación, pero todavía no se ve tanto que entrenen modelos enormes desde cero. Aun así, eso podría cambiar si los chips se abaratan más y los chips chinos entran de lleno
  • También destaca el liderazgo de China en robótica, pero lo primero que a mí me saltó a la vista fue la gráfica de emisiones de Grok

    • Cuando leo en el artículo la frase "esta estimación debe interpretarse con cuidado y, en el caso de Grok, depende en gran medida de valores de entrada inferidos a partir de reportes públicos", esa gráfica me parece algo dudosa en términos de confiabilidad
  • Que haya aumentado la cantidad de proyectos creados en GitHub y de ahí concluir que "los ingenieros de software se fueron all-in con la IA" se me hace bastante gracioso. Crear un repositorio no convierte a nadie en ingeniero de software; si así fuera, hasta daría la impresión de que ni siquiera habría hecho falta estudiar otras cosas

    • Estoy de acuerdo en que esa métrica no es buena, y creo que sería mejor reemplazarla por algo como Claude Code GitHub Commits Over Time. Claro, tampoco es perfecta, pero al menos es una métrica un poco menos imperfecta y siento que muestra mejor alguna tendencia con sentido
  • La parte de que "China va adelante en robótica" no parece tener mucho que ver con la IA. La gráfica de China sigue casi la misma trayectoria desde 2012, así que siento que esa gráfica no encaja bien con el contexto del artículo

    • Aunque ChatGPT no existía en ese momento, yo diría que la tecnología de ML que impulsaba la robótica ya funcionaba suficientemente bien desde entonces
  • Es cierto decir que "el entrenamiento de modelos de IA puede emitir enormes cantidades de carbono", pero lo que de verdad me gustaría ver es una gráfica de cuánto carbono se emite globalmente al operar y servir estos modelos

  • Me cuesta estar de acuerdo con la frase "el rendimiento de los modelos de IA ha mejorado a una velocidad sorprendente en los últimos 10 años, y ese progreso se está acelerando". A mí me parece que casi todas las áreas ya están entrando en una meseta plateau. En áreas que empezaron hace poco, como matemáticas de competencia, todavía se nota menos, pero viendo los patrones de las gráficas pasadas, parece bastante probable que terminen estancándose de forma parecida

  • Todavía no entiendo bien la expresión State of AI in 2026

  • Este post parece ser un duplicado. El original está en este hilo, y la fuente es el 2026 AI Index Report de Stanford HAI