2 puntos por GN⁺ 2025-10-22 | 3 comentarios | Compartir por WhatsApp
  • La enciclopedia en línea Wikipedia anunció recientemente que las visitas directas de las personas estaban disminuyendo debido a los resúmenes de búsqueda de IA y al video en redes sociales.
  • La Fundación Wikimedia informó que el número de visitantes humanos se redujo un 8% en comparación con el año anterior, lo cual corresponde al resultado de contabilizar solo el tráfico humano real tras la actualización del sistema de detección de bots.
  • Al ofrecer respuestas directas, los resultados de búsqueda generativa de IA reducen los clics hacia los sitios web, y se observa que los más jóvenes recurren a plataformas de video social como TikTok para la búsqueda de información.
  • Wikipedia suspendió de forma interna el experimento de resumen con IA y sostuvo que las empresas de IA y buscadores deben asumir responsabilidad en el reconocimiento de la fuente y en dirigir visitas al sitio.
  • Sostuvo que “la base de conocimiento que usa la IA sigue siendo contenido creado por humanos”, y enfatizó la verificación de fuentes confiables y el reconocimiento del valor del conocimiento curado por humanos.

Fenómeno de caída de tráfico de Wikipedia

  • Wikipedia sigue siendo uno de los pocos sitios web de internet mencionados como una referencia confiable.
  • Sin embargo, según un informe publicado por la fundación Wikimedia, las vistas de páginas de usuarios humanos cayeron alrededor de un 8% respecto al mismo periodo del año anterior.
  • La fundación mejoró su sistema de monitorización para diferenciar el tráfico humano del de bots, y confirmó que gran parte del inusualmente alto volumen de mayo y junio correspondía a tráfico de bots que evitaba la detección.
  • Marshall Miller de la fundación explicó que este fenómeno representa un cambio estructural impulsado por el aumento de los resúmenes de búsqueda de IA y el consumo de video en redes sociales.
    • Los motores de búsqueda están migrando a mostrar respuestas generadas por IA directamente en lugar de enlaces hacia el sitio.
    • Las nuevas generaciones recurren a plataformas de video como TikTok y YouTube Shorts para buscar información en lugar de la web abierta.
    • Google rebatió que la búsqueda con IA no reduce el tráfico.

Posición y respuesta de Wikipedia

  • Miller dijo que es positivo que “las personas obtengan conocimiento de nuevas formas”, y destacó que el contenido de Wikipedia sigue siendo utilizado como material para el entrenamiento y resumen de modelos de IA.
  • No obstante, la caída de visitantes encierra un riesgo real de menos voluntarios que contribuyen y gestionan el contenido, así como una potencial reducción de las donaciones.
  • De hecho, algunos editores señalaron problemas de calidad en los resúmenes generados por IA, y la fundación suspendió temporalmente el programa piloto de resumen de IA.

Replanteamiento de la relación con las empresas de IA

  • Miller sostuvo que las plataformas de IA, búsqueda y redes sociales que utilizan contenido de Wikipedia deben contribuir al ecosistema, siempre que lo hagan, mediante el reconocimiento de la fuente y el impulso a visitas al sitio.
  • Wikipedia está desarrollando un nuevo marco de atribución de la fuente de contenido y opera dos equipos especializados para atraer a nuevos públicos lectores.
  • También está ejecutando una campaña para ampliar la participación de voluntarios.

Importancia del conocimiento basado en la confianza

  • Miller enfatizó que “en la base de la información resumida por IA está el trabajo de conocimiento humano”.
    • Los usuarios deben validar citas y visitar la fuente original por sí mismos al buscar.
    • Es necesaria la preservación de un ecosistema de conocimiento confiable y curado por humanos.
  • Añadió que “la transparencia del origen del conocimiento y la continuidad de la participación humana” son los valores clave en la era de la IA

3 comentarios

 
coremaker 2025-10-23

Si los modelos de IA y las compañías que los crean no se esfuerzan por construir confianza,
podría ofrecer más oportunidades para que Wikipedia crezca a largo plazo.

 
shakespeares 2025-10-23

Se convirtió en un sitio en el que solo le roban los datos.

 
GN⁺ 2025-10-22
Comentario de Hacker News
  • Creo que Wikipedia es realmente necesaria, y que la reducción del tráfico en sí misma está bien. La enciclopedia en papel fue reemplazada por Wikipedia, pero la IA no puede reemplazar ese lugar. La IA es solo una herramienta que facilita el acceso, y creo que Wikipedia tiene su propio propósito y valor. Siempre he sido escéptico respecto a la acumulación de fondos de la Fundación Wikimedia y a su gasto anual en constante aumento. Este es un buen momento para ser cauteloso con el dinero y buscar la autosuficiencia mediante inversión, para que pueda durar mil años. Creo que Wikipedia existe para el bien público y debe seguir operando de esa manera.

    • Creo que la Fundación Wikimedia difícilmente durará mil años. Porque el propio sistema social/económico no va a durar tanto. Ya hay señales de incomodidad del gobierno de EE. UU. hacia Wikimedia. Incluso mudándose de un país a otro, será difícil que dure tanto tiempo. Debido a la fragilidad de la civilización tecnológica y el almacenamiento de datos, ni siquiera está claro si Wikipedia podrá existir tanto tiempo. Artículo relacionado

    • Wikipedia ofrece públicamente volcados de datos, así que creo que debería haber muchas copias offline. Tal vez cuando Wikimedia habla de una caída de tráfico no sea por una razón comercial ligada a ingresos publicitarios, sino porque cambió la forma en que los usuarios de la web buscan información. Si un sitio no vende a los usuarios por publicidad, que el tráfico baje no le representa ningún problema. Eso no significa que la información que ofrece ese sitio sea menos valiosa.

    • Siempre me surgió duda sobre la estrategia de ahorrar y acumular fondos para crecer para sobrevivir a largo plazo. Si con esa inversión diversificada es posible operar aunque se corte la entrada externa de dinero, entonces se podría concentrar en la visión original y en lo correcto sin depender de resultados trimestrales. Es posible ganar dinero continuamente, pero lo ideal es pensar en una operación a largo plazo conservando la esencia.

    • Wikipedia es realmente increíble. En todo el mundo, cualquiera puede escribir cualquier artículo sobre cualquier tema. Puede dar la certeza de que estás obteniendo la mejor información.

    • Me intriga cómo la Fundación Wikimedia usa su dinero. Dicen que el gasto sigue aumentando, pero ¿en qué se usa principalmente? ¿Siguen intentando expandirse a otros proyectos? Entiendo que un sitio global enorme como este tiene un costo de hosting nada despreciable, pero me pregunto si de verdad está subiendo tanto.

  • Como organización sin fines de lucro 501(c)(3), si el tráfico web no afecta de forma directa a los ingresos, me pregunto si la caída de tráfico necesariamente debe verse como algo negativo. Pensé que la presión por crecer rápidamente era algo limitado a empresas dependientes de VC o publicidad.

    • En la práctica, Wikipedia también depende mucho del tráfico web. Aunque las visitas de personas disminuyen, los crawlers de IA están raspando enormes cantidades de datos, con lo que los costos incluso aumentan.

    • La caída del tráfico puede llevar a menos voluntarios y donantes. Hay preocupación de que con menos visitantes directos haya menos gente para afinar contenido o donarlo.

    • No es tanto la caída de los ingresos por publicidad, sino la señal de que finalmente también pueden bajar las donaciones. Hoy muchas personas pagan por suscripciones de IA y ni siquiera ven Wikipedia. La fuente primaria de información se consume en una capa intermedia. Se parece a los debates anteriores sobre derechos de autor, pero en esta ocasión los protagonistas son empresas con fines de lucro, no particulares.

  • Siento que los LLM (modelos de lenguaje grandes) ya sustituyen el 90% de la información que antes buscaba en Wikipedia, porque pueden integrar fuentes mucho más diversas. Al mismo tiempo, sigo contribuyendo (editando) a Wikipedia. El hecho de que la información que edito se consuma en Wikipedia o a través de un LLM y termine ayudando a alguien me parece importante. Wikipedia no va a desaparecer aunque la gente deje de consumir información directamente en el sitio.

    • Wikipedia ofrece sus contenidos gratis para todos. Las empresas de LLM no hacen lo mismo. Incluso Google lo opera aceptando pérdidas. Es difícil creer que realmente “ayuda a la gente”, en realidad parece lo contrario.
  • En el mundo real, creo que los LLM terminarán sustituyendo por completo a Wikipedia. Dejando a un lado sus problemas de burocracia rígida, edición obsesiva, sesgos y demás, Wikipedia era originalmente un motor de resumen humano que sintetiza fuentes secundarias para encontrar puntos de acuerdo. En este punto es justo el área en la que los LLM funcionan mejor. Con entrenamiento en buenos libros, incluso podría superarse la calidad de Wikipedia. Con una síntesis de IA, incluso la primera frase ya deja claro el tema principal. En cambio, en Wikipedia la primera frase a veces se vuelve innecesariamente compleja por disputas políticas entre editores.

    • Aunque todo lo anterior fuera cierto, los LLM igualmente necesitan un repositorio que agrupe este tipo de resúmenes de fuentes secundarias. Un LLM no puede buscar y leer miles de fuentes secundarias en tiempo real. Ya hay muchas referencias que ya desaparecieron o que no están digitalizadas. Es posible que en el futuro un laboratorio de LLM done a Wikipedia y haga propuestas de edición y fact-checking junto con un agente de IA.

    • Con la idea (de que los LLM lo reemplazan) en mente, espero que Wikipedia siga existiendo. Me gustaría que su papel sea ayudar a la gente a desarrollar pensamiento crítico y no dejarse engañar fácilmente.

  • No estoy de acuerdo con el argumento de que “basta con entrenar solo con buenos libros”. En la práctica, muchos temas de Wikipedia no tienen libros de buena calidad. Y también es un problema quién decide qué libro es “de calidad”. La caída del tráfico no es solo un problema de Wikipedia, también ocurre en otros sitios web. La IA también está haciendo que desaparezcan las fuentes de información de las que ella misma depende. Este es exactamente el momento dorado de la IA. La próxima era pasará a tener menos fuentes originales buenas, más contenido generado por IA, y la aparición de sitios cuyo objetivo sea perjudicar a los LLM. Debate relacionado

  • El conocimiento no existe como algo en sí mismo, sino en cómo la gente lo organiza. La IA seguirá excavando conocimiento existente y mostrándolo de manera cada vez más conveniente, pero creo que la estructura básica de cómo se organiza la información y el conocimiento no cambiará radicalmente. Aun así, hay áreas donde la IA sí podría cambiar la forma de organizar:

    1. Verificación de hechos y validación de fuentes
    2. Redacción de borradores para nuevos artículos
    3. Pulido de oraciones y edición, etc. Wikipedia ya tiene muchos bots funcionando en segundo plano, y aun si la IA hiciera todo ese trabajo, el problema que queda será el juicio humano (o de otra IA).
    • Si hay varios ángulos en un hecho, ¿cómo se expresará de forma equilibrada? (viene a la mente la experiencia de innumerables discusiones entre editores)

    • En la era de smartphones/redes sociales, muchas personas comunes están registrando la historia; ¿cómo resumirla y ordenarla?

    • ¿Cómo diseñar incentivos para motivar aportes adecuados de humanos y/o IA?

    • ¿Cómo proteger la independencia de Wikipedia (tema geopolítico)? Por cierto, alguna vez lideré un servicio wiki en China, y lo más complicado fue que casi nadie se tomaba en serio por qué un formato wiki era necesario y debía mantenerse, más allá de la búsqueda de información.

    • Me gusta la idea de mejorar Wikipedia con IA. Muchas tareas pequeñas pueden ser manejadas por agentes de IA simples. Por ejemplo, ir a todas las páginas de ciudades españolas en la Wikipedia en inglés, y comparar datos como población o nombre del municipio con la wiki en español para corregirlos con información más precisa. Si un agente como ese solo redacta el borrador y un editor humano lo revisa, podrían hacerse actualizaciones de información puntual de manera eficiente.

  • Desde que Google empezó a ofrecer resúmenes con IA, está pasando algo parecido en casi todos los sitios web.

  • Aunque la influencia de la IA es obvia, me pregunto qué significa “video social”. Si significa que ahora la gente ve TikTok en vez de Wikipedia, o que directamente dejaron de hacer búsquedas.

    • De hecho, hoy en día el motor de búsqueda más usado es YouTube y TikTok.

    • Para la Generación Alpha, TikTok es el medio principal para obtener noticias y conocimiento.

  • Ojalá esto también ocurra en todos los sitios web con SEO incluido. Debate relacionado

    • Esto aplica a todos los sitios. Incluso en sitios buenos sin publicidad, los crawlers de IA añaden tráfico innecesario. Con eso, la carga de costos de operación se vuelve aún mayor. Además, aparecerán muchos sitios cuyo único objetivo sea perjudicar a los LLM. Al final, los LLM también podrían terminar costando más o cambiando a inserción de publicidad.
  • Históricamente, la tendencia de que bajan los contribuidores en Wikipedia ha seguido persistiendo. Si cae la gente que lee directamente Wikipedia, espero que la caída de contribuidores empeore. Lamentablemente me gustaría saber si hay experimentos en curso para complementar/mejorar/verificar Wikipedia usando LLM. En el futuro, las discusiones y guerras de edición tradicionales podrían transformarse en un formato de competencia y colaboración entre agentes LLM.

    • El trabajo variado que hacen los contribuidores también podrá ser manejado eficientemente por agentes de IA. La clave será: a) participación y monitoreo humano, b) un sistema de filtrado de conductas maliciosas.

    • Hay problemas en la estructura operativa actual: Cuando un contribuidor añade nuevo contenido, un spammer quita el enlace de un documento legítimo y lo cambia por enlaces de spam. El bot de Wikipedia elimina ese contenido, y el contribuidor termina desmotivado.

  • Wikipedia fue una herramienta casi mágica y adelantada a su tiempo, y hoy también su valor como el mejor concentrador de información sigue siendo válido. Seguramente seguirá sobreviviendo mucho tiempo como un conjunto de enlaces. La curación en tiempo real (al momento de leer) es mucho mejor, pero antes eso era difícil y ahora es posible de forma más económica, así que Wikipedia seguirá siendo la fuente de datos de varias herramientas de curación en tiempo real. El solo hecho de que exista una base de datos de fuente así aumenta la utilidad de muchas herramientas de IA. Hay muchas voces que señalan la perspectiva única o el sesgo editorial, y lo entiendo. Pero gracias a la interfaz conversacional de los LLM, puedes interactuar, captar el contexto o ir más profundo. En lo personal, me gusta participar en el proceso de construir una infraestructura de conocimiento abierta de este tipo. Incluso corrigiendo un error pequeño en un artículo de wiki ya siento satisfacción. Hay muchas partes que se pueden arreglar así de fácil. También es fácil detectar y corregir el contenido incorrecto que alguien haya agregado. Ejemplo de artículo

    • La curación en tiempo real al leer es claramente mejor, pero tener Wikipedia en el teléfono y buscar instantáneamente es realmente económico. La IA es muy pesada y la mayoría de la gente no puede ejecutarla localmente, además hay pérdida de datos (resúmenes, etc.). Sería ideal que ambas corriesen en el teléfono, pero hay mucha preocupación por los temas de propiedad de datos.