1 puntos por GN⁺ 1 시간 전 | 1 comentarios | Compartir por WhatsApp
  • Google Search está pasando de enviar a los usuarios a enlaces a centrarse en respuestas procesadas, creando una nueva capa controlable sobre la web
  • AI Overviews presenta análisis que indican que da respuestas incorrectas en cerca del 10% de los casos, y Search está dejando en gran medida de ofrecer enlaces a las fuentes de información
  • Detrás del empaque de “AI” y “agentic”, el núcleo es descontextualizar la información, quitar las fuentes y reemplazarlas con respuestas de LLM
  • Los sitios web y las obras creativas se parecen menos a productos culturales compartidos y más a materia prima no remunerada para el exprimidor de texto sintético de Google
  • Las respuestas propuestas son De-googlifying, evitar Chrome y usar motores de búsqueda alternativos; de lo contrario, uno podría terminar viendo solo la información que Google considere relevante

La nueva capa de abstracción que Google Search está construyendo sobre la web

  • El keynote de Google I/O puede leerse como un ataque contra lo que queda de la web, y la explicación de Google apunta a empujar Search todavía más hacia respuestas procesadas en lugar de ofrecer enlaces
  • Actualmente, AI Overviews, los snippets de IA de Search, tiene análisis que señalan que da respuestas incorrectas en cerca del 10% de los casos, y Google está abandonando en gran medida el paradigma anterior de proporcionar enlaces a las fuentes de información
  • Detrás de etiquetas como “AI” y “agentic”, el núcleo del enfoque es descontextualizar la información, eliminar los enlaces a las fuentes y luego presentar respuestas generadas por LLM
  • Google está construyendo una nueva capa de abstracción controlable sobre la web, orientada a ocultar sitios web y obras creativas detrás de la superficie de Google, en vez de tratarlos como algo que los usuarios visitan y comparten directamente

Las obras creativas dejan de ser productos culturales para convertirse en materia prima

  • Los sitios web, los textos y el arte siguen siendo importantes hasta cierto punto, pero su valor se parece cada vez más al de materia prima no remunerada para el exprimidor de texto sintético de Google
  • Los creadores trabajan gratis, Google controla con más fuerza el flujo de información y puede alinear las respuestas que recibe la gente con la dirección que Google quiera
  • Las obras creativas dejan de verse como productos culturales importantes que pueden compartirse con otras personas y pasan a ser insumos que Google procesa y recombina

Un cambio contrario a la web participativa

  • Este cambio no se define como una revolución hacia una web participativa, sino como una contrarrevolución contra la web participativa y contra los propios usuarios
  • El objetivo sería arrebatar la web y empujar a las personas hacia una capa de abstracción sobre la web que Google controla y ajusta
  • Se describe como un problema de monopolizar el acceso a la información, y como un verdadero Metaverse alejado de los estándares abiertos y de la capacidad de cada quien para construir un rincón de la web según sus necesidades y deseos
  • Debido a la fuerte influencia de Google sobre los estándares web, esta dirección podría incluso cambiar la forma estándar del terreno técnico con el que se construye la web

La posibilidad de control bajo el nombre de una “web segura”

  • En la siguiente etapa, Google u otras compañías del mismo ámbito podrían crear y difundir un nuevo término despectivo para presentar la web existente como algo sucio, descontrolado, peligroso y malo
  • Ese tipo de denominación funcionaría de manera similar a “Dark Web” y podría posicionar la superficie abstraída de Google como la web segura

Respuesta: reducir la dependencia de Google

  • Si se valora la web y la capacidad de las personas de participar en ella más allá de ser simples consumidores pasivos, este cambio debe tomarse en serio
  • Se vuelve más urgente eliminar a Google del propio marco mental mediante De-googlifying
  • Se propone buscar otros motores de búsqueda y optar por no usar el navegador Chrome
  • De lo contrario, podríamos despertar en un entorno tipo AOL lleno de contenido degradado, donde el acceso a la información quede limitado a lo que el exprimidor de texto sintético de Google considere relevante

1 comentarios

 
GN⁺ 1 시간 전
Opiniones de Hacker News
  • Se siente como si la IA ya hubiera llegado al punto de “si quieres hacer arte, código, música o escribir, todavía puedes hacerlo por satisfacción personal, pero ya no para ganar dinero”
    Ganar dinero con contenido ya solo parece posible para las grandes empresas, y si publicas algo creativo, al final solo se vuelve a alimentar a las máquinas para que lo sigan copiando

    • “¿Qué come la máquina de imprimir dinero y qué excreta? Come juventud, espontaneidad, vida, belleza y, sobre todo, creatividad. Come calidad y excreta cantidad.” - William S. Burroughs
    • Como alguien que hizo de la música su profesión y además trabaja en IT, me resulta bastante interesante ver cómo se desarrolla la IA generativa y cómo se divide la cultura a su alrededor
      Casi parece que el mundo se está separando en dos “sociedades”: la de IA + grandes empresas + gente a la que le gusta la innovación y destrucción muy rápida, y la de trabajo artesanal + pequeños negocios + innovación más lenta pero más sostenible
      Personalmente me gustaría vivir en la segunda sociedad, pero creo que ambas pueden seguir existiendo y evolucionando a su manera
      Claro, sociedades distintas inevitablemente terminan interactuando e influyéndose entre sí
    • Tanto los artistas como las empresas quieren ganar dinero, pero quizá la IA inclinó el terreno competitivo a favor de las empresas
      Vi un efecto parecido en el sector hotelero. Los hoteles, booking.com y Google quieren ganar dinero, pero los clientes normalmente buscan “hotel en tal lugar” en Google, y Google vende anuncios para ese término de búsqueda, haciendo que el mayor postor se quede con la mayor parte de la ganancia
    • Hay que darle la vuelta a esta estructura
      Habría que gravar las ganancias excesivas de las empresas tecnológicas obtenidas del trabajo ajeno, y usar ese dinero para apoyar a artistas vivos
      Se parece vagamente a cuando antes se cobraba un recargo a las cintas vírgenes para compensar la piratería. Solo que el dinero debería ir directo a los artistas reales, no a los sellos ni a las editoriales
    • Al menos en las artes visuales, no creo que mucha gente que de verdad disfruta el arte vaya a colgar en su pared una imagen hecha por IA
      Para ese “cliente”, no sería muy distinto de enmarcar un póster de la Mona Lisa
      Más que amenazar a los artistas, la IA podría hacer que las obras originales se vuelvan más valiosas y más disfrutables
  • Para intentar frenarlo, hace uno o dos meses puse casi todo mi sitio de investigación sobre Amazon Redshift detrás de autenticación básica con usuario/contraseña
    Todo sigue siendo gratis, pero para recibir el usuario y la contraseña hay que escribirme por correo
    Dediqué tiempo a crear contenido, y si empresas como OpenAI lo copian para venderlo mediante un LLM, y como resultado nadie vuelve a mi sitio, entonces dejo de tener motivo para crear ese contenido. Entonces OpenAI ya no tiene nada que llevarse, otras personas ya no tienen nada que leer, y todos perdemos
    Es algo parasitario, y superficialmente parece una forma de matar al huésped. Se siente prácticamente como una abolición del concepto de propiedad privada
    Las empresas de IA pueden tomar lo que hice sin mi consentimiento y venderlo para lucrar, y esa ganancia parece provenir en buena parte de lo que antes me llegaba a mí como compensación por mi esfuerzo
    Busqué maneras de indicarles a las empresas de IA que eliminaran mi contenido, pero los mecanismos que ofrecen son meramente simbólicos y me pasan a mí la carga. Encima, ni siquiera hay forma de saber si de verdad lo quitaron. Es algo como “si nos demuestras con un prompt que aparece tu contenido, intentaremos tomar medidas para que deje de aparecer”
    Como resultado de poner la barrera de usuario/contraseña, Google bajó muchísimo el ranking del sitio y ahora asumo que casi ya no se encuentra en búsquedas

    • Si para nuevos usuarios hay que pedir por correo el usuario y la contraseña, eso mete fricción, reduce la posibilidad de descubrimiento y también suma preocupaciones de privacidad para quien quiere acceder al contenido
      También me pregunto si, al marcar que no quieres que las empresas de IA usen tu contenido, incluyes incluso a las que sí atribuyen y enlazan a la fuente original. Por ejemplo, Perplexity hace eso bastante bien
      Si bloqueas el acceso al contenido sin login, también bloqueas la indexación de los motores de búsqueda, así que es normal que Google te baje de posición
      Me cuesta un poco entender cuál es el objetivo final. Si publicas contenido gratis en la web, no sé qué ganas bloqueando la indexación de IA. Más aún si además terminas bloqueando a usuarios reales, ya sea vía IA o vía búsqueda tradicional
      Entiendo la frustración de que herramientas de IA digieran tu contenido y luego se lo repitan al usuario sin enlazar a tu sitio. Pero la gente siempre ha hecho eso, con o sin IA. Leen algo, aprenden hechos o entienden ideas nuevas, y luego incorporan esa información a su propio trabajo sin necesariamente reconocer ni recordar la fuente
      Entiendo por qué la IA lo vuelve más rápido y más visible, y por eso más frustrante, pero quizá desde el principio no era razonable esperar que todo lo que ocurriera aguas abajo de mi trabajo me fuera siempre atribuido
    • Sí. Esto es un gran desplazamiento de poder, y todo se está centralizando
      Como dices, ellos saben que necesitan buenos datos, así que tal vez realmente intenten encontrar algún punto de equilibrio
      Si no, los laboratorios de IA podrían terminar creando internamente nuevo contenido valioso para alimentar a los LLM. Suena loco, pero Netflix también produce su propio contenido
      Los laboratorios de IA se van a volver tan grandes que probablemente asumirán funciones mucho más allá de simplemente ofrecer inferencia de LLM. Podrían llegar a ser tan poderosos como muchos gobiernos nacionales actuales, o incluso más
    • Últimamente también vi que muchos sitios web de recetas están cambiando de la misma forma. Incluso los grandes ya piden cuenta
    • ¿Cómo puedes estar seguro de que los correos pidiendo usuario y contraseña vienen de seres humanos?
    • Bienvenido al bosque oscuro
  • Cuesta entender cuál es el juego final aquí. Los sitios web dejaban que Google rastreara su contenido a cambio de recibir tráfico
    Si Google corta completamente ese intercambio, no veo qué incentivo les queda a los sitios para no bloquear al crawler de Google
    Entiendo sentir una amenaza existencial por otros productos de IA donde Google responde directamente, pero también deberían entender la relación simbiótica con la web

    • El juego final es que el consumidor ya no salga de Google, y para esa persona la web pase a ser sinónimo de Google
      ¿Para qué comprarías en un sitio cualquiera si Gemini puede hacerlo por ti? ¿Para qué ir a buscar información a Wikipedia?... ya sabes a qué me refiero
      Los próximos años probablemente serán decisivos para la web. Facebook intentó una estrategia parecida cuando las apps ganaron fuerza, pero al final fracasó. Ojalá Google también fracase
    • Lo que de verdad no entiendo es de dónde va a salir el material para la próxima generación de datos de entrenamiento
      Si los sitios web dejan de publicarse o dejan de ser rastreados, ¿de qué va a seguir alimentándose la máquina?
    • Los ejecutivos donde trabajo parecen pensar que nosotros seguiremos escribiendo, que los LLM seguirán raspando eso, y que el resultado influirá en lo que la gente vea en sus respectivos Google o ChatGPT
      Así que, en su cabeza, no cambia nada: solo que el lector ya no es un humano sino un bot. Desde el punto de vista de quien escribe, es horrible
    • Se está tratando como más importante la ganancia de corto plazo de la gente con poder que las consecuencias a largo plazo
    • La web se va a convertir, como China, en un conjunto de jardines amurallados
  • Hace mucho tiempo le dejamos a Google la tarea de mandar tráfico a los sitios web
    En gran parte porque Google lo hacía tan bien que las alternativas se volvieron mucho menos útiles
    Ahora que Google se está enfocando, por así decirlo, en volverse “autosuficiente”, necesitamos encontrar una mejor manera de enviar tráfico a los sitios web. Idealmente, una que no esté bajo el control de una sola empresa
    ¿Alguien más extraña StumbleUpon?

    • Se siente raro que no exista una búsqueda descentralizada
      Entiendo que por la naturaleza del problema probablemente sea así, pero antes salían muchas ideas descentralizadas absurdamente poco aptas para otras cosas
    • Estaría bastante bien algún método abierto para intercambiar, guardar y exportar listas de sitios web de forma fluida entre navegadores de escritorio y móviles
    • ¿Este cambio le dará más poder o valor a sitios como reddit?
      Los sitios con colecciones de enlaces bien curadas son mucho más útiles para encontrar sitios nuevos
    • También existe el marketing a la antigua. Si quieres que te escuchen, tienes que ir directamente a buscar a tu audiencia
  • Como operador de un sitio web, he visto personalmente que las visitas han aumentado bastante, pero ver resúmenes de IA incorrectos que citan mi sitio como fuente sí pega fuerte
    Me preocupa que esta presión por meter IA en todo termine bajando el nivel de habilidad del mundo, y no parece haber forma de detenerlo

    • Eso de que “baja el nivel de habilidad del mundo” me pega bastante
      Hoy le pregunté a un desarrollador cómo está programado nuestro producto para manejar cierta situación, y solo me mandó el resumen del asistente interno de IA que acaba de empezar a usar
      Antes daba respuestas realmente buenas y pensadas; ahora es puro copiar/pegar respuestas de IA
  • Parece que cuando les raspan a ellos ya no les gusta: https://serpapi.com/blog/google-v-serpapi-motion-to-dismiss-...

  • Creo que me pondría más triste si la web no estuviera ya tan podrida desde antes
    En promedio, entras a cualquier sitio y solo quiere bombardearte con anuncios y fastidiarte para que te suscribas

    • En particular detesto los modales de “suscríbete al newsletter”. Más todavía cuando aparecen antes de que lleves siquiera 3 segundos en la página
      No entiendo por qué eso no se considera un popup
    • La podredumbre es más profunda y no se trata solo de anuncios
      La estructura de incentivos de los motores de búsqueda favorece el contenido reciente por encima del contenido bueno, así que todos los sitios terminan escupiendo cosas que se sienten como basura generada constante
      Ya llegué al punto de que si un resultado de búsqueda tiene una fecha de los últimos 2 años, asumo que es basura y ni le doy clic
      La respuesta quizá sea irse a Kagi. Ahí yo no soy el producto sino el cliente
      Siendo honestos, no todos los sitios son así y todavía hay lugares buenos. Pero los motores de búsqueda jamás te llevan a ellos. Te muestran pura porquería todo el día
    • Claro, Google no tuvo absolutamente nada que ver en crear ese estado de cosas
    • Esa podredumbre es una consecuencia directa de la economía publicitaria con la que Google se quedó con todo el dinero
      Aunque si no lo hubiera hecho Google tal vez lo habría hecho alguien más, el hecho es que lo hizo Google, y contaminó el pozo del que todos bebemos
    • Intenté leer noticias del I/O en algún blog fan de Google News medio inútil
      Cuando iba como a la mitad del artículo, tres anuncios gigantes ocupaban arriba, derecha y abajo, consumiendo más espacio que el texto, y en la esquina inferior derecha flotaba un video publicitario con autoplay tapando la mayor parte de uno de los banners
      Los anuncios “dinámicos” en medio del texto crecían y se encogían de golpe y con tirones, hasta el punto de que literalmente no se podía leer nada
      Y eso, de hecho, está entre las experiencias relativamente mejores al leer cosas parecidas a blogs modernos. Ya casi está al nivel de sitios porno sospechosos
      Es triste y patético
  • Muchas veces este tipo de declaraciones no me hacen mucho sentido, porque no encajan con el modelo del problema que tengo yo
    Yo soy alguien que escribe un blog, o en lenguaje actual, un “productor de contenido”, y al mismo tiempo también soy usuario
    Como usuario, quiero que el user agent de mi navegador renderice páginas web por mí, y quiero que un agente de búsqueda extraiga información de múltiples fuentes y la sintetice con la atribución adecuada
    Se puede objetar que como mi producción de contenido es un hobby, me da igual que una plataforma la intermedie. Y sí, hasta cierto punto es verdad. Si dependiera de esto para vivir, podría concluir que cualquier cosa que dañe mi sustento es una guerra contra “la web”
    Pero un observador neutral tendría que decir que, si esto es una guerra, es una guerra contra mi forma de participar en la web creando contenido con fines de ingreso, reputación o recompensa
    Como usuario, en realidad no me importan mucho cada sitio ni cada creador por separado. La información que contienen sí me sirve, pero la heterogeneidad de los sitios suele ser más un obstáculo para acceder a la información
    Si los agentes de búsqueda y resumen pudieran sintetizar con precisión lo que esos sitios dicen y así hacer más preciso mi modelo de la realidad, yo estaría mucho más satisfecho
    Por eso sí me convence el argumento de que los cambios de Google pueden reducir la probabilidad de que se produzca contenido preciso y hacer que yo termine siendo engañado con más frecuencia. Pero al final esto es una herramienta, y mi modelo del mundo va a ser puesto a prueba por la realidad constantemente
    Si la máquina de búsqueda y síntesis no produce resultados útiles, me voy a dar cuenta, y tendré que ajustar cómo trato ese conocimiento para evitar consecuencias graves. Pero eso ya pasa ahora mismo
    Tampoco puedo saber si los resultados de búsqueda de Google no son resultados sembrados y ajustados para cambiar mi opinión, ni que Google no esté en connivencia con Internet Archive para fabricar un consenso que parezca real
    Como usuario ya tengo que tomar muchas decisiones, y leer resultados de búsqueda con esfuerzo para sintetizarlos por mi cuenta es mucho menos útil que usar un agente
    Así que si hay una guerra contra la web, yo con gusto participo en ella. Del lado contrario a la web

    • Estoy de acuerdo en que sería bueno que agentes de búsqueda y resumen sintetizaran con precisión lo que dicen los sitios, pero mi objetivo es solo decidir si vale la pena leer la página completa
      Como cuando un resumen de la trama te ayuda a decidir si ver una película, pero no reemplaza ver la película en sí
      Que la IA responda búsquedas como “50 usd in eur” o “current weather in Paris” me parece bien. Para cosas más complejas, prefiero muchísimo más recibir enlaces a fuentes reales
    • No me queda más que estar de acuerdo con eso de ponerse del lado contrario a la web
      La parte optimista es que esto parece empujar todavía más la dirección en la que “la web” ya venía desde hace mucho tiempo: una dirección que dificulta que los usuarios obtengan información correcta de forma honesta y eficiente, y que además conserven su presupuesto de atención y su capacidad de elegir
      Hasta ahora eso se hacía aumentando el ruido por incentivos monetarios; ahora se hace recortando el ruido, también por incentivos monetarios
      Lo optimista es que antes no había un enemigo único, así que era difícil pelear contra un sistema más o menos disperso, pero ahora Google está empeorando aún más la situación y se está convirtiendo a sí mismo, junto con unas pocas empresas más, en un blanco claro
      Ojalá eso haga que más gente llegue a su límite de paciencia y termine empujando un regreso a la “vieja web”, la de antes de que Google y las redes publicitarias la transformaran, o encuentre nuevas formas de relacionarse entre sí y con el contenido con mayor libertad
      No va a ser una lucha pequeña ni fácil. En gran medida es una pelea contra el estado actual del capitalismo, y por recuperar nuestra atención, nuestro pensamiento crítico y nuestra capacidad de elegir
  • Deberían pagarles a los dueños de sitios web cuyos datos usan

  • Ya ni siquiera estoy seguro de que esto sea algo malo
    La web está tan llena de basura SEO que quizá sí hace falta que Google se retire y ocurra una limpieza al estilo Usenet

    • Como consumidor, la verdad es que el Google Search actual sí me gusta bastante
      La función de IA normalmente me dice de inmediato lo que quiero saber, y si quiero verificarlo, por lo general también da enlaces a las fuentes. La forma tradicional basada en enlaces también sigue funcionando
      La gente que dice que ya no sirve casi nunca puede dar ejemplos concretos de cosas que realmente no logró encontrar
      Yo sí he visto algunas áreas flojas. El material viejo y ambiguo parece ser difícil para casi todos los motores de búsqueda, y para cosas relacionadas con piratería se puede usar Yandex