16 puntos por GN⁺ 2025-12-02 | 1 comentarios | Compartir por WhatsApp
  • Extensión de navegador creada para evitar la contaminación por contenido generado por IA, diseñada para buscar solo contenido escrito por humanos
  • Usa la API de búsqueda de Google y devuelve únicamente resultados publicados antes del 30 de noviembre de 2022
  • Disponible para descarga y uso en Chrome y Firefox
  • Parte del contexto de que, tras la aparición de ChatGPT y otros modelos grandes de lenguaje, hubo un aumento explosivo de textos, imágenes y videos generados por IA en internet
  • Ofrece un entorno de búsqueda confiable para usuarios que quieren acceder solo a materiales creados por personas

Resumen de Slop Evader

  • Slop Evader es una extensión de navegador para evitar contenido generado por IA, disponible en Chrome y Firefox
    • Los usuarios pueden instalar la extensión para filtrar contenido creado por IA
  • Esta herramienta muestra en los resultados de búsqueda solo contenido creado antes del lanzamiento de ChatGPT (30 de noviembre de 2022)
    • Usa la API de búsqueda de Google para limitar los resultados según la fecha

Contexto de desarrollo

  • Después del lanzamiento de ChatGPT y otros modelos grandes de lenguaje (LLM), la cantidad de textos, imágenes y videos creados por IA en internet aumentó de forma drástica
  • Slop Evader fue creado con el objetivo de evitar esta contaminación de la información en línea causada por contenido generado por IA
  • Con esta extensión, los usuarios pueden explorar solo contenido escrito o producido directamente por humanos

Funciones e importancia

  • Al limitar los resultados de búsqueda a publicaciones anteriores al 30 de noviembre de 2022, minimiza el impacto del contenido generado por IA
  • Funciona sobre la API de búsqueda de Google, por lo que mantiene una experiencia de uso similar a la de los buscadores tradicionales
  • Sirve como una herramienta que garantiza un acceso a la información centrado en lo humano en medio de la expansión del contenido de IA

1 comentarios

 
GN⁺ 2025-12-02
Opinión de Hacker News
  • Supuestamente es una herramienta que busca solo contenido creado antes del lanzamiento de ChatGPT (30 de noviembre de 2022)
    Pero parece que la caída en la calidad de búsqueda empezó mucho antes
    No solo Google: todos los buscadores ya venían empeorando, y luego la IA aceleró esa caída
    En especial, fue un problema haber injertado a la fuerza la UI de búsqueda de YouTube en la búsqueda de Google
    Lo que el usuario quiere no es “xyz que otras personas buscaron”, sino resultados precisos, pero con los anuncios y elementos diseñados para provocar clics solo aumentó la confusión en la UI

    • Quisiera preguntar si conocen Kagi, un motor de búsqueda
      Ahí se pueden desactivar por completo las funciones de IA
      Actualmente tiene unos 61 mil miembros y está creciendo en 2 mil al mes (enlace de estadísticas)
    • En realidad, el contenido generado automáticamente ya existía antes de ChatGPT
      Hacia 2020 ya había muchas páginas SEO llenas de contenido scrapeado o spam de palabras clave
      También había mucho texto hecho con modelos de lenguaje simples o cadenas de Márkov
    • Parodiando la frase “Google made the search results worse”,
      sueltan chistes de autocompletado como “worse results near me” y “best worse results”
    • Señalan que el objetivo de Google no es que el usuario encuentre información, sino aumentar el tiempo de permanencia
      Se burlan de cómo lo envuelven en lenguaje corporativo para maquillar que le hacen la vida más incómoda a la gente
    • Llevo más de 10 años usando DuckDuckGo
      Lo uso sobre todo para buscar documentación de programación y los resultados siguen siendo bastante precisos
      Quizá sea porque mi patrón de búsqueda es simple, pero DDG todavía sirve bastante bien
  • Alguien dijo que “estamos minando ‘tokens de bajo fondo’ como el acero de baja radiactividad (low-background steel) posterior a la Segunda Guerra Mundial”, y esa analogía no se me sale de la cabeza
    Lo resumieron en Latent Space
    No estoy seguro de que los tokens hechos por humanos realmente tengan más ‘señal’ que los generados por IA

    • En realidad, el acero de baja radiactividad ya no hace falta
      Según la explicación de Wikipedia, es porque desde el Tratado de Prohibición Parcial de Ensayos Nucleares de 1963 los niveles de radiactividad bajaron lo suficiente
    • Hoy en día los datos sintéticos son tan comunes que esta idea ni siquiera se siente nueva
    • Aclaran: “esa persona fui yo, swyx”
    • Las generaciones humanas siempre han construido sobre el legado imperfecto de las generaciones anteriores
      A eso lo llamábamos “pararse sobre hombros de gigantes”
  • Este tipo de proyecto hace pensar en el mundo de Cyberpunk 2077
    La historia era que el primer internet quedó contaminado por IAs peligrosas, así que levantaron un gran firewall y construyeron un internet nuevo centrado en humanos
    Da la impresión de que algún día quizá haga falta un internet solo para humanos
    Claro, en la práctica sería difícil, e imagino algo así como una red meatspace-first donde haya que verificar continuamente que uno es humano

    • El problema es que es imposible verificar si el contenido salió de pensamientos humanos reales
      La mayoría del contenido ya está influido por IA, y no es lo mismo usarla como referencia que hacer copiar y pegar fraudulento
    • Como dijo Nick Bostrom, una vez que una tecnología que altera la civilización sale al mundo, ya no se puede revertir
      Al final hay que adaptarse
      Creo que redes autónomas como Mastodon, Discord o Matrix apuntan en esa dirección
    • La gente ya se está moviendo a grupos privados como Signal, WhatsApp y Telegram
    • También hubo escenarios parecidos en la trilogía Starfish de Peter Watts y en Anathem de Neal Stephenson
    • Incluso si hubiera un “internet solo para humanos”, no serviría de mucho si esos humanos están influidos por IA
  • Hay un leaderboard de HN que muestra quiénes usaban más em dash (—) antes de ChatGPT
    Enlace

    • Proponen que también deberían incluir a quienes usan double hyphen (--)
    • Al ver los comentarios del usuario en primer lugar, también tenía la costumbre de usar backticks (`) en vez de apóstrofes
    • También bromean con que habría que darle algo de atención a los usuarios de en dash (–)
  • Esta función también es posible sin extensión
    Solo hay que agregar el filtro before: en Google
    Ejemplo: Happiness before:2022

  • No sé si el contenido generado por IA sea un problema tan grande
    En su mayoría solo reemplazó al viejo spam SEO de granjas de contenido
    Antes tampoco leía ese tipo de textos, y ahora solo tienen frases un poco más fluidas
    Si mantienes una buena higiene de búsqueda, no debería haber problema
    Aun así, en r/chess de Reddit mucha gente publica respuestas de ChatGPT como si las hubiera escrito ella misma

    • Un colega me mandó un reporte de bug escrito con ChatGPT, pero identificaba completamente mal el bug
      Después siguió la conversación también con ChatGPT, insistiendo en que yo estaba equivocado
      Ese futuro sí me preocupa
    • Antes había una o dos respuestas incorrectas y era fácil filtrarlas,
      pero ahora hay decenas de la misma respuesta equivocada con distinto formato
    • En subreddits de ciencia y tecnología también abundan los reposts de ChatGPT
      La gente publica creyendo que descubrió un gran avance filosófico
      Lugares como /r/localllama también están llenos de spam de IA, y parte de los “Show HN” en HN son portafolios falsos hechos por LLM
      Yo también he perdido tiempo con publicaciones así
    • El viejo spam SEO por lo menos estaba basado en hechos
      Como en los sitios de recetas, podías saltarte las partes innecesarias
      Pero ahora casi cualquier búsqueda está cubierta de texto generado por IA
      Antes podías conseguir resultados precisos con búsquedas raras, pero ahora hay que abrirse paso entre páginas sin sentido
    • Como contraargumento, antes si escribías algo bueno los buscadores lo encontraban solos,
      pero ahora ese texto humano es absorbido como dato de entrenamiento de LLM y reutilizado para la siguiente generación de contenido de IA
      Pasa aunque no quieras
  • La expresión “acero de baja radiactividad del internet” me parece interesante
    Enlace relacionado en Wikipedia

  • Me pasó investigando con ChatGPT

    • Alucinó una respuesta incorrecta con total seguridad
    • Guardó ese contenido en memoria y lo siguió manteniendo
    • Cuando le pregunté por las fuentes, se citó a sí mismo con dos artículos falsos creados por IA
      Al final lo resolví encontrando un documento escrito por humanos de la institución que era la fuente original
      Esto pasa seguido en las zonas fronterizas del conocimiento
    • La IA se siente como revisar respuestas de Stack Overflow
      La primera respuesta puede estar bien o no
      Pero a un chatbot le cuesta mucho salir de una dirección equivocada
    • Una solución simple es hacer la misma pregunta a 3 LLM distintos
      Si los resultados coinciden, se asume que hay menos probabilidad de alucinación
  • Para búsqueda de imágenes, same.energy está bastante bien
    Lleva años abandonado, pero sigue funcionando y casi no tiene imágenes de IA
    El producto en sí también es bastante bueno

  • Los resultados de Google ya eran 90% basura SEO desde antes de ChatGPT
    Basta con usar Kagi y bloquear los sitios SEO

    • Pero me da curiosidad cómo Kagi distingue los sitios SEO
      Quisiera saber si tiene una lista de filtros o algún criterio de clasificación