Herramienta para buscar solo contenido creado antes del lanzamiento de ChatGPT

(tegabrain.com)

16 puntos por GN⁺ 2025-12-02 | 1 comentarios | Compartir por WhatsApp

Extensión de navegador creada para evitar la contaminación por contenido generado por IA, diseñada para buscar solo contenido escrito por humanos
Usa la API de búsqueda de Google y devuelve únicamente resultados publicados antes del 30 de noviembre de 2022
Disponible para descarga y uso en Chrome y Firefox
Parte del contexto de que, tras la aparición de ChatGPT y otros modelos grandes de lenguaje, hubo un aumento explosivo de textos, imágenes y videos generados por IA en internet
Ofrece un entorno de búsqueda confiable para usuarios que quieren acceder solo a materiales creados por personas

Resumen de Slop Evader

Slop Evader es una extensión de navegador para evitar contenido generado por IA, disponible en Chrome y Firefox
- Los usuarios pueden instalar la extensión para filtrar contenido creado por IA
Esta herramienta muestra en los resultados de búsqueda solo contenido creado antes del lanzamiento de ChatGPT (30 de noviembre de 2022)
- Usa la API de búsqueda de Google para limitar los resultados según la fecha

Contexto de desarrollo

Después del lanzamiento de ChatGPT y otros modelos grandes de lenguaje (LLM), la cantidad de textos, imágenes y videos creados por IA en internet aumentó de forma drástica
Slop Evader fue creado con el objetivo de evitar esta contaminación de la información en línea causada por contenido generado por IA
Con esta extensión, los usuarios pueden explorar solo contenido escrito o producido directamente por humanos

Funciones e importancia

Al limitar los resultados de búsqueda a publicaciones anteriores al 30 de noviembre de 2022, minimiza el impacto del contenido generado por IA
Funciona sobre la API de búsqueda de Google, por lo que mantiene una experiencia de uso similar a la de los buscadores tradicionales
Sirve como una herramienta que garantiza un acceso a la información centrado en lo humano en medio de la expansión del contenido de IA

1 comentarios

GN⁺ 2025-12-02

Opinión de Hacker News

Supuestamente es una herramienta que busca solo contenido creado antes del lanzamiento de ChatGPT (30 de noviembre de 2022)
Pero parece que la caída en la calidad de búsqueda empezó mucho antes
No solo Google: todos los buscadores ya venían empeorando, y luego la IA aceleró esa caída
En especial, fue un problema haber injertado a la fuerza la UI de búsqueda de YouTube en la búsqueda de Google
Lo que el usuario quiere no es “xyz que otras personas buscaron”, sino resultados precisos, pero con los anuncios y elementos diseñados para provocar clics solo aumentó la confusión en la UI
- Quisiera preguntar si conocen Kagi, un motor de búsqueda
  Ahí se pueden desactivar por completo las funciones de IA
  Actualmente tiene unos 61 mil miembros y está creciendo en 2 mil al mes (enlace de estadísticas)
- En realidad, el contenido generado automáticamente ya existía antes de ChatGPT
  Hacia 2020 ya había muchas páginas SEO llenas de contenido scrapeado o spam de palabras clave
  También había mucho texto hecho con modelos de lenguaje simples o cadenas de Márkov
- Parodiando la frase “Google made the search results worse”,
  sueltan chistes de autocompletado como “worse results near me” y “best worse results”
- Señalan que el objetivo de Google no es que el usuario encuentre información, sino aumentar el tiempo de permanencia
  Se burlan de cómo lo envuelven en lenguaje corporativo para maquillar que le hacen la vida más incómoda a la gente
- Llevo más de 10 años usando DuckDuckGo
  Lo uso sobre todo para buscar documentación de programación y los resultados siguen siendo bastante precisos
  Quizá sea porque mi patrón de búsqueda es simple, pero DDG todavía sirve bastante bien
Alguien dijo que “estamos minando ‘tokens de bajo fondo’ como el acero de baja radiactividad (low-background steel) posterior a la Segunda Guerra Mundial”, y esa analogía no se me sale de la cabeza
Lo resumieron en Latent Space
No estoy seguro de que los tokens hechos por humanos realmente tengan más ‘señal’ que los generados por IA
- En realidad, el acero de baja radiactividad ya no hace falta
  Según la explicación de Wikipedia, es porque desde el Tratado de Prohibición Parcial de Ensayos Nucleares de 1963 los niveles de radiactividad bajaron lo suficiente
- Hoy en día los datos sintéticos son tan comunes que esta idea ni siquiera se siente nueva
- Aclaran: “esa persona fui yo, swyx”
- Las generaciones humanas siempre han construido sobre el legado imperfecto de las generaciones anteriores
  A eso lo llamábamos “pararse sobre hombros de gigantes”
Este tipo de proyecto hace pensar en el mundo de Cyberpunk 2077
La historia era que el primer internet quedó contaminado por IAs peligrosas, así que levantaron un gran firewall y construyeron un internet nuevo centrado en humanos
Da la impresión de que algún día quizá haga falta un internet solo para humanos
Claro, en la práctica sería difícil, e imagino algo así como una red meatspace-first donde haya que verificar continuamente que uno es humano
- El problema es que es imposible verificar si el contenido salió de pensamientos humanos reales
  La mayoría del contenido ya está influido por IA, y no es lo mismo usarla como referencia que hacer copiar y pegar fraudulento
- Como dijo Nick Bostrom, una vez que una tecnología que altera la civilización sale al mundo, ya no se puede revertir
  Al final hay que adaptarse
  Creo que redes autónomas como Mastodon, Discord o Matrix apuntan en esa dirección
- La gente ya se está moviendo a grupos privados como Signal, WhatsApp y Telegram
- También hubo escenarios parecidos en la trilogía Starfish de Peter Watts y en Anathem de Neal Stephenson
- Incluso si hubiera un “internet solo para humanos”, no serviría de mucho si esos humanos están influidos por IA
Hay un leaderboard de HN que muestra quiénes usaban más em dash (—) antes de ChatGPT
Enlace
- Proponen que también deberían incluir a quienes usan double hyphen (--)
- Al ver los comentarios del usuario en primer lugar, también tenía la costumbre de usar backticks (`) en vez de apóstrofes
- También bromean con que habría que darle algo de atención a los usuarios de en dash (–)
Esta función también es posible sin extensión
Solo hay que agregar el filtro before: en Google
Ejemplo: Happiness before:2022
No sé si el contenido generado por IA sea un problema tan grande
En su mayoría solo reemplazó al viejo spam SEO de granjas de contenido
Antes tampoco leía ese tipo de textos, y ahora solo tienen frases un poco más fluidas
Si mantienes una buena higiene de búsqueda, no debería haber problema
Aun así, en r/chess de Reddit mucha gente publica respuestas de ChatGPT como si las hubiera escrito ella misma
- Un colega me mandó un reporte de bug escrito con ChatGPT, pero identificaba completamente mal el bug
  Después siguió la conversación también con ChatGPT, insistiendo en que yo estaba equivocado
  Ese futuro sí me preocupa
- Antes había una o dos respuestas incorrectas y era fácil filtrarlas,
  pero ahora hay decenas de la misma respuesta equivocada con distinto formato
- En subreddits de ciencia y tecnología también abundan los reposts de ChatGPT
  La gente publica creyendo que descubrió un gran avance filosófico
  Lugares como /r/localllama también están llenos de spam de IA, y parte de los “Show HN” en HN son portafolios falsos hechos por LLM
  Yo también he perdido tiempo con publicaciones así
- El viejo spam SEO por lo menos estaba basado en hechos
  Como en los sitios de recetas, podías saltarte las partes innecesarias
  Pero ahora casi cualquier búsqueda está cubierta de texto generado por IA
  Antes podías conseguir resultados precisos con búsquedas raras, pero ahora hay que abrirse paso entre páginas sin sentido
- Como contraargumento, antes si escribías algo bueno los buscadores lo encontraban solos,
  pero ahora ese texto humano es absorbido como dato de entrenamiento de LLM y reutilizado para la siguiente generación de contenido de IA
  Pasa aunque no quieras
La expresión “acero de baja radiactividad del internet” me parece interesante
Enlace relacionado en Wikipedia
- El mismo tema ya se había mencionado en HN hace medio año
Me pasó investigando con ChatGPT
- Alucinó una respuesta incorrecta con total seguridad
- Guardó ese contenido en memoria y lo siguió manteniendo
- Cuando le pregunté por las fuentes, se citó a sí mismo con dos artículos falsos creados por IA
  Al final lo resolví encontrando un documento escrito por humanos de la institución que era la fuente original
  Esto pasa seguido en las zonas fronterizas del conocimiento
- La IA se siente como revisar respuestas de Stack Overflow
  La primera respuesta puede estar bien o no
  Pero a un chatbot le cuesta mucho salir de una dirección equivocada
- Una solución simple es hacer la misma pregunta a 3 LLM distintos
  Si los resultados coinciden, se asume que hay menos probabilidad de alucinación
Para búsqueda de imágenes, same.energy está bastante bien
Lleva años abandonado, pero sigue funcionando y casi no tiene imágenes de IA
El producto en sí también es bastante bueno
Los resultados de Google ya eran 90% basura SEO desde antes de ChatGPT
Basta con usar Kagi y bloquear los sitios SEO
- Pero me da curiosidad cómo Kagi distingue los sitios SEO
  Quisiera saber si tiene una lista de filtros o algún criterio de clasificación

Herramienta para buscar solo contenido creado antes del lanzamiento de ChatGPT

Resumen de Slop Evader

Contexto de desarrollo

Funciones e importancia

Lecturas relacionadas

1 comentarios

Opinión de Hacker News