- Extensión de navegador creada para evitar la contaminación por contenido generado por IA, diseñada para buscar solo contenido escrito por humanos
- Usa la API de búsqueda de Google y devuelve únicamente resultados publicados antes del 30 de noviembre de 2022
- Disponible para descarga y uso en Chrome y Firefox
- Parte del contexto de que, tras la aparición de ChatGPT y otros modelos grandes de lenguaje, hubo un aumento explosivo de textos, imágenes y videos generados por IA en internet
- Ofrece un entorno de búsqueda confiable para usuarios que quieren acceder solo a materiales creados por personas
Resumen de Slop Evader
- Slop Evader es una extensión de navegador para evitar contenido generado por IA, disponible en Chrome y Firefox
- Los usuarios pueden instalar la extensión para filtrar contenido creado por IA
- Esta herramienta muestra en los resultados de búsqueda solo contenido creado antes del lanzamiento de ChatGPT (30 de noviembre de 2022)
- Usa la API de búsqueda de Google para limitar los resultados según la fecha
Contexto de desarrollo
- Después del lanzamiento de ChatGPT y otros modelos grandes de lenguaje (LLM), la cantidad de textos, imágenes y videos creados por IA en internet aumentó de forma drástica
- Slop Evader fue creado con el objetivo de evitar esta contaminación de la información en línea causada por contenido generado por IA
- Con esta extensión, los usuarios pueden explorar solo contenido escrito o producido directamente por humanos
Funciones e importancia
- Al limitar los resultados de búsqueda a publicaciones anteriores al 30 de noviembre de 2022, minimiza el impacto del contenido generado por IA
- Funciona sobre la API de búsqueda de Google, por lo que mantiene una experiencia de uso similar a la de los buscadores tradicionales
- Sirve como una herramienta que garantiza un acceso a la información centrado en lo humano en medio de la expansión del contenido de IA
1 comentarios
Opinión de Hacker News
Supuestamente es una herramienta que busca solo contenido creado antes del lanzamiento de ChatGPT (30 de noviembre de 2022)
Pero parece que la caída en la calidad de búsqueda empezó mucho antes
No solo Google: todos los buscadores ya venían empeorando, y luego la IA aceleró esa caída
En especial, fue un problema haber injertado a la fuerza la UI de búsqueda de YouTube en la búsqueda de Google
Lo que el usuario quiere no es “xyz que otras personas buscaron”, sino resultados precisos, pero con los anuncios y elementos diseñados para provocar clics solo aumentó la confusión en la UI
Ahí se pueden desactivar por completo las funciones de IA
Actualmente tiene unos 61 mil miembros y está creciendo en 2 mil al mes (enlace de estadísticas)
Hacia 2020 ya había muchas páginas SEO llenas de contenido scrapeado o spam de palabras clave
También había mucho texto hecho con modelos de lenguaje simples o cadenas de Márkov
sueltan chistes de autocompletado como “worse results near me” y “best worse results”
Se burlan de cómo lo envuelven en lenguaje corporativo para maquillar que le hacen la vida más incómoda a la gente
Lo uso sobre todo para buscar documentación de programación y los resultados siguen siendo bastante precisos
Quizá sea porque mi patrón de búsqueda es simple, pero DDG todavía sirve bastante bien
Alguien dijo que “estamos minando ‘tokens de bajo fondo’ como el acero de baja radiactividad (low-background steel) posterior a la Segunda Guerra Mundial”, y esa analogía no se me sale de la cabeza
Lo resumieron en Latent Space
No estoy seguro de que los tokens hechos por humanos realmente tengan más ‘señal’ que los generados por IA
Según la explicación de Wikipedia, es porque desde el Tratado de Prohibición Parcial de Ensayos Nucleares de 1963 los niveles de radiactividad bajaron lo suficiente
A eso lo llamábamos “pararse sobre hombros de gigantes”
Este tipo de proyecto hace pensar en el mundo de Cyberpunk 2077
La historia era que el primer internet quedó contaminado por IAs peligrosas, así que levantaron un gran firewall y construyeron un internet nuevo centrado en humanos
Da la impresión de que algún día quizá haga falta un internet solo para humanos
Claro, en la práctica sería difícil, e imagino algo así como una red meatspace-first donde haya que verificar continuamente que uno es humano
La mayoría del contenido ya está influido por IA, y no es lo mismo usarla como referencia que hacer copiar y pegar fraudulento
Al final hay que adaptarse
Creo que redes autónomas como Mastodon, Discord o Matrix apuntan en esa dirección
Hay un leaderboard de HN que muestra quiénes usaban más em dash (—) antes de ChatGPT
Enlace
Esta función también es posible sin extensión
Solo hay que agregar el filtro
before:en GoogleEjemplo: Happiness before:2022
No sé si el contenido generado por IA sea un problema tan grande
En su mayoría solo reemplazó al viejo spam SEO de granjas de contenido
Antes tampoco leía ese tipo de textos, y ahora solo tienen frases un poco más fluidas
Si mantienes una buena higiene de búsqueda, no debería haber problema
Aun así, en r/chess de Reddit mucha gente publica respuestas de ChatGPT como si las hubiera escrito ella misma
Después siguió la conversación también con ChatGPT, insistiendo en que yo estaba equivocado
Ese futuro sí me preocupa
pero ahora hay decenas de la misma respuesta equivocada con distinto formato
La gente publica creyendo que descubrió un gran avance filosófico
Lugares como /r/localllama también están llenos de spam de IA, y parte de los “Show HN” en HN son portafolios falsos hechos por LLM
Yo también he perdido tiempo con publicaciones así
Como en los sitios de recetas, podías saltarte las partes innecesarias
Pero ahora casi cualquier búsqueda está cubierta de texto generado por IA
Antes podías conseguir resultados precisos con búsquedas raras, pero ahora hay que abrirse paso entre páginas sin sentido
pero ahora ese texto humano es absorbido como dato de entrenamiento de LLM y reutilizado para la siguiente generación de contenido de IA
Pasa aunque no quieras
La expresión “acero de baja radiactividad del internet” me parece interesante
Enlace relacionado en Wikipedia
Me pasó investigando con ChatGPT
Al final lo resolví encontrando un documento escrito por humanos de la institución que era la fuente original
Esto pasa seguido en las zonas fronterizas del conocimiento
La primera respuesta puede estar bien o no
Pero a un chatbot le cuesta mucho salir de una dirección equivocada
Si los resultados coinciden, se asume que hay menos probabilidad de alucinación
Para búsqueda de imágenes, same.energy está bastante bien
Lleva años abandonado, pero sigue funcionando y casi no tiene imágenes de IA
El producto en sí también es bastante bueno
Los resultados de Google ya eran 90% basura SEO desde antes de ChatGPT
Basta con usar Kagi y bloquear los sitios SEO
Quisiera saber si tiene una lista de filtros o algún criterio de clasificación