- Para limpiar un entorno web contaminado por spam generado por IA y granjas de contenido, Kagi Search introdujo ‘SlopStop’, un sistema de detección con participación de la comunidad
- SlopStop muestra en los resultados de búsqueda una ‘puntuación de AI slop’ en tiempo real para texto, imágenes y video generados por IA, y permite que los usuarios reporten directamente contenido de baja calidad
- Mediante degradación automática a nivel de dominio y funciones de filtrado de medios generados por IA, refuerza la visibilidad de información más confiable
- SlopStop se integra con el proyecto ‘Small Web’ para priorizar a creadores centrados en lo humano y contenido auténtico
- Con esto, Kagi busca construir el conjunto de datos de AI slop más grande del mundo y usarlo en el futuro para tecnologías de defensa contra alucinaciones y desinformación de la IA
Definición de AI Slop y la respuesta de Kagi
- AI slop se refiere a contenido engañoso o de poco valor generado por IA con el objetivo de manipular el posicionamiento en búsquedas o captar atención
- Entre los ejemplos se incluyen reseñas falsas, falsa pericia, información incorrecta y granjas de contenido enfocadas en monetización
- Kagi no rechaza la IA en sí, pero deja claro que el contenido de IA que reemplaza la perspectiva y la conexión humanas es dañino
- La filosofía de Kagi es una “experiencia de búsqueda donde los humanos mantienen el control”, y ya había venido degradando páginas de baja calidad centradas en anuncios y rastreadores
- SlopStop amplía el filtro de imágenes existente para detectar contenido generado por IA en todo tipo de formatos, como video, artículos y dominios
Cómo funciona SlopStop
- Se añadió a los resultados de búsqueda una función para mostrar la puntuación de AI slop, lo que permite a los usuarios verificar de inmediato la confiabilidad del contenido
- Los usuarios pueden reportar contenido de baja calidad en resultados web, de imágenes y de video mediante la función ‘Reportar como contenido generado por IA’
- Kagi lo valida con sus propias señales y luego degrada automáticamente los dominios con alta proporción de contenido de IA
- En el caso de dominios mixtos, solo se marca como generado por IA la página individual
- Las imágenes y videos generados por IA se etiquetan y degradan automáticamente en cuanto se confirman, y los usuarios pueden elegir un filtro para bloquear por completo medios de IA
- El CEO Vlad señaló que “el AI slop es una amenaza existencial para un internet centrado en lo humano, y SlopStop es el primer paso para eliminarlo”
La combinación de SlopStop y Small Web
- Aunque el avance de la IA es rápido, SlopStop y Small Web buscan en conjunto restaurar un ecosistema web centrado en las personas
- Small Web construye una lista blanca de creadores humanos verificados para dar prioridad a contenido auténtico
- Cuanto más contenido de IA filtre SlopStop, mayor será la visibilidad del contenido creativo y humano
- Ambos sistemas funcionan como una doble capa de defensa para proteger internet de la comercialización y la contaminación artificial
Construcción y uso del conjunto de datos de AI Slop
- SlopStop es una fase de refuerzo de confiabilidad en todo el ecosistema de Kagi, y combina reportes de la comunidad con tecnología interna de detección para construir el mayor conjunto de datos de dominios de AI slop del mundo
- Este conjunto de datos se usará para desarrollar tecnologías de detección destinadas a prevenir alucinaciones, afirmaciones falsas y desinformación de la IA
- Kagi cita una investigación de NewsGuard para señalar que entre el 30% y el 41% de otros chatbots generan respuestas falsas
- La base de datos se publicará más adelante, y los usuarios interesados pueden registrarse para recibir actualizaciones
Participación de usuarios y protección de calidad
- Kagi impulsa el desarrollo de una solución final automatizada mediante una operación de SlopStop basada en crowdsourcing
- Los usuarios pueden participar haciendo clic en el ícono de escudo junto a los resultados de búsqueda → seleccionar ‘Reportar como contenido generado por IA’
- Todos los reportes son verificados y aplicados por el equipo de revisión de Kagi, contribuyendo a mejorar la calidad de búsqueda
- A través de la documentación técnica y el foro de SlopStop, se ofrecen detalles sobre su funcionamiento y canales de retroalimentación
- Kagi enfatiza que “la participación de cada usuario crea una experiencia de búsqueda más confiable”
1 comentarios
Opiniones en Hacker News
Me gusta el enfoque centrado en la comunidad de Kagi. La lista pública de Small Web es realmente útil.
Si aplicas el filtro smallweb en HN, la página principal se siente mucho más fresca
A veces hay textos con buenas ideas que aun así llevan una imagen de encabezado hecha por IA. Si el cuerpo del texto es auténtico, no quisiera filtrarlos. Me pregunto si esa distinción del documento permitirá un filtrado tan fino
Por ejemplo, como en la “prueba de Will Smith comiendo espagueti”, si comparas la entropía entre una escena real y una generada, parece que la diferencia sería clara. Al final, que “se vea real” significa que coincide con el nivel de entropía que esperamos
Para la IA es fácil aumentar artificialmente la entropía. Al final habrá una guerra de información y la gente será la víctima
El texto tiene una densidad de información demasiado alta y los modelos tipo GPT, de hecho, están entrenados para minimizar justamente la entropía de la que hablas
Además, la IA también puede ser entrenada para engañar esa detección
Hace poco probé buscar en Google y fue realmente terrible.
Yo quiero un internet silencioso — un lugar donde preguntas y te responden, sin intenciones ni anuncios, solo respuestas sinceras
La mayoría de la gente probablemente no puede distinguir texto de IA que se salga de la “voz por defecto” del prompt
Ese ciclo continuará, y se parece a la estructura de una GAN (Generative Adversarial Network)
Pero en la web real sigue habiendo muchísimo slop de IA.
Yo muchas veces busco información donde importa la veracidad, así que más que detectar IA, me importa la confiabilidad de la fuente.
Al final, lo importante es quién lo escribió poniendo su nombre o reputación en juego
No entiendo por qué algunos CEO son tan tercos con esto. A la gente no le gusta el contenido artificial, y aun así ellos siguen obsesionados
Por ejemplo, este video y este video están hechos con guion escrito por GPT, ilustraciones de IA y voz de IA.
En Reddit también llegan arriba publicaciones escritas por GPT, y la gente las elogia diciendo que tienen “metáforas hermosas”.
Al final, mucha gente disfruta el contenido de IA sin darse cuenta o sabiéndolo
Como puede verse en este issue relacionado, por eficiencia económica es difícil excluirlos por completo
Hoy en día es demasiado difícil encontrar contenido real.
El problema no es tanto el contenido de IA en sí, sino el entorno en el que los creadores cuidadosos quedan sepultados
La detección se vuelve más sofisticada y la IA más astuta. Sigue un duelo interminable de detección vs. evasión
Apoyo cualquier intento de frenar la avalancha de slop de IA en los resultados de búsqueda.
Se siente como el regreso del viejo spam SEO, solo que con otro empaque
La razón por la que a otros buscadores les gusta esto es que pueden reforzar su papel de puerta de entrada sin tener que crear contenido ellos mismos
Porque los resúmenes de IA están sustituyendo su contenido diseñado para atraer clics.
Quizá ellos mismos estén detrás de este movimiento de filtrado