1 puntos por GN⁺ 5 시간 전 | 1 comentarios | Compartir por WhatsApp
  • El deterioro en la calidad de los motores de búsqueda se vuelve una oportunidad para volver a aprovechar los hipervínculos y las páginas personales de enlaces, una forma antigua de explorar la web
  • Google lleva años sin ser realmente utilizable; DuckDuckGo y Bing empeoran de forma constante, y Yandex es relativamente impresionante, pero aún no alcanza el nivel más avanzado
  • YouTube es realmente el peor: tantas caras parecidas y fondos de títulos pulidos que terminan haciendo que uno evite buscar ahí por completo
  • Kagi parece depender de los motores anteriores, y los resúmenes de búsqueda con LLM tienen el límite de ser resúmenes no deterministas construidos sobre resultados de baja calidad
  • Si los sitios personales enlazan directamente sus páginas favoritas, eso se convierte en una forma de recuperar la World Wide Web enlace por enlace frente a una web centralizada

Problema central

  • El punto de partida es la idea de que ya resulta difícil negar el deterioro del rendimiento de los motores de búsqueda
  • Google lleva años siendo inutilizable, DuckDuckGo y Bing empeoran de forma constante, y Yandex, aunque más impresionante en comparación, sigue varios pasos detrás del estado del arte de antes
  • La búsqueda en YouTube se ha vuelto algo que uno evita instinctively por los videos repetidos con el mismo tipo de caras y tarjetas de título
  • Kagi suele recomendarse, pero parece depender de los tres proveedores mencionados antes
  • Los LLM pueden buscar en su lugar, pero cuando los resultados de búsqueda en sí son de baja calidad, los resúmenes no deterministas construidos sobre ellos no resuelven el problema

Respuesta propuesta

  • La solución es pensar fuera de la caja de búsqueda, y la respuesta son los hipervínculos
  • En la web temprana, era común descubrir otros sitios interesantes haciendo clic en la clásica página de “links” de un sitio genial
  • A veces esos enlaces no tenían relación o ya estaban muertos, pero otras veces daban justo en el blanco y llevaban a sitios memorables
  • En vez de lamentar la web centralizada, quienes administran sitios pueden enlazar directamente a los sitios web que les gustan
  • Mi nueva links page no es un “web ring” ni un seguimiento mutuo, sino simplemente una lista de cosas que me gustan
  • No espero que los sitios enlazados me vuelvan a enlazar, y aunque alguien enlace mi sitio, tampoco debería esperarse un enlace de vuelta
  • Si cada quien enlaza adonde quiera y crea su propia página de enlaces, esa es una forma de recuperar la World Wide Web, un hipervínculo a la vez

1 comentarios

 
GN⁺ 5 시간 전
Opiniones en Lobste.rs
  • Lamentablemente, he visto que Google en realidad pone enlaces bastante buenos dentro del panel de resumen con IA, y que esos enlaces suelen ser mejores que los primeros resultados de búsqueda normales Por ejemplo, busqué "what is a linked list" y en la parte superior del panel lateral del área de IA apareció un hilo de Reddit, y después el artículo correspondiente de Wikipedia. Personalmente creo que Wikipedia debería estar en primer lugar, pero en fin, así salió En cambio, el resultado normal número 1 era un artículo de GeeksForGeeks, y no es por tirarle a GeeksForGeeks, pero es un artículo fuertemente optimizado para motores de búsqueda, y queda muy arriba aunque en la web haya contenido mejor. En este caso, Wikipedia estaba en el puesto 2 Aunque un LLM elija mejor los enlaces, no creo que realmente sea así, y es más probable que sean resultados cuidadosamente diseñados; este es un caso representativo de enshittification. Esconden buenos enlaces dentro de `` y, si haces clic ahí, en las métricas terminas siendo un feliz consumidor de chatarra. Ya saben que los resultados de búsqueda reales ya son pésimos

    • Dijiste “no es por tirarle a GeeksForGeeks”, pero ese sitio sí merece bastante crítica. Será muy bueno en optimización para motores de búsqueda, pero rara vez tiene la información que uno realmente busca, y ya era ese tipo de contenido desde antes de que la palabra ‘slop’ se popularizara. Por eso es uno de los sitios que tengo bloqueados en los resultados de búsqueda
    • En vez de usar un motor de búsqueda generalista, darme cuenta de que conviene usar una búsqueda especializada cuando claramente existe una más adecuada fue un gran descubrimiento. Si buscas listas enlazadas, es muy probable que lo que quieres esté en Wikipedia, así que no hay mucha razón para usar Google Le agregué atajos a Firefox para que, si escribo algo como @w linked list, me lleve directo a Wikipedia. También se pueden usar muchas búsquedas más acotadas y especializadas, como Arch Wiki, MDN, Stack Overflow o IMDB Desde el principio, la idea misma de creer que una sola empresa debería operar un servicio capaz de encontrar cualquier información del mundo ya es bastante sospechosa. El año pasado escribí sobre eso Es fácil ponerse nostálgico y decir “antes bastaba con meter unas cuantas palabras clave en Google y podías encontrar cualquier cosa que existiera”, pero en realidad eso nunca fue cierto. A cambio de evitar que vagáramos por una web caótica, permitimos que Google cambiara la definición misma de la web. Decíamos “si no está en Google, no existe”, pero eso estaba mal, y recién ahora estamos empezando a ver qué tan mal estaba Mirar objetivamente toda la web desde una perspectiva divina es algo fundamentalmente imposible. Para indexar algo tan enorme como la web y al mismo tiempo evitar abusos, hay que tomar miles de decisiones grandes y pequeñas. Cada vez que haces una búsqueda, o en realidad cada vez que haces una abstracción, aceptas una simplificación de la realidad. El mapa no es el territorio; el índice no es la web https://search.technomancy.us/why
    • Existe &udm=14, que se presenta como un “código Konami para deshacer la enshittification”. Básicamente siempre te redirige a la pestaña de búsqueda Web, que normalmente está escondida bajo “More”. Llevo un tiempo usándolo en varios dispositivos y estoy muy satisfecho de haber recuperado la búsqueda “tonta” Sigue teniendo los defectos del SEO y la manipulación de rankings, pero te devuelve parte de la sensación de control que te quitó el resumen con IA
    • Esto lleva pasando un tiempo, y el año pasado incluso escribí un ejemplo en mi blog. Es sumamente irritante, y no puede sino parecer un diseño deliberado para hacer que la gente se quede más tiempo en el sitio de Google Creo que el trato entre Google y los sitios web está prácticamente anulado. Si no están dispuestos a mostrar un enlace a mi sitio, ¿por qué debería permitir que sus bots rastreen mi sitio?
  • Como ya se mencionó en el blog, si todavía no lo has probado, vale la pena darle una oportunidad a Kagi. Es bien sabido que Kagi usa datos de rastreo o índices de búsqueda de otros grandes motores de búsqueda, pero solo usa los datos y clasifica los resultados de búsqueda por su cuenta. Llevo más de 2 años usándolo y estoy satisfecho; incluso he encontrado cosas que no pude encontrar con DuckDuckGo. Puedes subir, bajar o bloquear sitios en los resultados de búsqueda, y también tiene muchas funciones como Redirects (URL Rewrites). También me gusta la forma pública en que se comunica Kagi. En el Changelog aparecen enlaces a cada ticket de Kagi Feedback, que también funciona como rastreador de issues. También tiene una página de Status. En cuanto a la idea de crear una página de enlaces en tu propio sitio, Kagi Small Web es algo parecido, y en Kagi Small Web website puedes visitar sitios aleatorios. John Gruber (Daring Fireball) y Cory Doctorow (Pluralistic) también lo usan. Como ejemplos, consulta Seriously, Give Kagi a Try, Another Periodic Suggestion to Try, Just Try, Switching to Kagi for Search, Tim Bray: ‘Mourning Google’, The Talk Show: ‘A Professional Internet User’, With Kagi Founder and CEO Vlad Prelovac, Tag: kagi. Hay una prueba de 100 búsquedas, y según tu volumen de uso, el plan Starter de $54 al año podría ser suficiente. Si necesitas más, puedes revisarlo en Individual Pricing. También existe Duo and Family, así que el costo por persona puede ser más bajo, pero solo está disponible en Professional. Puedes subir o bajar de plan en cualquier momento, y el saldo restante se prorratea y se aplica al nuevo plan.

    • Pero Kagi usa Yandex, así que pagarles equivale indirectamente a apoyar al régimen de Putin. No quiero apoyar eso sabiendo que están matando ucranianos.
    • En realidad, agrega varias fuentes. Aun así, estoy de acuerdo en que es excelente, y acabo de renovar mi suscripción.
    • Tengo entendido que DuckDuckGo también permite bloquear sitios en los resultados de búsqueda. No parece tener función para subir o bajar sitios, o al menos yo no he intentado hacerlo. También conviene saber que Kagi empezó como una empresa de IA antes de pasarse a las búsquedas [https://help.kagi.com/kagi/ai/kagi-ai.html]. No intento insinuar nada con ese hecho en sí, pero quizá mucha gente no lo sabe, así que lo comparto. Más directamente, todo el texto está escrito como si fuera publicidad, así que conviene tomar el consejo con cautela.
    • He oído muchos elogios sobre Kagi, pero en mi caso no tuve la misma suerte. No intento negar esa experiencia, y creo que es posible que yo lo esté usando mal. Por eso me da curiosidad saber qué tipo de búsquedas le están metiendo a Kagi. Mi consulta de referencia fue "sesans spin echo length formula". En DuckDuckGo, el primer enlace es la página de la wiki de SESANS, pero no tiene la fórmula que buscaba, y el segundo enlace es un artículo que sí contiene esa fórmula. En Google, el primer enlace es un material académico con bastante base matemática sobre SESANS, pero tampoco tiene la fórmula que quería; de nuevo, el segundo enlace es el artículo con la fórmula. Además, explica mejor las constantes que el segundo enlace de DDG. En Kagi, no vi la relación que buscaba hasta el sexto enlace. Para mí, Kagi salió peor, aunque quizá mi criterio también sea malo. Me pregunto para qué tipos de búsquedas funciona mejor Kagi.
    • Me gustaba Kagi, pero dejé de usarlo cuando supe que estaba enviando dinero a Rusia. Últimamente empecé a usar Uruky y me está gustando bastante. No es perfecto, pero es mejor que el Google actual. Eso sí, no investigué a fondo de dónde saca los datos; solo confirmé que no es Yandex, así que si alguien sabe más, me interesa.
  • En 2024, Google y Reddit firmaron un acuerdo de 60 millones de dólares para usar contenido de Reddit en el entrenamiento de IA de Google. Por eso, hoy en día buscar en Google se parece a ponerle el prefijo site:Reddit a todo. Los buenos sitios web antiguos quedan escondidos detrás de resultados de baja calidad y sin relación.

  • Últimamente me pregunto si la solución serán los directorios curados por personas, como los sitios originales de Yahoo. Algo así, pero con una forma de buscar dentro de esos sitios. Marginalia parece algo parecido hasta cierto punto, aunque no se ve un directorio.

    • Pensé lo mismo. En esencia, el autor está reinventando el directorio web, y pese a los problemas de escalabilidad, parece que ya llegó el momento en que vuelve a hacer falta.
    • Sí, exactamente eso. Ojalá alguien haga uno.
  • No sé si es cierto eso de que “Kagi parece depender de los 3 proveedores mencionados arriba”, pero literalmente no importa mucho. Kagi Search es realmente excelente, y probablemente seguiría pagándolo incluso si costara el doble. Hago un promedio de 1,432 búsquedas al mes y vale totalmente la pena.

    • Me da curiosidad qué diferencia viste al usar Kagi en paralelo con otros buscadores. ¿Tienes alguna búsqueda de ejemplo?
  • Dicen que “ya es difícil negar el deterioro de la funcionalidad de los motores de búsqueda”, pero ¿soy el único que no lo siente? Yo todavía busco y encuentro lo que necesito.

  • Estoy pensando en una forma de cachear casi todo de manera continua e indexarlo para búsqueda de texto completo. Porque parece que cierto material desaparece de la web o se vuelve imposible de encontrar. Antes se compartieron aquí proyectos parecidos. La idea básica es usar SQLite y FTS5 para todo. Necesito explorar más este espacio.

    • Hice mi motor de búsqueda hiperpersonalizado con SQLite FTS5. Todavía no indexa mi historial del navegador; solo indexa marcadores y todas las URL que he publicado en mis cuentas de redes sociales. Aun así, definitivamente he estado pensando en indexar también el historial del navegador. https://search.technomancy.us Ojalá más gente se anime a experimentar con esto.
  • Vi que lo mencionaron en dos comentarios, pero vale la pena dejar el enlace. Marginalia Search es excelente. https://marginalia-search.com/ https://about.marginalia-search.com/

  • Le respondí a otra persona en este hilo, pero como parece relacionado con la entrada del blog, también lo dejo como comentario principal. Si parece demasiada autopromoción o resulta incómodo, pueden borrarlo. En resumen, si reduzco mis impresiones, hubo un tiempo en que pasé algo así como un duelo pensando que había perdido la web que conocí mientras crecía. Pero gran parte de eso todavía sigue en algún lugar, y yo simplemente no lo sabía. Obviamente, la web moderna no es igual, y buena parte de lo que “lloré” era nostalgia o tenía que ver con la edad que yo tenía entonces, pero aun así la web sigue siendo enorme y está llena de cosas interesantes, útiles y divertidas. Lo que pasa es que se volvió realmente difícil encontrarlas, incluso antes de que las herramientas de IA empezaran a devorarse a los motores de búsqueda. He pensado mucho en qué experiencia era la que sentía que me faltaba, y por varias razones llegué a la misma conclusión que el autor del blog. Tiene que haber personas reales compartiendo enlaces que lleven a cosas buenas, y hay que cultivar una forma más lenta e intencional de navegar por la web. Con esa idea hice una herramienta para crear directorios web colaborativos: https://linklists.net Es muy pequeña y todavía tiene muchas asperezas. Como está más cerca de ser un proyecto artístico que solo una herramienta, casi no la he promocionado y apenas la he movido un poco entre gente de la web indie. Lleva varios meses funcionando en alfa y ya se ven partes que habría que cambiar mucho, pero si a alguien le da curiosidad y quiere probarla, estaría bien que la revisara.