2 puntos por GN⁺ 2024-01-01 | 1 comentarios | Compartir por WhatsApp

¿Qué tan mala es la calidad de los resultados de búsqueda?

  • Se propone un experimento sobre la calidad de los resultados de búsqueda. Por ejemplo, encontrar proyectos de código abierto como yt-dlp con términos generales como "youtube downloader" es difícil debido a las granjas de contenido.
  • Muchos expertos técnicos creen que los resultados de búsqueda de Google han empeorado notablemente en comparación con hace 10 años. Por otro lado, todavía hay quienes sostienen que los resultados siguen siendo buenos.

Comparación de motores de búsqueda y ChatGPT

  • Se comparan los resultados para tres tipos de preguntas usando varios motores de búsqueda y ChatGPT.
  • En los motores de búsqueda se desactiva el bloqueador de anuncios para reproducir la experiencia de un usuario común.
  • La calidad de los resultados se evalúa de forma subjetiva y varía según la presencia o no de resultados fraudulentos.

Evaluación de los resultados de búsqueda

  • Marginalia a veces ofrece respuestas aceptables y tiene la proporción más baja de resultados fraudulentos.
  • Mwmbl permite a los usuarios editar directamente la clasificación de los resultados.
  • Google tiende a devolver videos recientes de YouTube, lo cual es inútil para la mayoría de los usuarios.
  • ChatGPT muestra un desempeño impresionante en un caso y, en otros, realiza la tarea adecuadamente o se niega a responder la pregunta.

Problemas de Google y Bing

  • Google y Bing devuelven varios tipos de resultados incorrectos.
  • El ecosistema tradicional de búsqueda prioriza lo que más beneficia a la cadena de suministro del software, en lugar de lo que más beneficia al usuario.

Problemas de la búsqueda basada en publicidad

  • Los motores de búsqueda basados en publicidad tienen incentivos que no están alineados con ofrecer buenos resultados a los usuarios.
  • Google dificulta distinguir entre los anuncios y los resultados reales de búsqueda, lo que puede confundir a los usuarios.

La posibilidad de los motores de búsqueda pequeños

  • Se plantea la pregunta de si motores de búsqueda pequeños como Marginalia pueden reemplazar a Google, o si varios motores pequeños podrían ofrecer mejores resultados que Google.
  • También se cuestiona si el enfoque de curaduría por parte de los usuarios de Mwmbl será efectivo.

Opinión de GN⁺

  • El debate sobre la calidad de los resultados de búsqueda muestra cuánto dependen los usuarios de los motores de búsqueda. Aunque los grandes motores como Google siguen dominando, también sugiere que los motores pequeños pueden ser competitivos en nichos específicos.
  • Los problemas de los motores de búsqueda basados en publicidad subrayan que pueden convertirse en un obstáculo para encontrar la información que los usuarios realmente quieren. Esto resalta la necesidad de alternativas que mejoren la experiencia de búsqueda.
  • Este artículo ayuda a entender cómo los usuarios con conocimientos técnicos están superando las limitaciones de los motores de búsqueda y los problemas que enfrentan los usuarios comunes.

1 comentarios

 
GN⁺ 2024-01-01
Opiniones de Hacker News
  • A pesar de las mejoras en el algoritmo de Marginalia Search, es posible que haya tenido suerte con las consultas de ejemplo. Sigo pensando que todavía falla bastante más que otras alternativas. Esto muestra lo difícil que es evaluar la calidad de búsqueda. Como motor de búsqueda por palabras clave, hay que entender que no tiene comprensión semántica.
  • Comparte su experiencia con Kagi: lo conoció en HN y se suscribió después de 100 búsquedas. Al buscar JS y CSS al azar, MDN aparece como primer resultado y, si no, se pueden bajar de rango los sitios spam.
  • Es una de las personas que siguen pensando que los resultados de búsqueda de Google todavía son muy buenos. Reconoce que usa un bloqueador de anuncios (uBlock Origin) y no piensa desactivarlo. Entiende el enfoque del autor de apagarlo para imitar la experiencia de búsqueda de alguien no experto, pero también se podrían hacer otras pruebas con el bloqueador activado. La expectativa sobre los resultados de búsqueda para yt-dlp no coincide con la experiencia de un usuario no experto.
  • Proporciona enlaces para varias búsquedas con el fin de comparar los resultados actuales de Kagi con los de personas sin cuenta.
  • Está de acuerdo con el autor en que hay demasiado spam en la web. Kagi hace un trabajo bastante bueno degradando el spam, y con modos de búsqueda especiales como "Small Web" casi se puede eliminar por completo.
  • Buscar es difícil y todo el mundo parece saber cómo manipular los resultados. Recomienda usar motores de búsqueda donde se puedan ajustar efectivamente los sitios, como Kagi o el motor de búsqueda programable de Google. La función de votar resultados es atractiva, pero podría manipularse. El enfoque de lista blanca tiene desventajas, pero prefiere validar nuevos dominios a través de redes sociales.
  • La afirmación de que la calidad de búsqueda ha empeorado suele basarse en evidencia anecdótica, cuando debería ser una afirmación verificable. Ha habido intentos de presentar evidencia real y criterios, pero el tamaño de la muestra es demasiado pequeño para hacer afirmaciones generales.
  • No entiende por qué quienes escriben artículos sobre ChatGPT usan la versión 3.5. Los resultados son marcadamente distintos en comparación con GPT-4.
  • Recomienda probar uBlacklist. Es una herramienta para bloquear resultados de búsqueda, y permite sincronizar la configuración y la lista personal de bloqueo con Dropbox o Google Drive. También permite suscribirse a listas de bloqueo, aunque todavía no tiene feeds integrados.
  • Cuestiona la expectativa de que un buen resultado de búsqueda para "descargar videos de YouTube" deba ser yt-dlp o yt-dlp con una interfaz gráfica. A la mayoría de la gente no le interesa programar, y eso hace ver que los resultados de búsqueda son subjetivos.
  • No puede reproducir que el autor haya obtenido malos resultados en Kagi. Para los mismos términos de búsqueda, le muestra resultados mucho mejores. Se pregunta cómo hizo el autor para conseguir resultados tan malos.
  • Le parece extraña la expectativa del autor de que todos los resultados de búsqueda deban devolver el mismo tipo de enlaces. Una búsqueda donde los 10 enlaces apuntan a lo mismo es una mala búsqueda. Los resultados deberían cubrir suposiciones razonables para una consulta dada. Esta opinión también se refleja en las métricas de calidad de los motores de búsqueda.