Actualmente GeekNews usa la búsqueda de Google integrada,
pero en lo personal la siento algo incómoda.
Si recuerdo palabras clave aproximadas de una noticia que vi recientemente y las busco,
me cuesta encontrarla porque no hay forma de ordenarla por fecha más reciente.
También he visto implementaciones que usan un vector store con wasm,
pero como los motores de búsqueda no son mi área, me cuesta imaginar cómo diseñarlo.
Si se implementa algo como fuzzy search en el frontend,
parece que de todos modos aumentaría la carga del servidor.
Es más bien para algo casual, pero ¿habrá una forma efectiva de implementarlo?
7 comentarios
Me encanta la búsqueda, soy de esos obsesionados con buscar, pero ¿cuánto volumen de búsquedas hay por día?
Si no es mucho, podrían mantener más o menos el método de búsqueda actual y probar búsqueda en lenguaje natural usando un modelo de
rerank.Esta es, a grandes rasgos, la estructura de búsqueda del servicio que hice la vez pasada.
Básicamente, primero lanzo la consulta a
esy luego aplico la API de rerank de Cohere, para servir el contenido tomando como base el cuerpo cuyo rerank score encaja mejor según lenguaje natural.Pero ahora que lo pienso, como dijeron que habían indexado Google, da la impresión de que no habría una forma clara de traer el cuerpo HTML dentro de cada resultado de búsqueda. Aun así, de todos modos dejo el enlace.
Enlace: https://dev-wiki.dev/reading/tech/1
Como tengo muchísimo tiempo libre y me gusta buscar, les agradecería que me dejaran cualquier tema relacionado si todavía queda algo por comentar : )
En mi caso, me resulta algo incómodo que los resultados más recientes no aparezcan primero. Creo que buscar de forma simple con una consulta
LIKE, como en los viejos foros BBS, se ajustaría más a mis necesidades. Aunque por temas de velocidad habría que considerar un poco el rango, claro..También me identifico con esa molestia. Por ejemplo, cuando buscas "AI", bastante seguido aparecen en la primera página publicaciones de hace 5 años.
Parece que los resultados de la búsqueda incrustada de Google se devuelven en formato JSON, así que podrían tomar eso y ordenarlo.
Revisen la solicitud a https://cse.google.com/cse/element/v1
¿Qué tal buscar directamente en Google?
query: site:news.hada.io duckdb
https://google.com/search/…