Una librería ultraligera de chunking para Node.js
(github.com/golbin)Hoy les presenté una base de datos vectorial sencilla que hice para prototipado con LLM..(https://es.news.hada.io/topic?id=10798)
Y ya que estaba en eso, también hice una librería ultraligera de chunking de texto para Node.js.
Casi no hay nada simple para usar al incrustar documentos con LLM, y para Node.js menos todavía, así que cada vez me incomodaba tener que usar librerías pesadas. (Ni pensar en usarlo en Edge)
Como ya había hecho una VectorDB sencilla, la creé para usarla junto con eso, y total, si se va a usar con LLM, en la mayoría de los casos no hace falta que sea extremadamente precisa, así que la dejé en algo que solo permite cortar por oraciones/párrafos de forma simple y ajustar el overlap de manera razonable.
La probé un momento y, como era de esperarse, con estas cosas siempre aplica: It just works, simple is the best. jaja
1 comentarios
Producto hermano: vectorDB ultrarrápida para Node.js -> https://es.news.hada.io/topic?id=10798