- Una biblioteca experimental para extraer datos desde HTML sin escribir nada de código específico de la página
- Solo hay que definir la forma de los datos que se quieren extraer y pasar la URL; el resto lo extrae automáticamente
- Internamente procesa limpieza y división del HTML para reducir costos, y también realiza una verificación de alucinaciones para comprobar si los datos extraídos son realmente valores exactos presentes en la página
- Ofrece una función para establecer un presupuesto para el costo de las llamadas a la API de GPT
Aún no hay comentarios.