- Desarrollo de un bot de crawling con ChatGPT para recopilar información de productos de Coupang
- Las columnas a recopilar son nombre del producto, precio de lista, precio de venta, calificación por estrellas, cantidad de reseñas, información de descuento con tarjeta, información de recompensas y beneficios, e información de envío
- Métodos para reducir el tamaño del HTML y evitar el límite de cantidad de tokens, además de consideraciones al redactar prompts
- Omitir productos patrocinados
- Manejo de excepciones cuando la estructura del DOM es diferente
- Verificación de columnas obligatorias (nombre del producto, precio)
- ChatGPT es una herramienta muy útil, pero necesita algo de depuración y ajustes (al final, quienes más se benefician son los expertos)
- Para recopilar grandes volúmenes de datos, es necesario considerar cómo evitar bloqueos
5 comentarios
Parece que todo el texto de aquí fue escrito por GPT.
Parece que se resume en eso..
Estoy creando un crawler con ChatGPT y me está ayudando mucho con el parsing y la extracción de XPath
Es un artículo sobre cómo crear un crawler con GPT, pero al final termina siendo publicidad de HashScraper.
Todos los blogs de tecnología son así, ¿no?.. jeje