- Un artículo reciente de MIT Technology Review presentó la idea de comparar los LLM locales con Wikipedia como respaldo offline
- Se compararon directamente los tamaños de archivo de los principales modelos LLM de la biblioteca Ollama y la capacidad de los paquetes de Wikipedia offline ofrecidos por Kiwix
- Los archivos de LLM y los datos de Wikipedia tienen objetivos, fortalezas y debilidades distintos, por lo que no es fácil compararlos de forma simple, pero hay diferencias interesantes en términos de tamaño
- Algunos LLM (modelos de 1~4GB) son más grandes que Simple English Wikipedia (aprox. 1GB), y Wikipedia completa (57GB) es más grande que los LLM grandes (20~32GB)
- Además del tamaño de archivo, hay consideraciones prácticas como memoria y requisitos de CPU, por lo que la elección puede variar según el uso real
Comparación entre LLM locales y Wikipedia offline
Introducción y motivo de la comparación
- MIT Technology Review presentó recientemente un artículo titulado "How to run an LLM on your laptop"
- El artículo destaca que ejecutar un LLM localmente permite aprovechar conocimiento incluso en entornos offline
- Resulta llamativa la analogía de Simon Willison: 'un LLM offline es como una versión resumida e incompleta de Wikipedia; en un escenario apocalíptico, tenerlo en una USB podría ayudar a reiniciar la sociedad'
Comparación del tamaño de modelos y datos
- Se compararon varios modelos LLM de la biblioteca Ollama con los tamaños de archivo de los paquetes de Wikipedia offline ofrecidos por Kiwix
- Para la comparación, se limitaron a modelos que pueden ejecutarse en hardware de consumo común y a datos de Wikipedia sin imágenes
- Los principales resultados de la comparación son los siguientes:
- Los resúmenes más pequeños
- Best of Wikipedia (top 50 mil, resumen): 356.9MB
- Simple English Wikipedia (resumen): 417.5MB
- Modelos LLM representativos (pequeños)
- Qwen 3 0.6B: 523MB
- Deepseek-R1 1.5B: 1.1GB
- Llama 3.2 1B: 1.3GB
- Modelos LLM representativos (medianos a grandes)
- Deepseek-R1 8B / Qwen 3 8B: 5.2GB
- Gemma3n e4B: 7.5GB
- Deepseek-R1 14B: 9GB
- Qwen 3 14B: 9.3GB
- Wikipedia completa
- Wikipedia (completa): 57.18GB
- Los 50 mil artículos principales de Wikipedia ocupan apenas 356.9MB
- El LLM más pequeño (0.6B, Qwen) con 523MB es más grande que un simple resumen de Wikipedia
- Wikipedia completa (57.18GB) es mucho más grande que el LLM más grande (20GB)
Límites de la comparación y puntos a considerar
- La comparación directa es difícil: una enciclopedia (datos) y un LLM (modelo generativo) tienen propósitos y estructuras esencialmente distintos
- El tamaño de archivo no es lo único importante: además del tamaño del archivo, los LLM requieren memoria y recursos de CPU al ejecutarse. Wikipedia offline es más fácil de usar en dispositivos de bajos recursos
- Utilidad según el propósito real de uso: por ejemplo, se puede descargar solo el área de química o usar un LLM optimizado para hardware específico
- Subjetividad en los criterios de selección: la selección de elementos usados en la comparación es subjetiva
Conclusión e implicaciones
- Los 50 mil artículos principales de Wikipedia y el modelo Llama 3.2 3B tienen un tamaño de archivo similar
- El paquete más pequeño de Wikipedia es incluso más pequeño que el LLM más pequeño, mientras que el archivo completo de Wikipedia es más grande que el LLM más grande
- En entornos con suficiente almacenamiento, también vale la pena considerar descargar y usar tanto LLM como datos de Wikipedia
1 comentarios
Comentarios en Hacker News
gpgkeyporhttp, lo que abría un agujero de seguridadwikipedia_en_all_maxi_2024-01.zim; quiero extraer páginas con libzim e integrarlas con un LLM. El archivo zim guarda las páginas como HTML y pesa unos 100 GB. La razón es que quiero emparejar una gran lista de juegos almacenada en un HDD (solo títulos, sin categorías aparte) con artículos de Wikipedia para organizarlos por género o información. En mis pruebas, el LLM (Mistral Small 3.2 quantized) sorprendentemente ordena muy bien el caos. Se puede ejecutar rápido desde un script personalizado con llama.cpp