- Artículo sobre lograr 78% de precisión en el dataset MNIST usando GZIP con menos de 10 líneas de código
- El autor enfatiza que la novedad de esta publicación no es alcanzar resultados de vanguardia, sino mostrar el potencial de la compresión como una herramienta de clasificación única y sin modelo
- El código proporcionado usa GZIP y NCD (Normalized Compression Distance) como métrica de similitud, y usa k-NN (k-Nearest Neighbors) para la clasificación
- GZIP se usa como una herramienta para medir la complejidad o el contenido de información de puntos de datos individuales, y NCD proporciona una medida normalizada de qué tan similares son dos puntos de datos
- El algoritmo calcula la NCD con todas las muestras de entrenamiento, las ordena y selecciona las k distancias más pequeñas. Entre estos k=5 vecinos más cercanos, la clase mayoritaria se predice como la etiqueta de la muestra de prueba
- El autor reconoce que este enfoque es computacionalmente costoso y que solo se usó una parte de las imágenes de prueba para medir la precisión
- El autor también ofrece una versión menos ocultada del algoritmo para facilitar su comprensión
- El autor menciona un enfoque similar tomado por Andreas Kirsch en 2019, que logró aproximadamente 35% de precisión
- El autor llegó a usar compresión como mecanismo de clasificación de imágenes después de leer una publicación sobre generación de texto a partir de compresión de datos y un artículo sobre clasificación de texto sin parámetros
- El autor había trabajado previamente en compresión de imágenes para visión por computadora en el edge y le interesaba aplicar esta técnica al dataset MNIST
1 comentarios
Opinión de Hacker News
gzip) junto con convolución discreta entre secuencias candidatas