- Modelo fundacional especializado en datos tabulares (estructurados), que permite realizar directamente tareas de clasificación y regresión con una interfaz estilo scikit-learn de
fit/predict
- El modelo base TabPFN-2.6 fue entrenado con datos completamente sintéticos y descarga automáticamente el checkpoint en el primer uso, por lo que no hace falta configurar un pipeline de entrenamiento por separado
- Tampoco requiere preprocesamiento de datos: se deben ingresar los datos originales tal cual, sin aplicar escalado, one-hot encoding, etc., y también puede manejar valores faltantes por sí mismo
- Se recomienda GPU (~8GB de VRAM o más); en CPU solo puede ejecutarse con aproximadamente 1,000 muestras o menos, y para entornos sin GPU ofrece TabPFN Client (inferencia en la nube)
- Predicción por lotes obligatoria: si se llama a
predict para cada muestra individual, el conjunto de entrenamiento se recalcula cada vez, por lo que es unas 100 veces más lento que una sola llamada; se recomienda dividir el conjunto de prueba en bloques de 1,000
- El rango de rendimiento óptimo es de hasta 100 mil muestras y 2,000 features; para 50 mil a 100 mil muestras se usa la opción
ignore_pretraining_limits=True, y por encima de 100 mil se debe aplicar la Large Datasets Guide
- Con TabPFN Extensions ofrece funciones ampliadas como interpretación con SHAP, detección de anomalías, generación de datos sintéticos, extracción de embeddings, optimización de hiperparámetros y ensambles post-hoc
- En HuggingFace hay múltiples checkpoints especializados: para gran cantidad de features (hasta 1,000), gran cantidad de muestras (30 mil+), pocas muestras (menos de 3K), versiones ajustadas con datos reales, etc.
- En la Enterprise Edition ofrece inferencia de baja latencia basada en un motor de destilación, soporte para hasta 10 millones de filas y licencia comercial
- También ofrece por separado TabPFN UX (interfaz gráfica no-code), que puede usarse sin escribir código
- El código usa la licencia Prior Labs License (Apache 2.0 + requisito de atribución), y los pesos de los modelos TabPFN-2.5/2.6 tienen licencia no comercial
Aún no hay comentarios.