4 puntos por xguru 2 시간 전 | Aún no hay comentarios. | Compartir por WhatsApp
  • Modelo fundacional especializado en datos tabulares (estructurados), que permite realizar directamente tareas de clasificación y regresión con una interfaz estilo scikit-learn de fit/predict
  • El modelo base TabPFN-2.6 fue entrenado con datos completamente sintéticos y descarga automáticamente el checkpoint en el primer uso, por lo que no hace falta configurar un pipeline de entrenamiento por separado
  • Tampoco requiere preprocesamiento de datos: se deben ingresar los datos originales tal cual, sin aplicar escalado, one-hot encoding, etc., y también puede manejar valores faltantes por sí mismo
  • Se recomienda GPU (~8GB de VRAM o más); en CPU solo puede ejecutarse con aproximadamente 1,000 muestras o menos, y para entornos sin GPU ofrece TabPFN Client (inferencia en la nube)
  • Predicción por lotes obligatoria: si se llama a predict para cada muestra individual, el conjunto de entrenamiento se recalcula cada vez, por lo que es unas 100 veces más lento que una sola llamada; se recomienda dividir el conjunto de prueba en bloques de 1,000
  • El rango de rendimiento óptimo es de hasta 100 mil muestras y 2,000 features; para 50 mil a 100 mil muestras se usa la opción ignore_pretraining_limits=True, y por encima de 100 mil se debe aplicar la Large Datasets Guide
  • Con TabPFN Extensions ofrece funciones ampliadas como interpretación con SHAP, detección de anomalías, generación de datos sintéticos, extracción de embeddings, optimización de hiperparámetros y ensambles post-hoc
  • En HuggingFace hay múltiples checkpoints especializados: para gran cantidad de features (hasta 1,000), gran cantidad de muestras (30 mil+), pocas muestras (menos de 3K), versiones ajustadas con datos reales, etc.
  • En la Enterprise Edition ofrece inferencia de baja latencia basada en un motor de destilación, soporte para hasta 10 millones de filas y licencia comercial
  • También ofrece por separado TabPFN UX (interfaz gráfica no-code), que puede usarse sin escribir código
  • El código usa la licencia Prior Labs License (Apache 2.0 + requisito de atribución), y los pesos de los modelos TabPFN-2.5/2.6 tienen licencia no comercial

Aún no hay comentarios.

Aún no hay comentarios.