Renovación de vLLM Recipes: configuraciones por combinación de modelo + hardware con un clic
(recipes.vllm.ai)recipes.vllm.ai fue renovado a fondo. Ahora puedes obtener de forma interactiva la respuesta a “¿cómo ejecuto el modelo X en el hardware Y?” con vLLM.
Cambios principales
URL espejo de HuggingFace — si cambias huggingface.co por recipes.vllm.ai, vas directo a la receta de ese modelo (ej.: recipes.vllm.ai/Qwen/Qwen3.6-35B-A3B)
Constructor interactivo de comandos — al elegir el hardware, la variante y la estrategia de paralelización, se genera un comando vllm serve listo para usar
Hardware conectable — cambio con un clic entre NVIDIA (Hopper/Blackwell) y AMD (MI300X/MI355X), con aplicación automática de flags y variables de entorno
API JSON — todas las recetas se ofrecen en la ruta /.json, para que agentes y herramientas de automatización las consuman directamente
Contribuir recetas con skills de agente
El repositorio incluye skills de agente, así que puedes contribuir nuevas recetas de punta a punta. El agente te guía desde la ejecución de benchmarks hasta la generación de la receta y el envío del PR.
→ github.com/vllm-project/recipes
4 comentarios
¿Será que dentro de poco se podrá desplegar en cualquier dispositivo con un solo clic...? qué fuerte
Parece que ahora ya van a aparecer todos los orientados a servicios.
Parece que todavía faltan muchos modelos.
Así que parece una buena oportunidad para contribuir.