19 puntos por darjeeling 2026-04-23 | 4 comentarios | Compartir por WhatsApp

recipes.vllm.ai fue renovado a fondo. Ahora puedes obtener de forma interactiva la respuesta a “¿cómo ejecuto el modelo X en el hardware Y?” con vLLM.

Cambios principales

URL espejo de HuggingFace — si cambias huggingface.co por recipes.vllm.ai, vas directo a la receta de ese modelo (ej.: recipes.vllm.ai/Qwen/Qwen3.6-35B-A3B)

Constructor interactivo de comandos — al elegir el hardware, la variante y la estrategia de paralelización, se genera un comando vllm serve listo para usar

Hardware conectable — cambio con un clic entre NVIDIA (Hopper/Blackwell) y AMD (MI300X/MI355X), con aplicación automática de flags y variables de entorno

API JSON — todas las recetas se ofrecen en la ruta /.json, para que agentes y herramientas de automatización las consuman directamente

Contribuir recetas con skills de agente

El repositorio incluye skills de agente, así que puedes contribuir nuevas recetas de punta a punta. El agente te guía desde la ejecución de benchmarks hasta la generación de la receta y el envío del PR.

→ github.com/vllm-project/recipes

4 comentarios

 
hmmhmmhm 2026-04-23

¿Será que dentro de poco se podrá desplegar en cualquier dispositivo con un solo clic...? qué fuerte

 
darjeeling 2026-04-23

Parece que ahora ya van a aparecer todos los orientados a servicios.

 
arthurk 2026-04-23

Parece que todavía faltan muchos modelos.

 
darjeeling 2026-04-23

Así que parece una buena oportunidad para contribuir.