Yo también, por necesidad, estoy armando una solución RAG usando nada menos que 4 GPU H100, de esas tan difíciles de conseguir, pero considerando no solo la inversión directa en hardware sino también la factura de electricidad, los costos de refrigeración y demás, no dejaba de pensar que simplemente llamar a una API sería mucho mejor.

Yo también empecé probando con Ollama al principio, y en cuanto confirmé que ni siquiera podía cubrir bien 3 usuarios concurrentes, pasé enseguida a vLLM y, entre una cosa y otra, armé una solución RAG, pero (asumiendo 10 usuarios concurrentes) solo para esto ya casi tengo que usar 2 GPU H100 prácticamente al máximo. También levanto en vLLM las tareas de embeddings y de búsqueda, así que 4 H100 realmente quedan muy justas. Y eso que cada tarjeta tiene alrededor de 90 GB de VRAM.

Claro, yo en realidad no sé mucho de AI, y como fui ajustando lo necesario para el departamento junto con las políticas internas de seguridad, simplemente lo he estado intentando a la fuerza... pero me pregunto si esto realmente tiene sentido. ¿Era ChatGPT Enterprise? Realmente me parece que tiene un precio increíblemente conveniente.

 

Yo también tenía una idea parecida, pero me costaba expresarla con claridad.
Modelo mental es un nombre muy acertado. Voy a tratar de usarlo de vez en cuando.

 

¿¿Desde 150 dólares por hora? Hasta el control de variables jajajaja

 
shalome7 2025-07-15 | comentario padre | en: Feliz 20.º cumpleaños, Django (djangoproject.com)

¡De verdad me encanta Django! Yo también le debo muchísimo en muchos sentidos y me siento muy agradecido. Aunque Django hoy quizás sea un poco menos popular que antes. En realidad, no sé si alguna vez hubo un momento en que Django estuviera especialmente de moda; creo que seguirá por mucho, mucho tiempo como un framework querido por su constancia y estabilidad.

 

Para empezar, los fabricantes de componentes que producen el equipo casi no ofrecen buen soporte ni para Lua ni para Python. ¿A lo mucho C?

 

¿El que escribió ese post se puso a hacer shorts genéricos a puro clic y lo suspendieron? jajaja

 
ryj0902 2025-07-15 | comentario padre | en: Feliz 20.º cumpleaños, Django (djangoproject.com)

Lo uso bastante bien para desarrollo web como hobby.

 

const a = (a: () => null): (() => () => null) =>() => a

 

Era justo lo que necesitaba y estaba haciendo, pero ya lo hicieron por mí... Uso Claude Code Max y este es un software que realmente necesitaba para desarrollar varios proyectos al mismo tiempo.

 
kmn1120 2025-07-15 | comentario padre | en: Feliz 20.º cumpleaños, Django (djangoproject.com)

¡Feliz cumpleaños, Django!

 

La traducción al coreano está abajo.
https://roy-jung.github.io/250701-history-of-js/

 

Habría estado bien que mostraran con cifras cuánto mejoró, qué tan sobresaliente es y qué tan preciso es.

 

¿Cómo sería diferente en Corea?

 

No puedo evitar identificarme bastante con el problema del desperdicio de espacio en disco...
Opero AKS, y cada vez que veo una app de Python con una imagen de contenedor que supera 1 GB, me duele la cabeza.
Por ahora simplemente tomo prestado el Dockerfile, vuelvo a reducir yo mismo el tamaño y lo subo; si no logro bajarlo de 500 MB, simplemente me rindo jaja

 
tujuc 2025-07-15 | comentario padre | en: Feliz 20.º cumpleaños, Django (djangoproject.com)

¡Guau...! Fue un proyecto que usé al principio porque era Python...
¡Ha pasado muchísimo tiempo!
Ojalá pudiera volver a trabajar en un entorno donde lo pueda usar :) jajaja
¿Será que hago algo side?

 

¿Compararlo con Claude 3 justo cuando salió Claude 4 no es casi un engaño...?

 

Desde alrededor de las 7:00 a. m., hora de Corea, estuvo caído unos 50 minutos, pero ahora ya funciona bien.
CMD> nslookup news.hada.io 1.1.1.1

 
cocofather 2025-07-15 | comentario padre | en: Falla en 1.1.1.1 impide respuestas de DNS (cloudflarestatus.com)

A mí también me siguieron apareciendo notificaciones push de Android diciendo que no se podía acceder al servidor DNS.
Por un momento me refugié en Google DNS.
https://developers.google.com/speed/public-dns/…