- Calidad para tareas de programación: GPT 5.2 > GPT 5.1 >>> Sonnet 4.5 >> GEMINI 3 Pro
- La línea ChatGPT 5 tiene muchísimas menos alucinaciones y olvidos al programar que la competencia. La versión 5.2 cuesta un 40% más que la 5.1
- CLAUDE Sonnet 4.5 no tiene caché automática, así que hay una gran trampa en toda su estructura de precios. Se recomienda abrir unas dos cuentas y usar el plan de $20
- Google Gemini 3 Pro es un caballero con demencia vestido de traje. Tiene caché automática, así que no hay trampa en el plan. Sin embargo, consume entre 10 y 20 veces más tokens que otros modelos
- Gemini 3, que está ganando mucha popularidad, es el modelo con más alucinaciones
9 comentarios
Cuando veo cosas así, simplemente me fijo en la importancia del prompt del sistema de la herramienta. Ahora mismo, cuando lo uso en Cursor, personalmente pienso que
opus >= gpt 5.2 > gemini 3. Fuera de eso, Sonnet, 5.1 y demás... personalmente ya no los uso. Eso sí... engpt5.2la diferencia según el nivel de effort es bastante grande... Pero tampoco siempre resulta mejor usar un effort alto. Por eso termino usando principalmente Opus y Gemini. A veces, cuando me topo con un problema complicado, pongo a los tres a programar, hago que evalúen el código entre sí, y luego yo lo reviso y aplico el resultado.Tengo una suscripción paga de chatgpt, pero estoy corriendo Opus con Antigravity.
codees demasiado lento y no se puede usar. Lo que Claude hace en 5 minutos termina tomando 10 minutos. El uso de herramientas en Claude Code es abrumadoramente superior a Codex o Gemini CLI.¿Cuál sería mejor: Opus en Antigravity o Opus en Claude Code?
La trampa es que no se menciona opus 4.5.
Pero cuando ya no hay una diferencia de rendimiento abrumadora, da flojera cambiar porque configurar todo es un fastidio...
Parece que no hay algo como
opusnicodex max...No me queda muy claro a qué te refieres con que no hay caché automática... ¿quieres decir que no configuraste el caché en Claude Code, o que estás usando directamente la API por tu cuenta...?
Definitivamente, yo también, al usar Gemini 3, sentí muchas veces que perdía el contexto con frecuencia (o que lo perdía a propósito para ahorrar tokens).
Desde la perspectiva de una aplicación, soy de los que no entienden por qué la gente dice que el rendimiento de Gemini 3 es bueno..
Pero en cosas como la generación de imágenes está brutal..
No está Claude Opus 4.5.