32 puntos por GN⁺ 2025-05-01 | 5 comentarios | Compartir por WhatsApp
  • gpt-4.1 es un asistente cuidadoso y fiel, con fortalezas en la comprensión precisa del código y un enfoque conservador
  • gemini 2.5 pro destaca en el manejo de contextos amplios y también en el análisis de imágenes, pero existe el riesgo de que provoque modificaciones excesivas
  • sonnet 3.5/3.7 es creativo e inteligente, pero carece de mantenimiento de contexto y consistencia, por lo que se tambalea en conversaciones largas
  • grok-3-beta es lento, pero muestra un potencial sobresaliente en la visualización de diseño y la resolución de problemas complejos
  • Los usuarios separan el uso de los modelos según el flujo de trabajo y, cuando falla la depuración, prefieren una estrategia de restaurar checkpoints y cambiar de modelo

gpt-4.1

  • Se comporta como un asistente inteligente y muy confiable
  • No se apresura a sacar conclusiones; sigue la solicitud, pero no hace modificaciones excesivas
  • Se siente como una extensión del desarrollador, por lo que es especialmente adecuado para desarrolladores con experiencia

gemini 2.5 pro

  • Es potente cuando se aprovecha un contexto amplio, como logs largos de consola o archivos de código completos
  • Tiene una excelente capacidad de análisis de imágenes, capaz de detectar errores visuales
  • Su desventaja es que puede actuar con demasiada autonomía, provocando eliminaciones innecesarias de código o modificaciones excesivas
  • Requiere un control cuidadoso

sonnet 3.5 / 3.7

  • 3.7 es creativo e inteligente, pero en conversaciones largas a veces pierde el contexto o ignora instrucciones
  • 3.5 es fuerte en la comprensión y modificación de código basado en un solo archivo
  • Debido a problemas transitorios en su integración con Cursor, no está mostrando un rendimiento consistente

Otras opiniones y estrategias

  • grok-3-beta es lento, pero resulta útil para resolver problemas en los que otros modelos fallaron
  • Un usuario usa la siguiente estrategia de división de trabajo entre modelos:
    • o3/4-mini: organización de planes y razonamiento en Markdown
    • gemini 2.5 pro: análisis de problemas basado en archivos completos y uso de llamadas a funciones
    • sonnet 3.5: modificaciones de un solo archivo basadas en cmd+k

5 comentarios

 
bungker 2025-05-02

Se puede afirmar con seguridad que Gemini 2.5 Pro es el mejor cuando se trata específicamente de Go.

 
daddy 2025-05-02

Recomiendo Gemini por ser el más rápido para consultas y respuestas.

 
jk34011 2025-05-02

Yo principalmente solo usaba Sonnet,
me identifiqué mucho con varias cosas de las que están en el texto
tendré que probar también 4.1

 
gnoopy 2025-05-01

Se parece bastante a lo que yo siento. Cuanto más usaba sonnet, más inseguro me parecía; en cambio, con chatgpt 4.1, incluso después de darle una instrucción, por lo menos uno se queda más tranquilo.

También coincido con la opinión sobre Grok, pero tiendo a usarlo más cuando quiero revisar algo con calma en el chat que dentro del IDE.

 
GN⁺ 2025-05-01

Reacciones de la comunidad de Reddit

Cómo usan los modelos

  • o3/4-mini: para planificación y organización basada en Markdown; muestra mejor razonamiento y se adapta bien a la conversación (Masony817, scragz, Princekid1878)
  • gemini 2.5 pro:
    • útil en modo agente o para llamadas a funciones con contexto largo (Masony817, computerlegs)
    • potente para tener una visión completa del código y juzgar proyectos complejos (WorryBubbly3438)
    • bueno para búsqueda, verificación cruzada y preprocesamiento (computerlegs)
  • sonnet 3.5: destaca en comprender y modificar un solo archivo; adecuado para el atajo cmd+k (Masony817)
  • sonnet 3.7:
    • más creativo y superior a 3.5, pero tiene problemas para no perder el hilo en conversaciones largas (Sea_Cardiologist_212)
    • sobresale por incorporar datos de corte más recientes y por su capacidad de razonamiento (yairEO)
    • es estable si se maneja bien la ventana de contexto (computerlegs)
  • Claude 3.7: estable y consistente dentro del entorno de Cursor (cmndr_spanky)
  • gpt-4.1:
    • adecuado para tareas simples y repetitivas o trabajos estructurados (Princekid1878, ILikeBubblyWater)
    • tiende a hacer demasiados cambios sin explicación (ILikeBubblyWater)
  • Deepseek R1: en ciertos problemas funciona sorprendentemente mejor que otros modelos (Leather_Science_7911)

Estrategias de uso y flujo de trabajo

  • Repartir roles por modelo y cambiar entre ellos según la situación (varias opiniones)
  • cmd+k: procesamiento de un solo archivo con sonnet 3.5 (Masony817)
  • El modo agente no se usa después de la configuración inicial; en su lugar se usan la función de checkpoints y prompts claros (WorryBubbly3438)
  • Preferencia por Auto mode: permite ejecutar rápido y a bajo costo (Funny-Anything-791, d0RSI)
  • Enfoque mecánico: como una máquina CNC, son importantes instrucciones explícitas y precisas (Funny-Anything-791)
  • Los modelos especializados para pruebas de UI y diseño todavía se quedan cortos (Princekid1878)

Otras opiniones

  • Quejas de que Sonnet 3.7 ha empeorado en concentración y retención de contexto frente a antes (Sea_Cardiologist_212)
  • Gemini o Claude se ven bien en videos de prueba, pero en entornos reales es diferente (cmndr_spanky)
  • En la mayoría de los modelos, los prompts explícitos son la clave (mención común)
  • Algunos usuarios esperan integraciones con crypto o basadas en Web (mencionado indirectamente)