22 puntos por GN⁺ 2026-01-30 | 2 comentarios | Compartir por WhatsApp
  • En patrones de uso tipo agente, usarlo mediante suscripción muestra una relación costo-beneficio 36 veces mejor
  • El plan ‘Max 5x’ tiene un límite por sesión de 6 veces y un límite semanal de 8.3 veces, por lo que en la práctica permite más uso que lo que sugiere el marketing
  • El plan ‘Max 20x’ solo se expande 20 veces tomando como base sesiones de 5 horas, y el límite semanal se queda en alrededor del doble del Max 5x
  • En la interfaz web, reutilizar contexto en caché cuesta 0, mientras que en la API existe la diferencia de que, al reenviar el mismo contexto, se vuelve a cobrar el 10% del costo de entrada
  • Se reconstruyeron las cifras de los límites de suscripción invirtiendo los valores de uso en punto flotante, lo que permitió analizar con precisión la estructura interna de créditos y tokens

Contexto del análisis y método de enfoque

  • Se observó que los valores decimales de uso anormalmente precisos mostrados en la UI web de Claude provienen de cálculos internos
    • Se estima que valores como 0.16327272727272726 salen de un sistema interno de créditos basado en fracciones
    • Para ello se usó un método que invierte esos valores a forma fraccionaria con ayuda del Stern–Brocot tree
  • A partir de eso se pueden reconstruir los límites reales por sesión, los límites semanales y la unidad de créditos

Diferencia en la estructura de costos entre la suscripción web y la API

  • La suscripción web de Claude no genera costo de entrada adicional aunque se consulte repetidamente el mismo contexto de conversación
  • En la API, el mismo contexto debe reenviarse en cada solicitud, y aunque haya cache hit, se cobra el 10% del costo de los tokens de entrada
  • En patrones de uso como la codificación tipo agente, donde se consume repetidamente un contexto largo, la diferencia de costos se amplía de forma drástica

Límites reales del plan ‘Max 20x’

  • La etiqueta ‘20x’ solo aplica al uso medido por sesiones de 5 horas
  • El límite acumulado semanal está restringido a unas 2 veces el Max 5x
  • Es conveniente para uso intenso en periodos cortos, pero pierde eficiencia en uso continuo de larga duración

Eficiencia real del plan ‘Max 5x’

  • El límite por sesión se amplía a unas 6 veces frente a Pro
  • El límite semanal aumenta a unas 8.3 veces frente a Pro
  • Se confirma como un plan donde la cantidad real ofrecida es mayor que lo que indica el nombre
  • Con una base de $100 al mes, logra una eficiencia de costos aplastante frente a la API

Conclusión sobre la eficiencia de costos

  • En tareas de desarrollo basadas en agentes, como sesiones largas de programación o Claude Code, la suscripción es mucho más ventajosa que la API
  • En especial, el plan ‘Max 5x’ es el punto donde mejor se equilibran velocidad, continuidad y costo
  • Bajo la estructura actual, es la opción óptima para usuarios avanzados y desarrolladores

Enlace al artículo original: suspiciously precise floats, or, how I got Claude's real limits


Resumen de comentarios en Reddit

  • En general, los comentarios muestran un fuerte acuerdo en que el análisis numérico del OP es válido al menos en los cálculos
  • En particular, la opinión converge en que el plan ‘Max 5x’ de $100/mes ofrece la mejor relación costo-beneficio para usuarios intensivos
  • Gracias a que en la UI web reutilizar la caché de contexto es gratis, en sesiones largas y tipo agente la diferencia de costo frente a la API se vuelve muy grande
  • Incluso entre usuarios reales de Max 5x, muchos compartieron la experiencia de que casi nunca llegan al límite aunque lo usen todo el día
  • A la afirmación de que ‘Max 20x es una trampa’ se le añadieron matices
    • El límite total semanal se queda en unas 2 veces el de Max 5x
    • En cambio, el límite por sesión de 5 horas se amplía 4 veces
    • Por eso terminó quedando clara esta división de roles: 20x para uso explosivo de corta duración (sprints) y 5x para uso sostenido de larga duración (maratón)
  • La advertencia más fuerte fue la falta de transparencia de Anthropic
    • Todo este análisis se basa en cifras reconstruidas por inferencia inversa
    • Los límites internos pueden cambiar sin aviso previo
    • Hay consenso en que sirve para optimización de costos a corto plazo, pero es riesgoso usarlo como base para decisiones de negocio de largo plazo
  • Como consejo práctico especialmente útil, se destacó la forma de usar la extensión de Claude Code para VS Code
    • Es posible iniciar sesión con una cuenta de suscripción de claude.ai en lugar de una API key
    • Así se puede usar el límite de la suscripción sin consumir créditos de API
    • Muchos reaccionaron diciendo que era la primera vez que se enteraban de ese detalle
  • Como punto adicional, se mencionaron las diferencias de privacidad y de términos
    • La UI web y la API tienen Terms of Service distintos
    • Existe la percepción de que, para trabajo con código sensible o propietario, usar la API es más seguro
  • También llamó la atención una postura contraria: los límites de uso en realidad pueden mejorar la productividad
    • Cuando el uso es casi ilimitado, los prompts tienden a volverse más largos e ineficientes
    • Se valoró que los límites obligan a diseñar prompts de forma más depurada e intencional
  • En conjunto, el ambiente general de los comentarios fue
    • un consenso práctico de que “en este momento, Max 5x es la opción óptima”
    • junto con la cautela de que “esta estructura puede cambiar en cualquier momento”

2 comentarios

 
00001 2026-01-31

Como tenía 8 agentes encendidos y corriendo, llegaba al límite rapidísimo.

 
iolothebard 2026-01-30

Eso es porque no lo usas tanto... si te pones a darle y darle, hasta 20x se te va en un abrir y cerrar de ojos~