- En patrones de uso tipo agente, usarlo mediante suscripción muestra una relación costo-beneficio 36 veces mejor
- El plan ‘Max 5x’ tiene un límite por sesión de 6 veces y un límite semanal de 8.3 veces, por lo que en la práctica permite más uso que lo que sugiere el marketing
- El plan ‘Max 20x’ solo se expande 20 veces tomando como base sesiones de 5 horas, y el límite semanal se queda en alrededor del doble del Max 5x
- En la interfaz web, reutilizar contexto en caché cuesta 0, mientras que en la API existe la diferencia de que, al reenviar el mismo contexto, se vuelve a cobrar el 10% del costo de entrada
- Se reconstruyeron las cifras de los límites de suscripción invirtiendo los valores de uso en punto flotante, lo que permitió analizar con precisión la estructura interna de créditos y tokens
Contexto del análisis y método de enfoque
- Se observó que los valores decimales de uso anormalmente precisos mostrados en la UI web de Claude provienen de cálculos internos
- Se estima que valores como
0.16327272727272726salen de un sistema interno de créditos basado en fracciones - Para ello se usó un método que invierte esos valores a forma fraccionaria con ayuda del Stern–Brocot tree
- Se estima que valores como
- A partir de eso se pueden reconstruir los límites reales por sesión, los límites semanales y la unidad de créditos
Diferencia en la estructura de costos entre la suscripción web y la API
- La suscripción web de Claude no genera costo de entrada adicional aunque se consulte repetidamente el mismo contexto de conversación
- En la API, el mismo contexto debe reenviarse en cada solicitud, y aunque haya cache hit, se cobra el 10% del costo de los tokens de entrada
- En patrones de uso como la codificación tipo agente, donde se consume repetidamente un contexto largo, la diferencia de costos se amplía de forma drástica
Límites reales del plan ‘Max 20x’
- La etiqueta ‘20x’ solo aplica al uso medido por sesiones de 5 horas
- El límite acumulado semanal está restringido a unas 2 veces el Max 5x
- Es conveniente para uso intenso en periodos cortos, pero pierde eficiencia en uso continuo de larga duración
Eficiencia real del plan ‘Max 5x’
- El límite por sesión se amplía a unas 6 veces frente a Pro
- El límite semanal aumenta a unas 8.3 veces frente a Pro
- Se confirma como un plan donde la cantidad real ofrecida es mayor que lo que indica el nombre
- Con una base de $100 al mes, logra una eficiencia de costos aplastante frente a la API
Conclusión sobre la eficiencia de costos
- En tareas de desarrollo basadas en agentes, como sesiones largas de programación o Claude Code, la suscripción es mucho más ventajosa que la API
- En especial, el plan ‘Max 5x’ es el punto donde mejor se equilibran velocidad, continuidad y costo
- Bajo la estructura actual, es la opción óptima para usuarios avanzados y desarrolladores
Enlace al artículo original: suspiciously precise floats, or, how I got Claude's real limits
Resumen de comentarios en Reddit
- En general, los comentarios muestran un fuerte acuerdo en que el análisis numérico del OP es válido al menos en los cálculos
- En particular, la opinión converge en que el plan ‘Max 5x’ de $100/mes ofrece la mejor relación costo-beneficio para usuarios intensivos
- Gracias a que en la UI web reutilizar la caché de contexto es gratis, en sesiones largas y tipo agente la diferencia de costo frente a la API se vuelve muy grande
- Incluso entre usuarios reales de Max 5x, muchos compartieron la experiencia de que casi nunca llegan al límite aunque lo usen todo el día
- A la afirmación de que ‘Max 20x es una trampa’ se le añadieron matices
- El límite total semanal se queda en unas 2 veces el de Max 5x
- En cambio, el límite por sesión de 5 horas se amplía 4 veces
- Por eso terminó quedando clara esta división de roles: 20x para uso explosivo de corta duración (sprints) y 5x para uso sostenido de larga duración (maratón)
- La advertencia más fuerte fue la falta de transparencia de Anthropic
- Todo este análisis se basa en cifras reconstruidas por inferencia inversa
- Los límites internos pueden cambiar sin aviso previo
- Hay consenso en que sirve para optimización de costos a corto plazo, pero es riesgoso usarlo como base para decisiones de negocio de largo plazo
- Como consejo práctico especialmente útil, se destacó la forma de usar la extensión de Claude Code para VS Code
- Es posible iniciar sesión con una cuenta de suscripción de claude.ai en lugar de una API key
- Así se puede usar el límite de la suscripción sin consumir créditos de API
- Muchos reaccionaron diciendo que era la primera vez que se enteraban de ese detalle
- Como punto adicional, se mencionaron las diferencias de privacidad y de términos
- La UI web y la API tienen Terms of Service distintos
- Existe la percepción de que, para trabajo con código sensible o propietario, usar la API es más seguro
- También llamó la atención una postura contraria: los límites de uso en realidad pueden mejorar la productividad
- Cuando el uso es casi ilimitado, los prompts tienden a volverse más largos e ineficientes
- Se valoró que los límites obligan a diseñar prompts de forma más depurada e intencional
- En conjunto, el ambiente general de los comentarios fue
- un consenso práctico de que “en este momento, Max 5x es la opción óptima”
- junto con la cautela de que “esta estructura puede cambiar en cualquier momento”
2 comentarios
Como tenía 8 agentes encendidos y corriendo, llegaba al límite rapidísimo.
Eso es porque no lo usas tanto... si te pones a darle y darle, hasta 20x se te va en un abrir y cerrar de ojos~