- Aplicación predeterminada: para usuarios de Max, Team y Enterprise, el contexto de 1M se activa automáticamente en Opus 4.6
- Sin costo adicional: una solicitud de 900K tokens tiene la misma tarifa por token que una de 9K
- Sin límite de rendimiento: aunque el contexto sea más largo, se mantiene el rendimiento de la cuenta sin reducción del rate limit
- No es necesario enviar el beta header: las solicitudes de más de 200K funcionan automáticamente, sin necesidad de cambiar el código existente
6 comentarios
Definitivamente, al llegar a 1M, la compactación ya no ocurre tan seguido y eso está muy bien.
Tanto gpt5.4 como Opus 4.6 no se sienten muy bien usando hasta el final 1M... Creo que es mejor cortarlo y usar unos 700~800k.
Está bien..
"Sin costo adicional"
Pero entonces desapareció la opción de 200K.
Parece que se puede desactivar con la opción
CLAUDE_CODE_DISABLE_1M_CONTEXT.¡Échenle un vistazo a https://code.claude.com/docs/en/env-vars!