1 puntos por GN⁺ 4 시간 전 | 4 comentarios | Compartir por WhatsApp
  • Anthropic actualizó las protecciones de ciberseguridad de Fable 5 tras conversaciones con el gobierno de EE. UU., y la mayoría de las tareas de codificación pueden seguir usándose sin cambios
  • A corto plazo, las nuevas protecciones podrían marcar solicitudes inofensivas con más frecuencia que las protecciones anteriores de Fable, y Anthropic las ajustará durante las próximas semanas
  • Si una solicitud es marcada, se mostrará una notificación al usuario y esa respuesta será proporcionada en su lugar por Opus 4.8
  • Los clasificadores de biología y química siguen igual que en el lanzamiento inicial, por lo que incluso preguntas básicas relacionadas con biología pueden provocar un fallback a Opus 4.8
  • Los planes pagos con uso incluido pueden usar Fable 5 hasta el 7 de julio por hasta el 50% de su límite de uso semanal; después deberán usar otros modelos o créditos de uso (usage credits)

Se reanuda el acceso a Fable 5 y se ajustan las protecciones

  • Anthropic actualizó las protecciones de ciberseguridad tras conversaciones con el gobierno de EE. UU.
  • La mayoría de las tareas de codificación no se ven afectadas por este cambio
  • A corto plazo, las nuevas protecciones podrían marcar algunas solicitudes inofensivas más que las protecciones anteriores de Fable
    • Anthropic planea mejorar los clasificadores durante las próximas semanas
    • Las solicitudes marcadas se notificarán claramente al usuario
    • La respuesta correspondiente será proporcionada por Opus 4.8

Limitaciones actuales de los clasificadores de biología y química

  • Los clasificadores de biología y química son los mismos que en el lanzamiento inicial
    • Los clasificadores actuales operan de forma más amplia de lo deseado
    • Incluso preguntas básicas relacionadas con biología pueden provocar un fallback a Opus 4.8
    • Las mejoras a esos clasificadores se aplicarán pronto

Condiciones de uso para planes pagos y vías de feedback

  • Todos los planes pagos con uso incluido tienen acceso a Fable 5 hasta el 7 de julio
  • Fable 5 puede usarse hasta un máximo del 50% del límite de uso semanal
    • Luego, el uso restante puede cambiarse a otros modelos
    • También se puede seguir usando Fable con créditos de uso
  • Guía de acceso promocional: Claude Fable 5 promotional access
  • Si una solicitud se marca incorrectamente en Claude Code, se puede reportar con /feedback
  • En Claude.ai y Cowork, se puede compartir feedback con los botones de pulgar
    • Este feedback se usa para ajustar los clasificadores y reducir los falsos positivos
  • Artículo del blog sobre Fable 5: Claude Fable 5 Mythos 5

4 comentarios

 
seoseonyu 1 시간 전

7 de julio... supongo que tendré que seguir aguantando por la 5.6 Sol nomás

 
treestae 13 분 전

Yo también estoy esperando a Sol.
Supongo que también saldrán Galaxy o Cosmos...

 
GN⁺ 4 시간 전
Comentarios de Hacker News
  • Creo que los pesos de Fable/Mythos podrían filtrarse a una facción hostil o terminar subidos a cualquier torrent por un solo error, haya mala intención o no
    Es muy probable que los pesos de Fable se desplieguen en cientos de centros de datos, y que miles de personas tengan acceso directo o indirecto a parte o a todo. Si de verdad fuera un modelo de nivel fin del mundo, no creo que lo manejaran así; si fuera Mythos, sí podría creer que solo corre dentro de centros de datos que cumplen normativas gubernamentales. Pero si fuera un modelo tan valioso, hackers respaldados por Estados pondrían un esfuerzo mucho mayor para sacarlo. Sea cual sea la situación real, no parece tan revolucionario como dice Anthropic

    • Llevamos escuchando desde GPT-2 que los modelos son demasiado peligrosos
      Llegó un punto en que uno deja de querer que el pastor mentiroso deje de gritar que viene el lobo, y más bien empieza a desear que el lobo se lo coma
    • A largo plazo, quizá lo mejor sería que Mythos se filtre de algún modo y toda la humanidad pueda usarlo en self-hosting
    • Podría ser más complejo de lo que parece. Según entiendo, Nvidia ofrece TEE en su línea más cara, así que es muy probable que los pesos se usen cifrados
      Eso no significa que sea imposible filtrarlos, pero sí que sería un trabajo bastante grande. Tal vez por eso Anthropic no está tan preocupada por que el lado de Elon sirva el modelo. Probablemente el flujo sea algo como hacer handshake con el TEE de Nvidia, inyectar claves y luego subir los pesos cifrados. También es posible que haya un temporizador que expire sin una señal heartbeat, para impedir que los pesos robados sigan corriendo en hardware de Nvidia
    • No parece que Anthropic esté afirmando de verdad que sea de nivel fin del mundo. Más bien parece que dicen que podría ser peligroso por sus capacidades ofensivas de ciberseguridad
    • Yo creo que es puro marketing. El gobierno ha seguido comportándose como si hiciera insider trading
  • Puse el manuscrito de un libro sobre conciencia humana y me lo bloqueó. Este modelo es ridículamente malo y Anthropic lo ha nerfeado hasta un punto que se siente malicioso
    No pienso pagar por algo que en la práctica es inútil

    • Hoy le pedí a Sonnet que usara el MCP del navegador para ingresar el usuario y la contraseña de un proyecto en el que estoy trabajando, y respondió que no podía por violar protocolos de seguridad
      Antes eso funcionaba bien. Me gusta Claude, así que seguí usándolo incluso cuando decían que Codex era mejor, pero esto ya está muy cerca de mi límite final. Pago más de 200 dólares al mes y hasta lo impulso en trabajos por contrato, pero que ni siquiera pueda ofrecer un servicio con respeto básico es completamente absurdo. En seis meses, capaz solo permitirá hablar de recetas de Easy-Bake y, si alguien se quema con un foco, lo rebajará todavía más a hablar de praderas de flores silvestres
    • El mismo problema. También me bloqueó un libro que estoy escribiendo sobre lenguaje y termodinámica. Parece que el clasificador fuera simplemente una expresión regular
    • El momento es especialmente incómodo. La fortaleza de este modelo se promocionó como su amplio alcance de trabajo, su persistencia y su capacidad de empujar autónomamente tareas grandes
      Pero si a mitad del proceso puede volver a Opus 4.8 o cortarse en cualquier momento, es difícil depender de esa capacidad. Cuando corres procesos largos así, va bastante sólido hasta que algo se clasifica como fallo, y entonces el “trabajo de largo plazo” se muere y una persona tiene que rescatarlo o forzar un rollback y reintentar
    • Me bloqueó desde la primera solicitud. Mi pareja le pidió que leyera notas de bugs vistas en el frontend del sitio web, correcciones de copy del producto, bugs de CSS y problemas de redacción, y lo bloqueó de inmediato. Inútil
    • Esta vez parece que sí tenían que hacerlo. Basta ver la publicación de ayer sobre ampliar el margen de seguridad del clasificador
  • Mientras Fable no estaba, sentí que Opus por sí solo era suficiente. Ahora volvió, pero no lo extrañaba para nada

  • Lo voy a usar esta noche, pero sin ganas. Después del 7 de julio no quiero empezar a pagar precios de API de golpe viniendo de una suscripción que me daba muchísimo más valor que eso
    Tal vez esta sea la “tokenomics” que le llega a todos este año. En fin, voy a exprimirlo lo más posible mientras se pueda, y después pienso volver a mis socios confiables, Opus 4.6 y Sonnet 4.6. No sé hasta cuándo seguirán disponibles

    • ¿Pero si lo usas así no te vas a comer la cuota enseguida y de todos modos terminarás pagando precios de API?
    • Estoy casi seguro de que después del 7 de julio va a salir un plan Max 350
    • Fijé el modelo base en Opus 4.6 justo cuando empezó la degradación de rendimiento. Da resultados mucho mejores que 4.7 o superior
      Supongo que a eso le llaman empeoramiento del servicio
  • La pérdida de confianza en los modelos con base en EE. UU. parece difícil de recuperar
    El mensaje apocalíptico exagerado de Anthropic y la administración que se dejó arrastrar por eso han erosionado mucho la confianza, e incluso desataron una especie de carrera armamentista

    • Al revés, “nuestro producto era tan bueno que casi lo prohíben” es el mejor anuncio posible. OpenAI habría hecho cualquier cosa por conseguir una situación así
      No tengo muchas ganas de probar Sonnet 5 de inmediato, pero Fable sí me llama bastante la atención
    • Ojalá OpenAI y las empresas chinas traigan la competencia que hace falta
    • Si construiste un producto basado en IA, deberías diversificar proveedores o crear una capa de abstracción para no quedar atado a un solo modelo. Deberías poder conectar cualquiera
      Si eres un ingeniero de software usuario final, puedes usar otros modelos como Gemini o ChatGPT. Eso es más productivo que quejarse por una confianza que nunca existió. Anthropic es solo una empresa que presta un servicio, y puede dejar de ofrecerlo en cualquier momento, con o sin prohibición de exportación. Lo mismo aplica a cualquier empresa de IA de cualquier país. Si quieres un LLM realmente confiable, tienes que correr tú mismo un modelo de pesos abiertos
    • Pero si Anthropic no hubiera comunicado esto como lo hizo ahora y Fable se hubiera usado para hackear el Pentágono, ¿qué habría pasado? A Dario lo habrían colgado de un árbol
    • Lo más probable es que la gran mayoría de los usuarios ni siquiera se haya enterado de que esto pasó. A veces olvidamos que quienes vivimos aquí en HN estamos dentro de una burbuja. La empresa va a vender esto como un éxito y seguirá adelante
  • En algunos proyectos, puede ser más útil hacer que genere el plan y el bucle de pruebas/verificación de tipos, en lugar de hacer que genere todo el código
    Estos entregables usan muchos menos tokens que el proyecto completo, y luego el bucle posterior se puede correr con un modelo más antiguo

    • Hoy probé hacerlo así en un proyecto que abarca 2 repositorios. Ya tenía definida la arquitectura de un caso de uso principal, y la tarea era que Claude hiciera un superconjunto no muy distinto
      Después de hacer el plan, quedaba solo alrededor del 10% del contexto de 5 horas de Fable 5, y eso fue todo lo que trabajó hoy. Obviamente es difícil generalizar
    • Sí. Estoy haciendo que Opus escriba el plan y luego levanto varios subagentes Sonnet para que implementen. Sale más barato y es más rápido
    • Ese es justamente el objetivo de Devin Fusion, y hasta ahora los resultados se ven bastante bien
      https://cognition.com/blog/devin-fusion
    • Me pregunto si alguien ha experimentado con el procesamiento por lotes. Según https://claude.com/pricing#api, usar Batch Processing reduce el precio en 50%
      Me pregunto si se podría hacer que herramientas de ejecución como OpenCode/Pi aprovechen esto para tareas como la planificación
    • Esa es la idea de opusplan
      https://code.claude.com/docs/en/model-config#opusplan-model-...
  • Solo uso Claude Pro de vez en cuando, pero el mensaje me confunde. Tal vez se me está escapando algo obvio
    ¿Que “hasta el 7 de julio puedes usar hasta el 50% del límite semanal de uso del plan en Fable 5” significa que poder usar Fable con mi suscripción es una promoción por tiempo limitado? Si estoy suscrito, ¿por qué no puedo simplemente usar el modelo? ¿En adelante la suscripción solo va a incluir modelos viejos, y los nuevos van a requerir pago adicional?


    • Dice: “Después del 7 de julio de 2026, Claude Fable 5 ya no estará incluido en el límite semanal de uso de tu plan. Claude Fable 5 seguirá disponible mediante créditos de uso, y podrás pagar por uso una vez que superes el uso incluido en tu plan”. No sé qué significa esto a largo plazo. Si sale un modelo más potente o aumenta la capacidad de cómputo de Anthropic, Fable 5 podría volver a incluirse en la suscripción, o quizá esto sea el comienzo del fin de las suscripciones. En un contexto donde otros proveedores siguen sacando modelos mejores, no tiene mucho sentido pagar una suscripción atada a Opus 4.8
    • Tampoco tardó tanto
      Dynamic workflow “Multi-lens review of docs/membership-and-friends-model.md with adversarial verification” completed · 25m 59s
      Llegaste al límite de Fable 5
      Me aparece que ya usé todo el uso de Fable 5 incluido esta semana, y que necesito créditos de uso para seguir usando Fable 5
    • Cuando salió por primera vez, dijeron que durante un período limitado se podría usar Fable 5 como parte de la suscripción, y que después harían falta créditos de uso
      En ese momento también dijeron que les gustaría volver a convertirlo en parte del plan de suscripción en algún momento. En este regreso extendieron el período de uso hasta el 7 de julio, pero lo limitaron al 50% del límite de uso, y ya no volvieron a decir que quisieran incorporarlo permanentemente al plan de suscripción. Todavía hay esperanza, pero claramente no va en una buena dirección
    • En la suscripción va a seguir habiendo acceso a modelos nuevos. Deberías poder acceder a Sonnet 5, y ese es un modelo nuevo. Solo que los modelos de nivel Mythos son solo para API
      Por ahora es así, pero con este tipo de empresas nunca se sabe cuándo va a cambiar
    • Fable cuesta más de ejecutar y parece que todavía no terminan de definir la estrategia de salida al mercado
      Da la impresión de que quieren ver cuánto lo usa realmente la gente para decidir si vale la pena seguir subsidiándolo en los planes Max/Pro, o si deberían crear un nivel adicional por encima
  • “Si Claude Fable 5 rechaza una solicitud, la Messages API devuelve stop_reason: "refusal" en una respuesta HTTP 200 exitosa, no un error”
    Exactamente lo que me viene a la mente cuando pienso en “éxito”

    • Se perdieron la oportunidad de usar el código de estado HTTP 451
      https://en.wikipedia.org/wiki/HTTP_451
    • Me pregunto si el rechazo puede ocurrir a mitad del streaming, después de que ya recibiste el código de estado y los headers. No me puse a revisar la API
  • En el terminal de Claude Code aparece: “Hasta el 7 de julio puedes usar hasta el 50% del límite semanal de uso del plan en Fable 5, y cuando llegues al límite podrás seguir usándolo con créditos de uso; además, Fable 5 consume uso más rápido que Opus 4.8”
    Esta regla del 50% no estaba antes, ¿o sí?

    • Opus 4.8 es demasiado lento comparado con GPT 5.5, así que aunque sea un poco mejor, no sirve para trabajo de ingeniería del día a día
      Pronto saldrá GPT 5.6, y el plan de 249 dólares al mes de Codex ha sido muy generoso hasta ahora. Para justificar lo que parece ser el nuevo costo de Fable 5, tendría que ser muchísimo mejor de lo que recuerdo de cuando lo usé antes
    • Tampoco reiniciaron el uso. Suerte con eso
    • Después del 7 de julio solo quedará como modelo de pago por uso. Ya no estará incluido en ningún nivel de suscripción
      Casi preferiría que no lo hubieran vuelto a poner. Si lo usas intensivamente como antes, en la práctica termina costando de 10 a 20 veces más que una suscripción 20x
    • Antes no estaba
  • Ojalá reconsideren volver a incluir el acceso a Fable en los planes de suscripción. Como mínimo, creo que debería estar incluido en el plan 20x
    Cuando anunciaron ese período inicial de unas 2 semanas, entendí que esa era la intención original y que estaban trabajando para mantenerlo dentro del plan de suscripción. Pero ahora ni siquiera dicen si eso sigue en discusión

    • El mercado va a terminar obligándolos a volver a incluirlo. Puede que ahora mismo tengan limitaciones de capacidad, o que estén evaluando si necesitan otro nivel de precio para que encaje dentro de una suscripción
      La situación que no quieren es probablemente que alguien programe 4 días a la semana y agote el límite todas las semanas
    • Solo está incluido hasta la próxima semana
      Dice: “Fable 5 está incluido hasta el 50% del límite semanal de uso hasta el 7 de julio; después estará disponible mediante créditos de uso”
 
runai 2 시간 전

¿Quién podría permitirse usarlo con créditos? Al mes podría salir por varios cientos de miles de wones, ¿no? Mejor usaría GPT versión 5.6 cuando salga.