1 puntos por GN⁺ 4 시간 전 | 1 comentarios | Compartir por WhatsApp
  • A medida que se prolongan las restricciones de acceso a Mythos y Fable 5 impuestas por el gobierno de EE. UU., la japonesa Sakana AI y la china 360 apuntan al vacío generado con Fugu y Tulongfeng/Yitianzhen, respectivamente
  • Fugu de Sakana AI se presenta como un modelo capaz de competir con Fable 5 y Mythos Preview, y fue diseñado para agentes que coordinan múltiples APIs de modelos
  • Tulongfeng de la china 360 se enfoca en el descubrimiento automático de vulnerabilidades de software, mientras que Yitianzhen apunta a la automatización de la defensa cibernética y la respuesta a incidentes
  • Sakana AI dijo que el momento del lanzamiento fue casual, pero promueve una “frontier capability” sin riesgo de controles de exportación, apuntando a empresas japonesas y agencias gubernamentales
  • Aunque la importancia de los modelos estadounidenses sigue vigente, las restricciones de exportación están acelerando la aparición de alternativas regionales adaptadas al idioma y contexto local en Tokio y entre empresas chinas

El vacío de modelos creado por las restricciones de exportación de Anthropic

  • Reuters informó que la empresa china de ciberseguridad 360 presentó el miércoles Tulongfeng
    • 360 afirmó que Tulongfeng puede competir con Mythos, el modelo de IA especializado en ciberseguridad de Anthropic
    • Actualmente, Mythos y su versión más limitada, Fable 5, no están disponibles para usuarios no estadounidenses debido a medidas de la Trump Administration
  • A comienzos de esa misma semana, la tokiota Sakana AI lanzó Fugu, que significa pez globo en japonés
    • Fugu fue descrito como un modelo que “está a la altura de modelos líderes como Fable 5 y Mythos Preview de Anthropic”
    • Fue diseñado para agentes y puede coordinar el acceso a las APIs de otros modelos
  • Ambos productos aparecieron dos semanas después de que el gobierno de EE. UU. emitiera la orden relacionada con Anthropic

La estrategia de Fugu de Sakana AI

  • Un portavoz de Sakana AI dijo que el lanzamiento de Fugu coincidió con las restricciones de exportación de Mythos/Fable de manera “entirely coincidental
    • Aun así, el sitio web de la empresa promociona una “frontier capability” sin riesgo de controles de exportación
    • Sakana AI explicó que venía desarrollando Fugu desde el año pasado y que la investigación relacionada fue presentada esta primavera en ICLR
  • La empresa fue cofundada en 2023 por David Ha y Llion Jones, exempleados de Google, y Ren Ito, ex Mercari y Stability AI
    • Desarrolla modelos de IA generativa de bajo costo que funcionan bien incluso con conjuntos de datos pequeños, optimizados para el japonés y la cultura japonesa
  • Los clientes objetivo de Fugu son empresas japonesas y agencias gubernamentales que buscan reducir su exposición a controles de exportación cada vez más estrictos
    • Sakana AI no ve esto como una separación permanente de Asia respecto de la IA estadounidense
    • El portavoz afirmó que “U.S. models remain important to Asia”
  • En una colaboración para Project Syndicate, Ren Ito sostuvo que la prioridad número uno del gobierno federal de EE. UU. debería ser preservar el acceso de sus aliados cercanos, y que la IA no debe ser una tecnología acaparada, sino desarrollada en conjunto
  • En X, David Ha escribió: “Orchestration Models are the next frontier, beyond bigger models
    • Considera riesgoso que la infraestructura nacional dependa de un solo proveedor, y que los controles de exportación recientes hicieron imposible ignorar ese riesgo
    • Escribió que “Access to top models can disappear overnight” y presentó la inteligencia colectiva como una cobertura práctica frente a la concentración de poder

La IA de seguridad de 360 y la lógica del activo estratégico

  • Según reportes de Reuters y Quartz, 360 presentó dos herramientas de seguridad con IA
    • Tulongfeng: diseñada para descubrir automáticamente vulnerabilidades de software
    • Yitianzhen: creada para automatizar la defensa cibernética y la respuesta a incidentes
  • Según Reuters, el fundador de 360, Zhou Hongyi, considera que la IA para detección de vulnerabilidades es un activo estratégico nacional
    • Señaló el riesgo de una “one-way transparency” en la que solo algunos actores tengan acceso a capacidades avanzadas de detección de vulnerabilidades
  • 360 no respondió a la solicitud de comentarios de TechCrunch

El crecimiento de Anthropic y el auge de las alternativas regionales

  • Anthropic había dicho que en mayo de 2026 superó los 47 mil millones de dólares en ingresos anualizados
    • No se ha revelado cuánto depende de clientes empresariales de Asia
  • En las semanas posteriores a la entrada en vigor de la orden de exportación, Sakana AI y 360 entraron en el espacio dejado por las restricciones de acceso a los modelos de Anthropic
  • Incluso si las empresas estadounidenses logran recuperar la confianza tras el fin de la prohibición, las alternativas regionales entrenadas para entender mejor el idioma local y sus matices ya están llenando ese vacío

1 comentarios

 
GN⁺ 4 시간 전
Opiniones de Hacker News
  • Probé el modelo Fugu con C# y Unity en trabajo real usando MCP y OpenCode, y una revisión del sistema de temas más un plan para cambiar colores se comieron de una sola vez el límite de 5 horas del plan de $20.
    Subí al plan de $100 para ver el resultado de la implementación, pero fue peor que Opus y tremendamente lento; también agotó el nuevo límite de 5 horas y usó el 35% del límite semanal, aun así quedó muy por debajo de lo que Opus hacía con mucho menos tiempo y costo.
    Pueden sacar sus propias conclusiones con esta información, pero parece un desperdicio de dinero.

    • Fugu no es un modelo independiente, sino una arquitectura que llama por detrás a varios modelos SaaS existentes, como OpenAI y Anthropic, y luego reúne sus respuestas para producir un resultado.
      Afirman que combinar los resultados de varios modelos de IA y luego generar el resultado final con su propio modelo propietario mejora la calidad frente a un único modelo de backend, pero da para dudar de si ese modelo propio realmente existe y de si es lo bastante competente.
      Incluso si la afirmación fuera correcta, parece fácil de implementar haciendo que un cliente como Claude Code genere el resultado final con un modelo de rendimiento similar al modelo en segundo plano, y el servicio huele sospechoso.
    • Hablando como alguien que ofrece un servicio similar para Godot en vez de Unity, si usas modelos de gama alta como Opus, tiene sentido que un plan de $20 se agote con un solo prompt.
      Eso pasa si pagas el precio de la API tal cual y no puedes absorber un subsidio de 10x.
    • Probé Fable en Cursor y le pedí ideas para hacer que un sitio web de datos que había creado se viera menos “Claude”; en 10 minutos gastó $40 y produjo el estilo CSS más inútil y más propio de Claude posible.
      Como el sitio web en sí lo había hecho con Opus, también podría decirse que el resultado fue peor que Opus.
      Tuve la misma experiencia con modelos estadounidenses, así que quizá esos modelos asiáticos también sean de la onda Mythos.
    • Me da curiosidad qué Unity MCP estás usando.
      Estoy probando el MCP oficial y quiero saber qué usa otra gente.
      Con el conocido de coplay tuve conflictos de paquetes.
    • En búsquedas/investigación web fue parecido, y fue malo comparado con Opus.
      Se perdió la mitad de las cosas, y la otra mitad era información vieja o no verificada.
  • Fugu Ultra en realidad parece no ser un modelo, sino un sistema que enruta entre varios modelos, más parecido a un arnés en la nube, similar a Fusion de OpenRouter.
    “En lugar de ser un único modelo gigantesco, Fugu es un sistema de orquestación multiagente entrenado. Es un modelo de lenguaje entrenado para enrutar tareas a un conjunto de modelos base intercambiables y para invocar recursivamente instancias de sí mismo.” - https://openrouter.ai/sakana/fugu-ultra
    [0] https://sakana.ai/fugu/
    [1] https://openrouter.ai/openrouter/fusion

  • La expresión “Mythos-like” ya empieza a molestar.
    Los usuarios comunes no tienen forma de comparar más que mirando benchmarks.

    • “Mythos-like” simplemente significa inflado por rumores, y aquí está bien usado.
    • Las startups asiáticas de IA también hacen afirmaciones audaces sin que haya una forma real de compararlas, y se podría decir que el punto central de la intervención de Trump fue impedir que se destilara Faible.
    • ¿Acaso no hay benchmarks públicos?
  • Si no hay benchmarks confiables, en lo único en que se parecen a Mythos es en que reciben texto como entrada y devuelven texto como salida.

    • Ya casi no miro benchmarks.
      Cuando sale un modelo nuevo, lo pruebo directamente en nuestra gran base de código propietaria de software de sistemas y en productos reales ya lanzados, o en proyectos que algún día se lanzarán.
      Es bastante claro qué modelo ayuda a hacer el trabajo mejor o más rápido, y por ahora tengo la suerte de contar con un presupuesto de tokens suficiente para usar lo que haga falta.
      No necesito benchmarks, evaluaciones, marketing ni system cards; en la web solo leo tips, prácticas de trabajo y noticias de lanzamientos.
      Comparto experiencias con mis colegas, pero todo lo demás es ruido.
    • Si fue sobrepromocionado como Mythos, también se puede agregar a la lista de “Mythos-like”.
      Probablemente lo que falta es la escena del CEO advirtiéndole al mundo: “Nuestro modelo es demasiado peligroso para publicarlo en internet; alguien debería detenernos antes de que sea demasiado tarde”.
    • Hay benchmarks en el paper: https://arxiv.org/abs/2606.21228
  • La lista de inversionistas es impresionante: https://sakana.ai/company-info/?lang=en
    También llegó a los titulares de HN hace unos días y tuvo más de 100 comentarios: https://news.ycombinator.com/item?id=48624782

    • ¿Estas empresas ya habían lanzado modelos antes?
      Cuesta creer que de repente hayan sacado un modelo de nivel Mythos.
      DeepSeek, Z.ai y Alibaba/Qwen llevan mucho más tiempo en esto y durante los últimos 18 meses han venido lanzando modelos con mejoras constantes de rendimiento.
      Es difícil creer que empresas nuevas, sin lanzamientos previos, de repente hayan sacado un modelo de nivel Mythos.
    • El año pasado también tuvieron una retractación bastante humillante.
      https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
  • Creo que antes de que termine el año veremos una prohibición de LLM extranjeros por “preocupaciones de seguridad”.
    No tendrá nada que ver con el rendimiento real.
    Pero Anthropic ya estableció una línea base para sistemas tipo Mythos, y cualquier cosa que encaje en ese estándar definido de forma laxa probablemente será tratada como peligrosa para el público.

    • ¿Cómo podría funcionar en la práctica?
    • Entonces sería un adiós a la tecnología estadounidense y una bienvenida a la china.
      Nadie va a esperar, y no se puede volver a meter en la botella al genio que ya salió.
    • Es absurdo hablar como si no hubiera riesgos reales a medida que los modelos avanzan.
      Se siente como vivir en otra realidad donde el único que dice cosas inteligentes en este momento parece ser Claude.
      Casi todo lo escrito por humanos parece alucinación y tonterías performativas.
  • Visto con cinismo, mientras el modelo sea decente, es difícil refutar la afirmación de que es nivel Mythos
    porque ahora ya no se puede usar Mythos

    • ¿Qué era algo como Mythos?
      Pregunto como alguien que nunca tuvo acceso
  • Mi primera impresión es: “si no hay benchmarks de terceros, váyanse al diablo”
    Personalmente, nunca había oído hablar de ninguna de estas dos empresas
    ¿Se supone que simplemente les creamos cuando dicen que están a la par de los mejores modelos del mercado?
    Sakana describe su modelo como un “Orchestration Model”; ¿eso significa que en realidad es varios modelos pegados entre sí?

    • ¿De verdad es tan difícil crear un buen modelo, o la clave es la escala de recursos que se mete en el entrenamiento?
      Lo pregunto porque de verdad no lo sé
      Claro que no será algo trivial, pero ¿se necesita conocimiento secreto de nivel mundial para construir sobre técnicas existentes conocidas?
      Me da la impresión de que todavía hay muchos frutos al alcance por explorar, y que el tiempo y los recursos son los factores limitantes
    • En los comentarios del post de lanzamiento que apareció hace poco en HN, el ambiente era que se parece más a OpenRouter que a un modelo real
    • Mi impresión es que sí
      Más que una nueva mezcla de modelos, parece que afirman tener una estructura que aplica pegamento al vuelo de alguna forma dinámica
      La reacción de entonces también se puede ver aquí: https://news.ycombinator.com/item?id=48624782 (hace 6 días, 244 puntos, 133 comentarios)
    • ¿Anthropic dio benchmarks de terceros?
      ¿También dijeron eso en aquel momento?
      Es importante, pero la actitud está mal
  • Soy una persona simple: si no hay benchmark en https://arena.ai/leaderboard, lo tomo 100% como una estafa

    • ¿Cómo se compara con ARC AGI?
  • Como muchos comentarios aquí, también probé Fugu y algunos otros modelos, y eran bastante caros
    Con $20 no me alcanzó para terminar todo el flujo de trabajo, mientras que con Opus sí pude
    Claro, incluso con Opus, si quieres los mejores resultados quizá tengas que pulir más el prompt desde el inicio, pero esa ha sido mi experiencia hasta ahora
    La próxima prueba la haré con un sistema agéntico para ver qué tal rinde