3 puntos por ragingwind 3 시간 전 | 4 comentarios | Compartir por WhatsApp

El keynote de la conferencia Quen, celebrada por primera vez en Singapur, fue el escenario donde Alibaba Cloud oficializó su transición hacia la “era de la IA agéntica”. Subieron al escenario representantes del gobierno de Singapur, ejecutivos de Alibaba Cloud y socios como Nous Research, Fireworks AI, NVIDIA y PicsArt para anunciar cambios en modelos, infraestructura, herramientas y todo el ecosistema. El mensaje central fue construir una infraestructura full-stack capaz de convertir “tokens en inteligencia, la inteligencia en acciones y las acciones en valor de negocio”.

Puntos clave del anuncio

  • Colaboración con el gobierno de Singapur: El ministro de Estado Desmond Tan anunció una colaboración con Alibaba Cloud, NTUC y ST Telemedia Global Data Centres para ofrecer capacitación práctica en IA generativa y agéntica a más de 1,000 empresas, desarrolladores y estudiantes locales. Enfatizó el principio de que “la IA no reemplaza a los trabajadores, sino que trabaja para ellos”.

  • Presentación de Quen 3.7 Max: Se presentó un nuevo modelo fundacional con grandes mejoras en codificación, uso de herramientas (soporte nativo para el protocolo MCP), multimodalidad y tareas de larga duración (long-horizon). Afirmaron que logró rendimiento de primer nivel en benchmarks importantes como SWE-Bench, IFBench y HLE.

  • Anuncio de Quen Cloud: Se lanzó quencloud.com, un gateway dedicado a agentes. Ofrece más de 200 modelos, planes por tokens (desde 30 dólares al mes para Standard hasta Max) y funciones de automatización de flujos de trabajo basadas en Skills/CLI.

  • Coder y Muron: Presentaron Coder, una herramienta de vibe coding que se instala en laptops, y Muron, un agente multidominio que opera 24 horas en la nube. Muron ya se usa en 43 países, y también revelaron que dentro de Alibaba construyeron Coder Works internamente en solo 7 días con 5 personas.

  • Infraestructura de nube agéntica: Presentaron un stack full-stack que abarca sandbox basados en MicroVM (arranque en milisegundos, soporte para 10,000 sesiones concurrentes por tenant), además de agent ID, gobernanza, seguridad, memoria y plano de datos. Según dijeron, MiniMax logró sobre esta base arranque de contenedores en 20~40 ms y una reducción de 40% en TCO.

Diferenciadores técnicos

  • Integración full-stack: Destacaron que son uno de los únicos dos hyperscalers que poseen internamente todas las capas, desde silicio (PPU propio y CIPU de quinta generación) hasta modelos fundacionales.
  • Nube nativa para agentes: Están rediseñando todo el plano de control para dejar atrás una estructura centrada en SaaS para humanos y pasar a APIs e infraestructura invocadas y usadas directamente por agentes.
  • Ecosistema abierto: Se unieron como miembro platino de la PyTorch Foundation y apuntan a convertirse en un hub multimodelo al incorporar en su Model Studio incluso modelos de empresas competidoras como Kimi, Zhipu, MiniMax, StepFun y Vidu.

Aspectos destacados como ventajas

  • Eficiencia de costos: Explicaron que los planes por tokens brindan visibilidad de costos y control presupuestario, y que la selección automática de modelos en Coder puede reducir el costo de tokens hasta en 70%.
  • Capacidad de ejecución prolongada: Anunciaron casos en los que Quen 3.7 Max ejecutó procesos continuos durante 35 horas, con más de 1,000 llamadas a herramientas y mejoras promedio de velocidad de 10x.
  • Confianza y seguridad: Señalaron que fueron incluidos como el único proveedor de Asia-Pacífico en el Magic Quadrant 2025 de Gartner para access management, y resaltaron protecciones en tiempo de ejecución como firewall para agentes y ID Guard.

Limitaciones y desafíos señalados

  • Dificultad para construir confianza: Tommy Eastman, de Nous Research, indicó que sigue siendo una gran tarea lograr que un mismo trabajo se ejecute de manera reproducible, y señaló que se necesita un enfoque en tres etapas: calidad del modelo, human-in-the-loop y gobernanza entre agentes.
  • Cuello de botella de memoria: Fireworks AI diagnosticó que el mayor cuello de botella de la inferencia no es el cómputo, sino la memoria del KV cache, y que se necesita almacenamiento multinivel y un rediseño sistémico.
  • Nueva relevancia del CPU: NVIDIA señaló que, por la naturaleza serial de las llamadas a herramientas de los agentes, crecerá de forma explosiva la demanda de nuevos CPU con alto rendimiento de un solo hilo, poniendo en duda supuestos tradicionales del diseño de CPU para la nube.

Casos del ecosistema

  • PicsArt: Integró los modelos Quen Image, Wan y Happy Horse en una base de 130 millones de usuarios y mostró flujos de trabajo agénticos como casting de personajes y producción de anuncios en video. Indicó que, tras adoptar Happy Horse, el volumen de generación de video aumentó 72%.
  • Hackatón global: También anunciaron el Quen Cloud Global Hackathon, con premios por 70,000 dólares, junto con los Happy Horse Awards 2026, buscando atraer desarrolladores y creadores.

Comparación con las conferencias de Google

Google Cloud Next 2025 (abril) e I/O 2025 (mayo), celebradas un mes antes, apuntaron en esencia en la misma dirección, aunque con armas distintas.

  • Línea de anuncios de Google: Presentó Gemini 2.5 Pro Deep Think, Agent Development Kit (ADK), el protocolo Agent2Agent (A2A), la TPU Ironwood de séptima generación, Android XR Glasses y Veo 3, cubriendo búsqueda, dispositivos e infraestructura.
  • Métricas de usuarios de Google: Reveló que AI Mode llegó a 150 millones de personas en 200 países, que la app de Gemini alcanzó 400 millones de usuarios mensuales y que el volumen de procesamiento de tokens creció 50 veces en un año, de 9.7 billones a 480 billones.
  • Diferencia en la estrategia: Mientras Alibaba apuesta al mismo tiempo por integración vertical full-stack y una estrategia de hub basada en open source (más de 450 modelos y 2 mil millones de descargas acumuladas) y en alojar modelos de competidores, Google responde con una ventaja abrumadora en puntos de contacto con usuarios y con su propia TPU, además de adelantarse en el estándar A2A.
  • Debilidades de cada uno: Google mantiene cerrado a Gemini, su producto principal, y gran parte de sus anuncios siguen en estado de “coming soon”, mientras que Alibaba enfrenta desafíos de acceso a los mercados de Estados Unidos y Europa, además de los problemas de confiabilidad y cuellos de botella de memoria mencionados en el panel.
  • Áreas de ventaja a corto plazo: En el corto plazo, Google parece llevar la delantera en escala de usuarios y form factors, mientras que Alibaba destaca en costo de infraestructura y en mercados fuera de Estados Unidos.

Alibaba Cloud considera que no basta con la competitividad de sus propios modelos para dominar la era de los agentes, por lo que está impulsando al mismo tiempo una integración vertical desde el silicio hasta modelos, infraestructura, herramientas y ecosistema, además de una expansión horizontal que abraza tanto a PyTorch como a empresas de modelos competidoras. Aun así, como en el panel se repitieron desafíos fundamentales como la confiabilidad, el cuello de botella de memoria y el rediseño de arquitecturas de CPU, sigue pendiente demostrar que la nube agéntica puede cumplir en cargas de trabajo empresariales reales con el rendimiento y la eficiencia económica prometidos. A lo largo de todo el evento quedó clara la intención de usar Singapur como base internacional de negocios para entrar de lleno en competencia con los hyperscalers estadounidenses.

4 comentarios

 
yupkidangju 1 시간 전

Es un artículo aleccionador que muestra que, aunque la IA lo redacte automáticamente, los humanos igual tienen que verificarlo.

 
jhk0530 3 시간 전

¿No es qwen en lugar de quen? Parece que la IA no hizo bien la transcripción.

 
dydwls140 2 시간 전

Qué buen ojo, yo lo vi como qwen jajajaja

 
tsboard 2 시간 전

Sí, igual yo también mientras leía estaba pensando: ¿qué es Quen??