Resumen del keynote de la conferencia Qwen 2026 de Alibaba Cloud en Singapur

(youtube.com)

4 puntos por ragingwind 2026-05-27 | 8 comentarios | Compartir por WhatsApp

El keynote de la conferencia Qwen, celebrada por primera vez en Singapur, fue el escenario donde Alibaba Cloud formalizó su transición hacia la “era de la IA agéntica”. Subieron al escenario representantes del gobierno de Singapur, ejecutivos de Alibaba Cloud y socios como Nous Research, Fireworks AI, NVIDIA y PicsArt para anunciar cambios en modelos, infraestructura, herramientas y todo el ecosistema. El mensaje central fue construir una infraestructura full-stack capaz de transformar “tokens en inteligencia, la inteligencia en acción y la acción en valor de negocio”.

Puntos clave del anuncio

Colaboración con el gobierno de Singapur: el ministro de Estado Desmond Tan anunció una iniciativa conjunta con Alibaba Cloud, NTUC y ST Telemedia Global Data Centres para ofrecer capacitación práctica en IA generativa y agéntica a más de 1,000 empresas, desarrolladores y estudiantes locales. Recalcó el principio de que “la IA no reemplaza a los trabajadores, sino que trabaja para ellos”.
Presentación de Qwen 3.7 Max: se presentó un nuevo modelo fundacional con grandes mejoras en programación, uso de herramientas (soporte nativo del protocolo MCP), multimodalidad y tareas de larga duración (long-horizon). Según la empresa, logró desempeño de primer nivel en benchmarks importantes como SWE-Bench, IFBench y HLE.
Anuncio de Qwen Cloud: se lanzó qwencloud.com, una gateway dedicada a agentes. Ofrece más de 200 modelos, planes por tokens (desde 30 dólares al mes en el plan Standard hasta Max) y automatización de flujos de trabajo basada en Skills/CLI.
Coder y Muron: se presentaron Coder, una herramienta de vibe coding que se instala en laptops, y Muron, un agente multidominio que opera 24 horas en la nube. Muron ya se usa en 43 países, y Alibaba también reveló que internamente construyó Coder Works con solo 5 personas en 7 días.
Infraestructura cloud agéntica: se presentó un stack full-stack que cubre sandboxing basado en MicroVM (arranque en milisegundos, soporte para 10,000 sesiones concurrentes por tenant), además de identidad de agentes, gobernanza, seguridad, memoria y data plane. MiniMax dijo haber logrado sobre esta base arranques de contenedores en 20~40 ms y una reducción de 40% en TCO.

Diferenciadores técnicos

Integración full-stack: la empresa destacó que es uno de solo dos hyperscalers que poseen internamente todas las capas, desde silicio (PPU propia, CIPU de quinta generación) hasta modelos fundacionales.
Cloud nativo para agentes: en lugar de una estructura centrada en SaaS para humanos, está rediseñando todo el control plane como APIs e infraestructura que los agentes puedan invocar y usar directamente.
Ecosistema abierto: se unió como miembro Platinum de la PyTorch Foundation y busca posicionarse como un hub multimodelo al incluir en su Model Studio incluso a competidores como Kimi, Zhipu, MiniMax, StepFun y Vidu.

Aspectos destacados como fortalezas

Eficiencia de costos: explicó que los planes por tokens mejoran la visibilidad de costos y el control de presupuesto, y que la selección automática de modelos en Coder puede reducir los costos de tokens hasta en 70%.
Capacidad de ejecución prolongada: se anunció que Qwen 3.7 Max mostró casos de ejecución continua durante 35 horas, con más de 1,000 llamadas a herramientas y una mejora promedio de velocidad de 10 veces.
Confianza y seguridad: destacó que fue incluido como el único proveedor de Asia-Pacífico en el Gartner 2025 Magic Quadrant de Access Management, y subrayó medidas de seguridad en tiempo de ejecución como agent firewall e ID guard.

Limitaciones y retos señalados

Dificultad para construir confianza: Tommy Eastman, de Nous Research, señaló que sigue siendo una gran tarea lograr que un mismo trabajo se ejecute de forma reproducible, y propuso un enfoque de tres capas: calidad del modelo, human-in-the-loop y gobernanza entre agentes.
Cuello de botella de memoria: Fireworks AI diagnosticó que el mayor cuello de botella de la inferencia no es el cómputo sino la memoria del KV cache, y que se necesita almacenamiento multinivel junto con un rediseño sistémico.
Revalorización del CPU: NVIDIA apuntó que, por la naturaleza serial de las llamadas a herramientas en agentes, se disparará la demanda de nuevos CPU con alto rendimiento por hilo, lo que pone en duda las premisas tradicionales de diseño de CPU en la nube.

Casos del ecosistema

PicsArt: integró Qwen Image, Wan y Happy Horse en una base de 130 millones de usuarios, y demostró flujos de trabajo agénticos como casting de personajes y producción de anuncios en video. Indicó que, tras adoptar Happy Horse, el volumen de generación de video aumentó 72%.
Hackathon global: anunció al mismo tiempo el Qwen Cloud Global Hackathon, con premios por 70,000 dólares, y los Happy Horse Awards 2026 para atraer desarrolladores y creadores.

Comparación con las conferencias de Google

Google Cloud Next 2025 (abril) e I/O 2025 (mayo), celebradas un mes antes, apuntaron en esencia a la misma dirección, aunque con armas distintas.

Línea de anuncios de Google: Gemini 2.5 Pro Deep Think, Agent Development Kit (ADK), protocolo Agent2Agent (A2A), TPU Ironwood de séptima generación, gafas Android XR y Veo 3; una avalancha de anuncios que abarcaron búsqueda, dispositivos e infraestructura.
Métricas de usuarios de Google: AI Mode llegó a 150 millones de personas en 200 países, la app de Gemini alcanzó 400 millones de usuarios mensuales, y el volumen de procesamiento de tokens creció 50 veces en un año, de 9.7 billones a 480 billones.
Diferencia de estrategia: mientras Alibaba combina integración vertical full-stack con una estrategia de hub apoyada en open source (más de 450 modelos, 2 mil millones de descargas acumuladas) y la incorporación de modelos rivales, Google respondió con una posición dominante en puntos de contacto con usuarios y ventaja en TPU propios y el estándar A2A.
Debilidades de cada uno: Google mantiene cerrado a Gemini, su producto principal, y buena parte de sus anuncios siguen en estado de “coming soon”; Alibaba, por su parte, carga con retos de acceso a los mercados de EE. UU. y Europa, además de los problemas de confiabilidad y cuellos de botella de memoria mencionados en el panel.
Áreas de ventaja a corto plazo: en el corto plazo, Google lleva ventaja en escala de usuarios y form factors, mientras que Alibaba la tiene en costo de infraestructura y en mercados fuera de EE. UU.

Alibaba Cloud considera que la competitividad de sus propios modelos no basta por sí sola para asegurar el liderazgo en la era de los agentes, por lo que está impulsando al mismo tiempo una integración vertical desde el silicio hasta modelos, infraestructura, herramientas y ecosistema, así como una expansión horizontal que incorpora tanto a PyTorch como a fabricantes de modelos rivales. Aun así, dado que en los paneles se repitieron desafíos fundamentales como la confiabilidad, los cuellos de botella de memoria y el rediseño de la arquitectura de CPU, demostrar que el cloud agéntico puede cumplir en cargas empresariales reales con el rendimiento y la rentabilidad prometidos sigue siendo una tarea pendiente. A lo largo del evento quedó clara la intención de usar Singapur como base internacional de negocios para intensificar la competencia con los hyperscalers estadounidenses.

8 comentarios

moderator 2026-05-27

He corregido el contenido. Por favor revísenlo antes de publicar el artículo.

emptybynature 2026-05-27

Lo estoy implementando con deepseek v4 pro, haciendo code review con qwen 3.7 max y la orquestación con gpt 5.5, y la calidad del código es sorprendentemente buena. De verdad, la era de la programación hecha por humanos se está apagando...

ligion 2026-05-28

¿Podría preguntar cómo configuraron el entorno?

recast7838 2026-05-28

¿DeepSeek tiene buen rendimiento? Estaba dejando de usarlo porque no paraba de hacer tonterías.

yupkidangju 2026-05-27

Es un artículo aleccionador que muestra que, aunque la IA lo redacte automáticamente, los humanos igual tienen que verificarlo.

jhk0530 2026-05-27

¿No es qwen en lugar de quen? Parece que la IA no hizo bien la transcripción.

dydwls140 2026-05-27

Qué buen ojo, yo lo vi como qwen jajajaja

tsboard 2026-05-27

Sí, igual yo también mientras leía estaba pensando: ¿qué es Quen??

Resumen del keynote de la conferencia Qwen 2026 de Alibaba Cloud en Singapur

Lecturas relacionadas

8 comentarios