15 puntos por GN⁺ 2025-04-13 | 8 comentarios | Compartir por WhatsApp
  • Google está superando ampliamente a sus competidores en rendimiento de modelos de IA, competitividad de precios e integración en productos, asegurando el liderazgo en todo el campo de la IA
  • Con Gemini 2.5 Pro como eje, está presentando diversas tecnologías de IA generativa en texto, imagen, música, video, voz y agentes, y las está integrando rápidamente en el ecosistema de Google
  • Con infraestructura de nube, hardware especializado para IA e incluso smartphones, Google está en una posición mucho más favorable que OpenAI o Anthropic para liderar la era de la IA

El resurgimiento de DeepMind y la ventaja total de Google en IA

  • El autor ha sido durante mucho tiempo fan de DeepMind y recuerda que AlphaGo y AlphaZero, más que ChatGPT, fueron los momentos verdaderamente fascinantes de la IA
  • Google podría haberse adelantado lo suficiente antes del lanzamiento de ChatGPT, pero dejó pasar la oportunidad por una estrategia demasiado cautelosa para proteger sus ingresos publicitarios de búsqueda
  • Sin embargo, desde entonces Google y DeepMind no han repetido ese error y actualmente van a la cabeza en casi todo el campo de la IA

El rendimiento sin precedentes de Gemini 2.5 Pro

  • Gemini 2.5 Pro Experimental ocupa el primer lugar tanto en benchmarks públicos como privados

    • LMArena, GPQA Diamond, Humanity’s Last Exam, AIME (matemáticas), Aider Polyglot (programación), Live Bench (diversidad), entre otros
    • Supera a Claude Sonnet jugando Pokémon y también está subiendo rápidamente en Minecraft Bench
    • También muestra resultados sobresalientes en escritura creativa y comprensión de textos largos
  • En las evaluaciones de usuarios, domina la opinión de que Gemini 2.5 Pro es lo mejor de la industria

    • En Reddit, X y otras plataformas, numerosos usuarios han compartido experiencias de uso reales que respaldan su superioridad
  • Destaca en velocidad, precio y funcionalidad

    • Es rápido, barato y ofrece una ventana de contexto de 1 millón de tokens
    • Está previsto integrarlo con la línea de productos de Google (Gmail, Docs, Maps, etc.)

El modelo liviano Gemini Flash y el open source Gemma 3

  • Gemini 2.5 Flash es un modelo liviano optimizado para entornos móviles y edge
    • Es rápido, muy barato y, junto con las versiones anteriores Flash, Flash Lite y Flash Thinking, ofrece una gran relación costo-rendimiento
  • Gemma 3 es el modelo open source de Google y puede competir con Llama 4 y DeepSeek-V3

El equilibrio perfecto entre precio y rendimiento

  • Google domina la frontera de Pareto tanto en modelos de alto rendimiento como en los de bajo costo
    • Incluso sus modelos de alto desempeño siguen siendo eficientes en costos, y los modelos económicos también muestran un rendimiento suficientemente sólido

Ventaja en todas las áreas de la IA generativa

  • Además de los modelos de texto, Gemini también está al más alto nivel en música (Lyria), imagen (Imagen 3), video (Veo 2) y voz (Chirp 3)
    • Veo 2 es considerado más aplicable en la práctica que Sora de OpenAI

Sistemas de agentes y tecnologías de interfaz

  • El modo Deep Research de Gemini 2.5 Pro es dos veces mejor que el de OpenAI
  • Están en marcha diversos proyectos como Project Astra (agente asistente) y Project Mariner (interfaz de computadora)
  • También está previsto el soporte tanto para el protocolo Agent2Agent como para Model Context Protocol

Resultados de investigación continuos y contribuciones académicas

  • Google DeepMind publica de forma constante artículos en conferencias de primer nivel como Nature, ICLR y NeurIPS
  • También está abordando la AGI y la IA industrial con un alto nivel de responsabilidad

El ecosistema de Google y la integración de IA

  • Google es una empresa de IA y también una empresa de software para consumidores, capaz de integrar IA en toda su línea de productos
    • Tiene previsto incorporar IA en 7 productos con 2 mil millones de usuarios mensuales, incluidos Search, YouTube, Android, Gmail y Chrome
    • Si Gemini se integra en todo el ecosistema de Google, se convertirá en la mejor IA preinstalada para miles de millones de usuarios

Competitividad en infraestructura de nube y hardware

  • Google alquila chips para modelos de IA a través de Google Cloud y también desarrolla sus propios TPU (Ironwood v7)
    • Mientras Microsoft respalda a OpenAI y Amazon a Anthropic desde la nube, Google resuelve todo dentro de su propio ecosistema
    • También compite con Nvidia en el terreno del hardware para IA

Entrada también en el mercado de smartphones

  • Google incorpora Gemini por defecto en el Pixel 9, lo que le permite competir incluso con Apple y Samsung
    • Ya se implementan funciones basadas en IA como compartir pantalla y control de cámara
    • Otros dispositivos o wearables de IA que han intentado otras empresas están fracasando

Conclusión: la ventaja decisiva de Google + DeepMind

  • El autor se sorprende de la ventaja total de Google hasta el punto de cuestionarse por qué antes depositaba sus expectativas en OpenAI, Anthropic o Meta
  • Seguirá observando posibles contraataques de la competencia, pero por ahora está claro que Google es el ganador indiscutible de la guerra de la IA

8 comentarios

 
phoon 2025-04-14

No es que no haya modelos que superen a GPT-4.5 en especificaciones, pero... incluso si solo les pides una traducción simple, la capacidad de estructurar oraciones entre ambos ni siquiera es parecida. (GPT gana por mucho)
Creo que ya hace falta debatir cómo deberían diseñarse los benchmarks y los conjuntos de prueba.
Y ni hablar de que no son raras las opiniones de que el rendimiento del propio LLM, en tareas generales, está por debajo de lo esperado...

 
guitarhero 2025-04-14

"El autor ha sido fan de DeepMind durante mucho tiempo,"

 
smboy86 2025-04-13

Probé un rato el 2.5 también, mmm... al final siento que GPT sigue siendo mejor; ¿será cuestión de preferencias personales?

 
mssmss 2025-04-14

Yo también ahora uso más Gemini. Fue una experiencia en la que la brecha se fue haciendo cada vez más grande.

 
kandk 2025-04-14

A mí también me da la sensación de que GPT es mejor..

 
3xplore 2025-04-14

A mí Gemini 2.5 me ha dado respuestas de mucha más calidad que GPT, Claude y Grok 3.
Sobre todo últimamente, GPT se ha vuelto demasiado lento y era incómodo de usar.

 
GN⁺ 2025-04-13
Comentarios de Hacker News
  • Como ex empleado de OpenAI, muchos talentos clave de ML han dejado OpenAI y se han ido a otras startups. La app de ChatGPT es el principal producto exitoso de OpenAI, pero los ingresos que puede obtener de las suscripciones tienen un límite. Se espera que pronto ofrezca un servicio gratuito, y la publicidad será la principal opción de monetización. Google se siente incómodo con la estrategia de adquisición de usuarios de OpenAI. Google necesita llevar la innovación rápidamente a los usuarios

  • Este artículo no menciona las TPU. El ecosistema de JAX + TPU de Google es excelente. Google cuenta con su propia solución de cómputo, lo que le da ventaja en la competencia. Las empresas de IA tienen que responder a la pregunta: "¿Qué pueden hacer que no se pueda hacer en otro lugar?" La ventaja de hardware de Google ofrece una respuesta real a esa pregunta

  • La opinión sobre quién lidera el campo de ML cambia con frecuencia. Hace unos meses se pensaba que Google había fracasado, pero ahora OpenAI está perdiendo popularidad. Google lo está haciendo bien en este momento, pero en unos meses la situación podría ser completamente distinta

  • Google tiene debilidades en marketing, confianza, seguridad y cuota de mercado. Sin embargo, el modelo Gemini Pro 2.5 es excelente

  • Hay quienes opinan que los LLMs pueden estar respaldados por publicidad. Un "adsense" basado en LLM podría funcionar de manera muy sutil e ingeniosa. Se podrían insertar anuncios de forma natural durante la conversación

  • Un usuario de Claude probó Gemini 2.5 y quedó satisfecho gracias al ecosistema integrado de Google. Google vuelve a lograrlo una vez más

  • Además de Gemini 2.5 Pro, Gemini 2.0 Flash es un modelo versátil. Es barato, multimodal y ofrece una velocidad confiable. También ofrece una API en tiempo real

  • Gemini 2.5 Pro es el doble de bueno que Deep Research de OpenAI. El Deep Research de Google es más profundo, más completo y más agudo

  • Gemini 2.5 Pro es muy potente. Sin embargo, sigo usando Claude Sonnet 3.7 por problemas con la interfaz web. Google está aprovechando el motor de búsqueda más grande y YouTube en el desarrollo de IA

  • Mientras Google siga limitándose por la censura, no se pueden usar sus productos. Gemini 2.5 Pro no pudo responder ciertas preguntas. ChatGPT 4o sí proporcionó la respuesta correcta

 
iolothebard 2025-04-22

Como si hubiera recibido clases particulares coreanas para pasar exámenes… solo le va bien en las pruebas.
Pero cuando de verdad hablas con él… resulta bastante torpe.