Gemini 2.5 Deep Think, disponible en la app de Gemini
(blog.google)- Gemini 2.5 Deep Think ya está disponible para suscriptores de Google AI Ultra en la app de Gemini
- Se incorporaron una nueva técnica de pensamiento paralelo (parallel thinking) y resultados de investigación, mejorando un modelo con desempeño de nivel de oro en la IMO para hacerlo aún más útil en el uso real
- Muestra desempeño sobresaliente en diversas tareas complejas como la resolución creativa de problemas, el razonamiento matemático y científico y el desarrollo de algoritmos
- Para mejorar el desempeño, se amplía el tiempo de razonamiento (Thinking Time) para explorar ideas y soluciones simultáneamente, lo que permite generar un pensamiento más profundo y resultados más creativos
- Se aplican evaluaciones y medidas reforzadas para el desarrollo seguro y responsable de la IA, y se anuncia la expansión futura para API y uso empresarial
Lanzamiento de Gemini 2.5 Deep Think
- La funcionalidad Gemini 2.5 Deep Think se ofrece en la app de Gemini para suscriptores de Google AI Ultra
- Versión basada en comentarios de testers y equipos de investigación confiables, y en resultados de investigación recientes
- Basado en un modelo de nivel oro de la reciente Olimpiada Internacional de Matemáticas (IMO), mejoró la velocidad y la practicidad para alinearse con la experiencia real del usuario
- Con este lanzamiento, se amplía el potencial de uso como herramienta de resolución creativa de problemas y se planea perfeccionar la función con la retroalimentación de matemáticos e investigadores
Cómo funciona Deep Think
- Se introdujo una técnica de pensamiento paralelo para que Gemini explore y compare/combina ideas y soluciones de forma simultánea en problemas complejos
- Se incrementa el tiempo de razonamiento (Thinking Time) del modelo para investigar varias hipótesis en profundidad y encontrar soluciones más creativas
- Mediante aprendizaje por refuerzo, el modelo entrena para aprovechar activamente estas rutas de razonamiento ampliadas, fortaleciendo una capacidad de resolución de problemas más intuitiva y profunda
Principales rendimientos y campos de aplicación de Deep Think
- Desarrollo y diseño iterativo: muestra alto rendimiento en trabajos que requieren evolucionar sistemas o diseños complejos de forma gradual
- Descubrimiento científico y matemático: destaca en la investigación creativa de alta dificultad, como el razonamiento matemático y la interpretación de papers científicos
- Desarrollo de algoritmos y código: logra rendimiento de vanguardia en problemas de programación complejos donde hay que estructurar el problema y considerar complejidad temporal y compromisos
- En benchmarks recientes (por ejemplo, LiveCodeBench V6, Humanity’s Last Exam) se ha demostrado rendimiento de punta en código, conocimiento y razonamiento frente a modelos anteriores
Desarrollo responsable y seguridad de Gemini
- Gemini 2.5 Deep Think muestra mejor seguridad de contenido y un tono más objetivo que el modelo Pro anterior en evaluaciones de seguridad
- A medida que crece la complejidad, también se evalúa la peligrosidad; se fortalecen las evaluaciones de Frontier Safety y las acciones de mitigación necesarias
- Los resultados detallados de seguridad se pueden consultar en la model card
Cómo usar Deep Think
- Los suscriptores de Google AI Ultra pueden utilizarlo en la app de Gemini seleccionando 2.5 Pro en el desplegable de modelos y luego activando el interruptor Deep Think en la barra de prompts, con un número fijo de usos diarios
- Se integra de forma automática con herramientas como ejecución de código y Google Search, y permite generar respuestas mucho más largas
- Pronto también se realizarán pruebas adicionales para Gemini API y para empresas
1 comentarios
Opiniones en Hacker News
Probé el nuevo agente Deep Think, pero apenas después de cinco prompts ya llegué al límite diario de uso. Pagar $250 al mes por un servicio así se siente bastante decepcionante. En comparación con o3-pro o Grok 4 Heavy, su competitividad en precio queda muy por debajo. En la comunidad de IA, esta función había llamado la atención como prácticamente lo único que podía justificar el precio de la suscripción Google Ultra. Pero Google ofrece su mejor modelo gratis en AI Studio, mientras que a los suscriptores Ultra que sí pagan les aplica una política así, y la verdad no se entiende. En cuanto al rendimiento, le metí un escenario empresarial de alta complejidad y me dio una solución clara y convincente, alineada con lo que salió en nuestras reuniones internas. Aun así, al final o3 llegó a una conclusión parecida por mucho menos dinero. Eso sí, el reporte de o3 se sentía algo menos ordenado. Habrá que usarlo más para saber bien
Gente, le puse a Gemini Deep Think el prompt “haz una imagen SVG de un pelícano montando una bicicleta” y esto fue lo que salió https://www.svgviewer.dev/s/5R5iTexQ ¡Lo hice antes que Simon Willison!
Si quieren probarlo por su cuenta, pueden usar el LLM CLI de simonw y el plugin llm-consortiumVentaja 1: puedes combinar libremente varios modelos. Puedes armar la combinación que quieras sin importar el laboratorioVentaja 2: usando el plugin llm-model-gateway, puedes conectarlo de una vez por API local a tu app o a tus herramientas de colaboración para programar https://x.com/karpathy/status/1870692546969735361
Incluyó directamente la instalación y comandos de ejemplo, además de un ejemplo de que incluso se puede crear un consortium of consortium.
https://GitHub.com/irthomasthomas/llm-consortium
llm serveNo es exactamente el modelo que ganó la medalla de oro en la IMO (Olimpiada Internacional de Matemáticas) hace unas semanas, pero es una variante muy cercana https://x.com/OfficialLoganK/status/1951262261512659430Todavía no está disponible por API
Este enfoque se parece a Grok 4 Heavy: correr varios agentes de “razonamiento” en paralelo, comparar sus respuestas y volver con la mejor; tarda más o menos 30 minutos. Los resultados son excelentes, pero en realidad lo justo sería compararlo en benchmarks contra Grok 4 Heavy, no contra Grok 4 (agente único y modelo más rápido)
OpenAI subió a $200, Anthropic a $100 y $200, Gemini a $250, y Grok hasta $300. OpenAI es la única que habla de “prácticamente ilimitado”, y en la práctica nunca he llegado al límite en el plan ChatGPT Pro. En Claude Max sí me topé varias veces con el límite. Entonces me pregunto por qué estas empresas no publican claramente cuáles son esos límites
En los últimos meses, usando Gemini, siento que más bien ha ido empeorando. Alucina demasiado seguido y, aunque se lo señales, la IA se pone terca. Cada vez cuesta más confiar en ella
Informan que, si eres suscriptor de Google AI Ultra, desde hoy puedes usar la función Deep Think (con una cantidad fija de prompts) en la app de Gemini. Pero me gustaría saber con más precisión si “conjunto fijo” significa un número fijo de prompts o si se refiere a que solo ciertos tipos de prompt están permitidos
Cuando uso Gemini CLI para planear agendas, aunque le indique claramente varias veces que no haga movimientos inesperados y aunque intervenga, sigue intentando cambiar cosas por su cuenta y termina desordenando el plan