2 puntos por GN⁺ 2025-02-07 | 1 comentarios | Compartir por WhatsApp
  • Disponibilidad general de Gemini 2.0

    • La serie de modelos Flash, presentada por primera vez en I/O 2024, es un conjunto de modelos potentes optimizados para tareas de alto volumen y alta frecuencia, y ha ganado popularidad entre los desarrolladores
    • 2.0 Flash ahora está disponible de forma general para más usuarios, con un rendimiento mejorado en benchmarks clave
    • También se añadirán próximamente funciones de generación de imágenes y conversión de voz
  • Modelo experimental 2.0 Pro: el mejor rendimiento para código y manejo de prompts complejos

    • Gemini 2.0 Pro es el modelo más destacado en rendimiento para código y en la capacidad de manejar prompts complejos, con mejoras en la comprensión del conocimiento del mundo y en la capacidad de razonamiento
    • Ofrece la ventana de contexto más grande, de 2 millones de tokens, para analizar y comprender grandes volúmenes de información de forma integral
    • Está disponible como modelo experimental para desarrolladores en Google AI Studio y Vertex AI, y también para usuarios de Gemini Advanced
  • 2.0 Flash-Lite: el modelo más rentable

    • Basado en los comentarios positivos sobre el precio y la velocidad de 1.5 Flash, 2.0 Flash-Lite ofrece mejor calidad con la misma velocidad y costo
    • Supera a 1.5 Flash en la mayoría de los benchmarks, y admite una ventana de contexto de 1 millón de tokens y entrada multimodal
    • Está disponible en vista previa pública en Google AI Studio y Vertex AI
  • Trabajo de responsabilidad y seguridad

    • A medida que la familia de modelos Gemini se vuelve más potente, se sigue invirtiendo en medidas sólidas para un uso seguro y protegido
    • Se utilizan nuevas técnicas de aprendizaje por refuerzo para que Gemini critique sus propias respuestas y así ofrecer retroalimentación más precisa y orientada a objetivos
    • Se están usando red teams automatizados para evaluar el riesgo de ataques de ciberseguridad, como la inyección indirecta de prompts

1 comentarios

 
GN⁺ 2025-02-07
Comentarios de Hacker News
  • Hay confusión por la falta de información clara sobre los modelos Gemini. También falta información sobre Gemini Advanced incluido en la suscripción de Google Workspace.

    • Solo aparece el nombre "Gemini Advanced" y no hay opción para seleccionar el modelo.
    • Google AI Studio está enfocado en crear apps envoltorio para LLM, pero no es adecuado para usuarios que simplemente quieren respuestas a sus preguntas.
    • La información obtenida por búsqueda es incierta, aunque hay datos que indican que Gemini Advanced está incluido en la suscripción de Workspace.
    • En la página gemini.google.com no hay ninguna información sobre el modelo, y la única opción de configuración es cambiar el modo oscuro.
  • Se puede acceder a la API de Gemini mediante Google AI Studio y Vertex AI.

    • Existen varios modelos, como Gemini 2.0, 2.0 Pro, 2.0 Pro Experimental, Gemini 2.0 Flash y Gemini 2.0 Flash Lite.
    • Los benchmarks solo se comparan con modelos propios.
  • Hay restricciones sobre temas políticos durante el chat de voz.

    • Cuando un usuario hablaba sobre planes de cocina, el sistema lo interpretó erróneamente como un tema político y limitó la conversación.
  • Los nombres de los modelos de IA son confusos.

    • Convenciones como Flash y Flash-Lite son difíciles de entender.
    • Existe la opinión de que la calidad de los modelos de Google es inferior a la de otros proveedores principales.
  • Tiene una excelente relación precio-rendimiento para el parsing de PDF.

    • Gemini Flash-Lite es rentable, y hay expectativa por ver benchmarks de la versión Lite.
  • En AI Studio se pueden probar modelos nuevos.

    • Con el modo en vivo es posible conversar en tiempo real, y puede ver el mundo a través de la cámara.
  • El precio de Gemini 2.0 Flash-Lite es más bajo que el de GPT-4o mini de OpenAI.

    • Los precios para entrada de texto/imagen y entrada de audio son relativamente bajos.
  • El modelo Gemini Pro 2.0 resulta impresionante.

    • Es adecuado para tareas cognitivas generales como investigación, análisis y redacción.
    • Se recomienda usarlo a través de AI Studio, ya que la app de Gemini tiene muchos filtros y puede limitar respuestas sobre temas polémicos.
  • Gemini 2.0 Flash destaca en tareas multimodales.

    • Es adecuado para trabajo con documentos y detección de objetos, con muy buena relación precio-rendimiento.
    • Los modelos Qwen2.5 VL 72B y 7B muestran mejor desempeño en tareas con imágenes de documentos.
  • El modelo Gemini 2.0 Pro Experimental está llamando la atención.

    • Destaca en el manejo de prompts complejos y en rendimiento de programación, y ofrece una ventana de contexto de 2 millones de tokens.