Google presenta su modelo de IA Gemini
(blog.google)- Gemini, el primer modelo de IA que supera a expertos humanos al obtener 90% en MMLU
- Como modelo de IA multimodal, también supera a GPT-4V y Whisper en benchmarks multimodales de imagen/video/audio
- Optimizado en tres modelos según el tamaño
- Ultra: el modelo más grande y más capaz para tareas complejas
- Pro: escalable para una amplia variedad de tareas
- Nano: el modelo más eficiente para tareas on-device
- Comprende, explica y genera código de alta calidad en los lenguajes de programación más usados del mundo, como Python, Java, C++, Go y otros
- También se lanzó AlphaCode 2 para programación competitiva usando Gemini
- Gemini 1.0 fue entrenado a gran escala sobre infraestructura optimizada para IA usando TPU v4 y v5e
- Más estable, escalable y eficiente
- Enfocado en la responsabilidad y la seguridad
- Se realizaron evaluaciones integrales de seguridad
- Gemini Pro ya está disponible directamente en Google Bard
- Disponible en 170 países en inglés, con soporte para otras modalidades y nuevos idiomas próximamente
- Gemini Nano llegará al Pixel 8 Pro
- En los próximos meses, Gemini también se aplicará a Search, Ads, Chrome y Duet AI
- Desde el 13 de diciembre, desarrolladores y clientes empresariales podrán usar la API de Gemini a través de Google AI Studio y Google Cloud Vertex AI (solo Pro)
- Gemini Ultra también estará disponible pronto
- Actualmente está completando amplias verificaciones de confianza y seguridad, incluida validación de red teaming por parte de organizaciones externas confiables, y antes de su lanzamiento amplio se sigue refinando mediante ajuste fino y aprendizaje por refuerzo con retroalimentación humana (RLHF)
- Google planea ofrecer Gemini Ultra a algunos clientes, desarrolladores, socios y expertos en seguridad y responsabilidad para pruebas iniciales y retroalimentación, y luego liberarlo para desarrolladores y clientes empresariales a inicios del próximo año
- A inicios del próximo año también planea lanzar Bard Advanced, un nuevo entorno de IA de última generación para acceder a sus mejores modelos y capacidades, comenzando con Gemini Ultra
7 comentarios
Vi el video y pensé: "¿Bard era tan malo y ya lo superó por completo?"
Dicen que era un video montado. Entonces, ¿no sería un fraude?..
https://www.tomshardware.com/news/google-gemini-ai-video-staged
Recuerdo ese tuit: "Algunos piensan que Google se está quedando atrás en IA, pero ellos están en otro nivel".
Hoy las acciones de Google subieron bastante.
Parece que nano se puede usar en el Pixel 8 Pro.... aunque
https://blog.google/products/pixel/pixel-feature-drop-december-2023/
Dentro del alcance de aplicación, solo están Voice Recorder, que no admite coreano, y gboard, para el que hay que hacer un opt-in por separado en la beta.
Entonces, ¿no será por eso que no venden el Pixel en Corea? ..jaja
Yo todavía tengo ese Pixel 1 ;_;
Por fin salió. Me da curiosidad ver cómo se verá cuando se aplique de forma general a los productos de Google.
El video más interesante es Hands-on with Gemini: Interacting with multimodal AI.
Como dura unos 6 minutos, de verdad vale la pena verlo. Si la IA multimodal sigue avanzando, parece que el Jarvis que veíamos en las películas podrá hacerse realidad.
GPT-4 Vision también fue impresionante, pero de verdad parece que se acerca la era de Jarvis... +_+