Gemini: el modelo de IA más capaz de Google hasta ahora
(blog.google)Título del resumen: Presentación de 'Gemini', el nuevo modelo de IA de Google y DeepMind
- Sundar Pichai, CEO de Google y Alphabet, cree que la IA traerá un cambio aún mayor que la transición hacia lo móvil o la web.
- Google, como empresa centrada en la IA, ha recorrido un camino de 8 años, y con la IA generativa ahora permite que los usuarios colaboren y creen de nuevas maneras.
- Google busca una investigación ambiciosa y la capacidad de generar grandes beneficios para la sociedad, al mismo tiempo que colabora con gobiernos y expertos para abordar los riesgos de la IA.
Presentación de Gemini
- Demis Hassabis, CEO y cofundador de Google DeepMind, cree que la IA traerá beneficios extraordinarios para la humanidad.
- Gemini es el modelo más capaz creado mediante una colaboración a gran escala entre equipos de Google, y puede entender y operar con distintos tipos de información, como texto, código, audio, imágenes y video.
- Gemini 1.0 está optimizado en tres tamaños y puede funcionar de forma eficiente desde centros de datos hasta dispositivos móviles.
Rendimiento de vanguardia
- Los modelos Gemini muestran un rendimiento que supera los resultados de vanguardia actuales en diversas tareas.
- Gemini Ultra obtuvo una puntuación de 90.0% en MMLU, mostrando un desempeño superior al de expertos humanos.
- También supera a modelos anteriores en benchmarks de imágenes, mostrando señales tempranas de la capacidad de razonamiento complejo de Gemini.
Capacidades de próxima generación
- Gemini es multimodal por naturaleza, y su capacidad de comprensión y razonamiento en distintas modalidades es muy superior a la de modelos anteriores.
- Gemini 1.0 destaca especialmente en extraer conocimiento de documentos complejos y en explicar razonamientos sobre temas complejos como matemáticas y física.
- Gemini puede comprender y generar código de alta calidad, y es uno de los modelos fundacionales líderes para trabajar entre lenguajes de programación y razonar sobre información compleja.
Más confiable, escalable y eficiente
- Gemini 1.0 fue entrenado a gran escala usando la infraestructura optimizada para IA de Google y TPU v4 y v5e.
- Gemini se ejecuta más rápido que modelos anteriores y es una pieza clave dentro de los aceleradores de IA personalizados de Google.
- Google anunció Cloud TPU v5p para acelerar el desarrollo de Gemini y permitir que los desarrolladores entrenen modelos de IA a gran escala con mayor rapidez.
Construido con la responsabilidad y la seguridad como base
- Google agregó nuevas medidas de protección teniendo en cuenta las capacidades multimodales de Gemini, y consideró los riesgos potenciales en cada etapa del desarrollo.
- Gemini recibió la evaluación de seguridad más completa entre los modelos de IA de Google, y la empresa colaboró con expertos externos para identificar puntos ciegos en sus métodos de evaluación interna.
- Gemini usa clasificadores de seguridad y filtros robustos para identificar y clasificar contenidos como violencia o estereotipos negativos.
Llevar Gemini al mundo
- Gemini 1.0 ya se está incorporando en productos y plataformas de Google, y Bard usa una versión afinada de Gemini Pro para ofrecer un razonamiento y una comprensión más avanzados.
- Los desarrolladores y clientes empresariales pueden acceder a Gemini Pro a través de Google AI Studio o Google Cloud Vertex AI.
- Gemini Ultra estará disponible para clientes, desarrolladores, socios y expertos seleccionados para recibir retroalimentación en una etapa inicial, una vez que complete las verificaciones de confiabilidad y seguridad.
Opinión de GN⁺
Lo más importante de este artículo es que Google y DeepMind desarrollaron un nuevo modelo de IA llamado Gemini, abriendo una nueva era para la tecnología de IA. Gemini cuenta con capacidades multimodales, por lo que puede entender y procesar distintas formas de información como texto, imágenes y audio, lo que ofrece a desarrolladores y empresas la oportunidad de crear productos y servicios aún más innovadores. Este artículo resulta interesante porque ofrece ejemplos concretos de cómo la tecnología de IA puede transformar la vida humana y muestra también el enfoque de Google sobre cómo este avance tecnológico debe desarrollarse de manera responsable.
1 comentarios
También es una publicación duplicada en HN, así que pueden ver la que publiqué por separado en GeekNews: Google presenta el modelo de IA Gemini.