Gemini: el modelo de IA más capaz de Google hasta ahora

(blog.google)

1 puntos por GN⁺ 2023-12-07 | 1 comentarios | Compartir por WhatsApp

Título del resumen: Presentación de 'Gemini', el nuevo modelo de IA de Google y DeepMind

Sundar Pichai, CEO de Google y Alphabet, cree que la IA traerá un cambio aún mayor que la transición hacia lo móvil o la web.
Google, como empresa centrada en la IA, ha recorrido un camino de 8 años, y con la IA generativa ahora permite que los usuarios colaboren y creen de nuevas maneras.
Google busca una investigación ambiciosa y la capacidad de generar grandes beneficios para la sociedad, al mismo tiempo que colabora con gobiernos y expertos para abordar los riesgos de la IA.

Presentación de Gemini

Demis Hassabis, CEO y cofundador de Google DeepMind, cree que la IA traerá beneficios extraordinarios para la humanidad.
Gemini es el modelo más capaz creado mediante una colaboración a gran escala entre equipos de Google, y puede entender y operar con distintos tipos de información, como texto, código, audio, imágenes y video.
Gemini 1.0 está optimizado en tres tamaños y puede funcionar de forma eficiente desde centros de datos hasta dispositivos móviles.

Rendimiento de vanguardia

Los modelos Gemini muestran un rendimiento que supera los resultados de vanguardia actuales en diversas tareas.
Gemini Ultra obtuvo una puntuación de 90.0% en MMLU, mostrando un desempeño superior al de expertos humanos.
También supera a modelos anteriores en benchmarks de imágenes, mostrando señales tempranas de la capacidad de razonamiento complejo de Gemini.

Capacidades de próxima generación

Gemini es multimodal por naturaleza, y su capacidad de comprensión y razonamiento en distintas modalidades es muy superior a la de modelos anteriores.
Gemini 1.0 destaca especialmente en extraer conocimiento de documentos complejos y en explicar razonamientos sobre temas complejos como matemáticas y física.
Gemini puede comprender y generar código de alta calidad, y es uno de los modelos fundacionales líderes para trabajar entre lenguajes de programación y razonar sobre información compleja.

Más confiable, escalable y eficiente

Gemini 1.0 fue entrenado a gran escala usando la infraestructura optimizada para IA de Google y TPU v4 y v5e.
Gemini se ejecuta más rápido que modelos anteriores y es una pieza clave dentro de los aceleradores de IA personalizados de Google.
Google anunció Cloud TPU v5p para acelerar el desarrollo de Gemini y permitir que los desarrolladores entrenen modelos de IA a gran escala con mayor rapidez.

Construido con la responsabilidad y la seguridad como base

Google agregó nuevas medidas de protección teniendo en cuenta las capacidades multimodales de Gemini, y consideró los riesgos potenciales en cada etapa del desarrollo.
Gemini recibió la evaluación de seguridad más completa entre los modelos de IA de Google, y la empresa colaboró con expertos externos para identificar puntos ciegos en sus métodos de evaluación interna.
Gemini usa clasificadores de seguridad y filtros robustos para identificar y clasificar contenidos como violencia o estereotipos negativos.

Llevar Gemini al mundo

Gemini 1.0 ya se está incorporando en productos y plataformas de Google, y Bard usa una versión afinada de Gemini Pro para ofrecer un razonamiento y una comprensión más avanzados.
Los desarrolladores y clientes empresariales pueden acceder a Gemini Pro a través de Google AI Studio o Google Cloud Vertex AI.
Gemini Ultra estará disponible para clientes, desarrolladores, socios y expertos seleccionados para recibir retroalimentación en una etapa inicial, una vez que complete las verificaciones de confiabilidad y seguridad.

Opinión de GN⁺

Lo más importante de este artículo es que Google y DeepMind desarrollaron un nuevo modelo de IA llamado Gemini, abriendo una nueva era para la tecnología de IA. Gemini cuenta con capacidades multimodales, por lo que puede entender y procesar distintas formas de información como texto, imágenes y audio, lo que ofrece a desarrolladores y empresas la oportunidad de crear productos y servicios aún más innovadores. Este artículo resulta interesante porque ofrece ejemplos concretos de cómo la tecnología de IA puede transformar la vida humana y muestra también el enfoque de Google sobre cómo este avance tecnológico debe desarrollarse de manera responsable.

1 comentarios

GN⁺ 2023-12-07

También es una publicación duplicada en HN, así que pueden ver la que publiqué por separado en GeekNews: Google presenta el modelo de IA Gemini.