Todo lo anunciado en Google I/O 2024

xguru · 2024-05-15T08:34:19+09:00

Anuncio del modelo Gemini 1.5 Flash Un nuevo modelo multimodal tan potente como Gemini 1.5 Pro, pero optimizado para tareas más acotadas, frecuentes y de baja latencia Más adecuado para generar respuestas rápidas También se mejoraron las capacidades de traducción, razonamiento y programación de Gemini 1.5 La ventana de contexto de Gemini 1.5 Pro (la cantidad de información que puede absorber) se duplicó de 1 millón de tokens a 2 millones de tokens Project Astra: la visión futurista de IA estilo Star Trek de Google Un asistente de IA multimodal que busca ver y entender a través de la cámara del dispositivo, recordar la ubicación de los objetos y realizar tareas en nombre del usuario Se aplicó a la mayoría de las demos más impresionantes de este I/O El objetivo es convertirse en un verdadero agente de IA que no solo conversa, sino que realmente ejecuta tareas por el usuario Veo: generación de video estilo Sora de Google El nuevo modelo de IA generativa de Google para responder a OpenAI Sora, capaz de producir videos en 1080p usando prompts basados en texto, imagen y video Puede crear videos en distintos estilos, como tomas aéreas o timelapse, y permite ajustes con prompts adicionales Ya se está ofreciendo a algunos creadores para producir videos de YouTube, y Google también lo está posicionando para producción cinematográfica Integración de Gemini con Workspace Gemini 1.5 Pro, el modelo de lenguaje de próxima generación, se integra en la barra lateral de Docs, Sheets, Slides, Drive y Gmail Estará disponible el próximo mes para suscriptores de pago y funcionará como asistente general dentro de Workspace Puede extraer información de todo el contenido en Drive Puede realizar tareas como redactar un correo integrando información del documento que se está viendo, o avisar que se responda más tarde a un correo que se está leyendo Expansión de funciones de Google Lens Ahora permite buscar no solo con imágenes, sino también con video Se añade una función en la que, al grabar un video y hacer una pregunta, la IA de Google busca respuestas relacionadas en la web Uso de Google Photos por parte de Gemini A través de la función "Ask Photos", prevista para este verano, analizará la biblioteca de Google Photos del usuario para responder preguntas Va más allá de encontrar fotos de perros o gatos: como mostró el CEO Sundar Pichai, también puede responder preguntas más complejas, como consultar el número de matrícula de su vehículo Gems: Gemini añade creación de chatbots personalizados Al igual que los GPT de OpenAI, Gems permitirá que los usuarios den instrucciones a Gemini para personalizar su forma de responder y su área de especialización Por ejemplo, pronto será posible crear un coach de running positivo y persistente que ofrezca motivación diaria y planes para correr (en el caso de los suscriptores de Gemini Advanced) Mejora en la capacidad conversacional de Gemini La nueva función Gemini Live busca hacer más natural el chat por voz con Gemini La voz del chatbot tendrá más personalidad, y el usuario podrá interrumpirlo o pedirle que reciba información en tiempo real mediante la cámara del smartphone Gemini se integra con Google Calendar, Tasks y Keep para actualizar u obtener información, aprovechando funciones multimodales como agregar a un calendario personal los detalles de un volante Circle to Search ahora ayuda a resolver problemas de matemáticas Ahora, al encerrar en un círculo un problema de matemáticas en un teléfono o tablet Android, se podrá recibir ayuda para resolverlo La IA de Google no resolverá directamente el problema para no facilitar que los estudiantes hagan trampa con la tarea, pero sí lo desglosará paso a paso para que sea más fácil completarlo Renovación con IA de la búsqueda de Google Esta semana se lanzará en todo Estados Unidos "AI Overviews" (antes llamado "Search Generative Experience") Ahora un modelo Gemini "especializado" diseñará la página de resultados y la llenará con respuestas resumidas de la web (similar a lo que se ve en herramientas de búsqueda con IA como Perplexity o Arc Search) Detección de estafas impulsada por IA en Android Google afirma que, usando la IA Gemini Nano en el dispositivo, los teléfonos Android podrán detectar señales de riesgo como patrones comunes de conversación de los estafadores y mostrar alertas en tiempo real para ayudar a evitar llamadas fraudulentas Se darán más detalles sobre esta función más adelante este año Más inteligencia de IA en dispositivos Android Google dice que pronto Gemini permitirá hacer preguntas sobre videos que el usuario tenga en pantalla, y responderá basándose en los subtítulos automáticos En el caso de los usuarios de Gemini Advanced de pago, también podrá absorber PDFs para proporcionar información Estas actualizaciones multimodales y otras para Gemini on Android llegarán en los próximos meses Chrome de Google suma un asistente con IA Google anunció que añadirá Gemini Nano, una versión ligera, a Chrome en escritorio El asistente integrado usará IA en el dispositivo para ayudar directamente dentro de Google Chrome con la generación de texto para publicaciones en redes sociales, reseñas de productos y más Actualización del watermarking con IA de SynthID Google anunció que ampliará las capacidades de SynthID Insertará marcas de agua en contenido generado con el nuevo generador de video Veo, y ahora también podrá detectar videos generados por IA

(theverge.com)

19 puntos por xguru 2024-05-15 | 6 comentarios | Compartir por WhatsApp

Anuncio del modelo Gemini 1.5 Flash

Un nuevo modelo multimodal tan potente como Gemini 1.5 Pro, pero optimizado para tareas más acotadas, frecuentes y de baja latencia
Más adecuado para generar respuestas rápidas
También se mejoraron las capacidades de traducción, razonamiento y programación de Gemini 1.5
La ventana de contexto de Gemini 1.5 Pro (la cantidad de información que puede absorber) se duplicó de 1 millón de tokens a 2 millones de tokens

Project Astra: la visión futurista de IA estilo Star Trek de Google

Un asistente de IA multimodal que busca ver y entender a través de la cámara del dispositivo, recordar la ubicación de los objetos y realizar tareas en nombre del usuario
Se aplicó a la mayoría de las demos más impresionantes de este I/O
El objetivo es convertirse en un verdadero agente de IA que no solo conversa, sino que realmente ejecuta tareas por el usuario

Veo: generación de video estilo Sora de Google

El nuevo modelo de IA generativa de Google para responder a OpenAI Sora, capaz de producir videos en 1080p usando prompts basados en texto, imagen y video
Puede crear videos en distintos estilos, como tomas aéreas o timelapse, y permite ajustes con prompts adicionales
Ya se está ofreciendo a algunos creadores para producir videos de YouTube, y Google también lo está posicionando para producción cinematográfica

Integración de Gemini con Workspace

Gemini 1.5 Pro, el modelo de lenguaje de próxima generación, se integra en la barra lateral de Docs, Sheets, Slides, Drive y Gmail
Estará disponible el próximo mes para suscriptores de pago y funcionará como asistente general dentro de Workspace
Puede extraer información de todo el contenido en Drive
Puede realizar tareas como redactar un correo integrando información del documento que se está viendo, o avisar que se responda más tarde a un correo que se está leyendo

Expansión de funciones de Google Lens

Ahora permite buscar no solo con imágenes, sino también con video
Se añade una función en la que, al grabar un video y hacer una pregunta, la IA de Google busca respuestas relacionadas en la web

Uso de Google Photos por parte de Gemini

A través de la función "Ask Photos", prevista para este verano, analizará la biblioteca de Google Photos del usuario para responder preguntas
Va más allá de encontrar fotos de perros o gatos: como mostró el CEO Sundar Pichai, también puede responder preguntas más complejas, como consultar el número de matrícula de su vehículo

Gems: Gemini añade creación de chatbots personalizados

Al igual que los GPT de OpenAI, Gems permitirá que los usuarios den instrucciones a Gemini para personalizar su forma de responder y su área de especialización
Por ejemplo, pronto será posible crear un coach de running positivo y persistente que ofrezca motivación diaria y planes para correr (en el caso de los suscriptores de Gemini Advanced)

Mejora en la capacidad conversacional de Gemini

La nueva función Gemini Live busca hacer más natural el chat por voz con Gemini
La voz del chatbot tendrá más personalidad, y el usuario podrá interrumpirlo o pedirle que reciba información en tiempo real mediante la cámara del smartphone
Gemini se integra con Google Calendar, Tasks y Keep para actualizar u obtener información, aprovechando funciones multimodales como agregar a un calendario personal los detalles de un volante

Circle to Search ahora ayuda a resolver problemas de matemáticas

Ahora, al encerrar en un círculo un problema de matemáticas en un teléfono o tablet Android, se podrá recibir ayuda para resolverlo
La IA de Google no resolverá directamente el problema para no facilitar que los estudiantes hagan trampa con la tarea, pero sí lo desglosará paso a paso para que sea más fácil completarlo

Renovación con IA de la búsqueda de Google

Esta semana se lanzará en todo Estados Unidos "AI Overviews" (antes llamado "Search Generative Experience")
Ahora un modelo Gemini "especializado" diseñará la página de resultados y la llenará con respuestas resumidas de la web (similar a lo que se ve en herramientas de búsqueda con IA como Perplexity o Arc Search)

Detección de estafas impulsada por IA en Android

Google afirma que, usando la IA Gemini Nano en el dispositivo, los teléfonos Android podrán detectar señales de riesgo como patrones comunes de conversación de los estafadores y mostrar alertas en tiempo real para ayudar a evitar llamadas fraudulentas
Se darán más detalles sobre esta función más adelante este año

Más inteligencia de IA en dispositivos Android

Google dice que pronto Gemini permitirá hacer preguntas sobre videos que el usuario tenga en pantalla, y responderá basándose en los subtítulos automáticos
En el caso de los usuarios de Gemini Advanced de pago, también podrá absorber PDFs para proporcionar información
Estas actualizaciones multimodales y otras para Gemini on Android llegarán en los próximos meses

Chrome de Google suma un asistente con IA

Google anunció que añadirá Gemini Nano, una versión ligera, a Chrome en escritorio
El asistente integrado usará IA en el dispositivo para ayudar directamente dentro de Google Chrome con la generación de texto para publicaciones en redes sociales, reseñas de productos y más

Actualización del watermarking con IA de SynthID

Google anunció que ampliará las capacidades de SynthID
Insertará marcas de agua en contenido generado con el nuevo generador de video Veo, y ahora también podrá detectar videos generados por IA

6 comentarios

pinks 2024-05-16

Es suficiente con que el chatbot sea gratuito, y como no uso nada relacionado con imágenes, video o audio, me da gusto que se integre en los productos existentes.

corelyai 2024-05-15

Los avances de la IA de Project Astra de Google y la generación de video

El modelo Gemini de Google ya es ampliamente utilizado por más de 1.5 millones de desarrolladores para depurar código, obtener insights y crear aplicaciones de IA. Project Astra está introduciendo un agente de IA capaz de procesar de forma eficiente información de entrada de video y voz, junto con un nuevo modelo avanzado de video generativo llamado Vo. Vo puede producir videos de alta calidad en 1080p a partir de prompts de texto, imagen y video, ofreciendo un nivel de control creativo sin precedentes. Esta tecnología, desarrollada por DeepMind de Google, busca hacer realidad ideas que antes eran imposibles.

La TPU de sexta generación de Google y una renovación innovadora de la IA

Google planea lanzar a finales de 2024 Trillium, su TPU de sexta generación, que estará disponible para clientes de la nube y ofrece un rendimiento de cómputo 4.7 veces mayor por chip. Además, está incorporando nuevas CPU y GPU, incluido el procesador Axion y la GPU Blackwell de Envidia, para soportar diversas cargas de trabajo; esta última estará disponible a inicios de 2025. Google también lanzará Gemini, una experiencia de búsqueda completamente renovada impulsada por IA y con mayores niveles de satisfacción de los usuarios, comenzando en Estados Unidos. Este nuevo modelo de búsqueda permite consultas más complejas y búsquedas con fotos, además de ofrecer resultados estructurados para una experiencia de usuario mejorada.

Nuevas funciones de IA de Google y próximas innovaciones

Google presentará nuevas páginas de resultados de búsqueda organizadas por IA, comenzando con comida y recetas y expandiéndose luego a otras categorías. La IA podrá usar factores contextuales como la temporada para ofrecer una visión general de la causa de un problema y los pasos para resolverlo. Gemini, la IA de Google, pronto ofrecerá una experiencia en vivo con expertos personales personalizados llamados "gems", y se integrará con Project Astra para funciones de comprensión de video.

Presentamos Gemini, el nuevo asistente de IA para Android

Gemini es un nuevo asistente de IA para Android que ofrece experiencias de IA en el dispositivo mientras prioriza la privacidad de los datos. Está diseñado para brindar sugerencias contextuales, como ayudar con tareas escolares y ofrecer instrucciones paso a paso para problemas complicados. Además, Gemini puede ayudar con tareas como encontrar imágenes y responder preguntas específicas, integrándose de forma fluida en el flujo de trabajo del usuario.

El impacto de Gemini de Google en el uso del smartphone

Gemini de Google ofrece funciones de IA a los usuarios de smartphones, permitiendo acceder fácilmente a la información contenida en documentos y obtener respuestas claras a preguntas específicas. El modelo fundacional en el dispositivo mejora la experiencia en el smartphone al ofrecer respuestas más rápidas mientras prioriza la privacidad del usuario. El próximo modelo Gemini Nano ampliará aún más estas posibilidades al permitir que los teléfonos entiendan el mundo a través de texto, imágenes, sonido y lenguaje hablado.

Corely, ¡el contenido clave dentro de YouTube en solo 10 segundos! - https://corely.ai/content/google-io-2024-everything-revealed

xguru 2024-05-15

Gemini Flash
Google DeepMind Veo

savvykang 2024-05-15

https://killedbygoogle.com
Me pregunto cuándo entrará Gemini a esta lista. Si no da dinero, Google suele cerrarlo sin dudar, así que no me genera mucho apego.