Anuncio del modelo Gemini 1.5 Flash
- Un nuevo modelo multimodal tan potente como Gemini 1.5 Pro, pero optimizado para tareas más acotadas, frecuentes y de baja latencia
- Más adecuado para generar respuestas rápidas
- También se mejoraron las capacidades de traducción, razonamiento y programación de Gemini 1.5
- La ventana de contexto de Gemini 1.5 Pro (la cantidad de información que puede absorber) se duplicó de 1 millón de tokens a 2 millones de tokens
Project Astra: la visión futurista de IA estilo Star Trek de Google
- Un asistente de IA multimodal que busca ver y entender a través de la cámara del dispositivo, recordar la ubicación de los objetos y realizar tareas en nombre del usuario
- Se aplicó a la mayoría de las demos más impresionantes de este I/O
- El objetivo es convertirse en un verdadero agente de IA que no solo conversa, sino que realmente ejecuta tareas por el usuario
Veo: generación de video estilo Sora de Google
- El nuevo modelo de IA generativa de Google para responder a OpenAI Sora, capaz de producir videos en 1080p usando prompts basados en texto, imagen y video
- Puede crear videos en distintos estilos, como tomas aéreas o timelapse, y permite ajustes con prompts adicionales
- Ya se está ofreciendo a algunos creadores para producir videos de YouTube, y Google también lo está posicionando para producción cinematográfica
Integración de Gemini con Workspace
- Gemini 1.5 Pro, el modelo de lenguaje de próxima generación, se integra en la barra lateral de Docs, Sheets, Slides, Drive y Gmail
- Estará disponible el próximo mes para suscriptores de pago y funcionará como asistente general dentro de Workspace
- Puede extraer información de todo el contenido en Drive
- Puede realizar tareas como redactar un correo integrando información del documento que se está viendo, o avisar que se responda más tarde a un correo que se está leyendo
Expansión de funciones de Google Lens
- Ahora permite buscar no solo con imágenes, sino también con video
- Se añade una función en la que, al grabar un video y hacer una pregunta, la IA de Google busca respuestas relacionadas en la web
Uso de Google Photos por parte de Gemini
- A través de la función "Ask Photos", prevista para este verano, analizará la biblioteca de Google Photos del usuario para responder preguntas
- Va más allá de encontrar fotos de perros o gatos: como mostró el CEO Sundar Pichai, también puede responder preguntas más complejas, como consultar el número de matrícula de su vehículo
Gems: Gemini añade creación de chatbots personalizados
- Al igual que los GPT de OpenAI, Gems permitirá que los usuarios den instrucciones a Gemini para personalizar su forma de responder y su área de especialización
- Por ejemplo, pronto será posible crear un coach de running positivo y persistente que ofrezca motivación diaria y planes para correr (en el caso de los suscriptores de Gemini Advanced)
Mejora en la capacidad conversacional de Gemini
- La nueva función Gemini Live busca hacer más natural el chat por voz con Gemini
- La voz del chatbot tendrá más personalidad, y el usuario podrá interrumpirlo o pedirle que reciba información en tiempo real mediante la cámara del smartphone
- Gemini se integra con Google Calendar, Tasks y Keep para actualizar u obtener información, aprovechando funciones multimodales como agregar a un calendario personal los detalles de un volante
Circle to Search ahora ayuda a resolver problemas de matemáticas
- Ahora, al encerrar en un círculo un problema de matemáticas en un teléfono o tablet Android, se podrá recibir ayuda para resolverlo
- La IA de Google no resolverá directamente el problema para no facilitar que los estudiantes hagan trampa con la tarea, pero sí lo desglosará paso a paso para que sea más fácil completarlo
Renovación con IA de la búsqueda de Google
- Esta semana se lanzará en todo Estados Unidos "AI Overviews" (antes llamado "Search Generative Experience")
- Ahora un modelo Gemini "especializado" diseñará la página de resultados y la llenará con respuestas resumidas de la web (similar a lo que se ve en herramientas de búsqueda con IA como Perplexity o Arc Search)
Detección de estafas impulsada por IA en Android
- Google afirma que, usando la IA Gemini Nano en el dispositivo, los teléfonos Android podrán detectar señales de riesgo como patrones comunes de conversación de los estafadores y mostrar alertas en tiempo real para ayudar a evitar llamadas fraudulentas
- Se darán más detalles sobre esta función más adelante este año
Más inteligencia de IA en dispositivos Android
- Google dice que pronto Gemini permitirá hacer preguntas sobre videos que el usuario tenga en pantalla, y responderá basándose en los subtítulos automáticos
- En el caso de los usuarios de Gemini Advanced de pago, también podrá absorber PDFs para proporcionar información
- Estas actualizaciones multimodales y otras para Gemini on Android llegarán en los próximos meses
Chrome de Google suma un asistente con IA
- Google anunció que añadirá Gemini Nano, una versión ligera, a Chrome en escritorio
- El asistente integrado usará IA en el dispositivo para ayudar directamente dentro de Google Chrome con la generación de texto para publicaciones en redes sociales, reseñas de productos y más
Actualización del watermarking con IA de SynthID
- Google anunció que ampliará las capacidades de SynthID
- Insertará marcas de agua en contenido generado con el nuevo generador de video Veo, y ahora también podrá detectar videos generados por IA
6 comentarios
Es suficiente con que el chatbot sea gratuito, y como no uso nada relacionado con imágenes, video o audio, me da gusto que se integre en los productos existentes.
Los avances de la IA de Project Astra de Google y la generación de video
El modelo Gemini de Google ya es ampliamente utilizado por más de 1.5 millones de desarrolladores para depurar código, obtener insights y crear aplicaciones de IA. Project Astra está introduciendo un agente de IA capaz de procesar de forma eficiente información de entrada de video y voz, junto con un nuevo modelo avanzado de video generativo llamado Vo. Vo puede producir videos de alta calidad en 1080p a partir de prompts de texto, imagen y video, ofreciendo un nivel de control creativo sin precedentes. Esta tecnología, desarrollada por DeepMind de Google, busca hacer realidad ideas que antes eran imposibles.
La TPU de sexta generación de Google y una renovación innovadora de la IA
Google planea lanzar a finales de 2024 Trillium, su TPU de sexta generación, que estará disponible para clientes de la nube y ofrece un rendimiento de cómputo 4.7 veces mayor por chip. Además, está incorporando nuevas CPU y GPU, incluido el procesador Axion y la GPU Blackwell de Envidia, para soportar diversas cargas de trabajo; esta última estará disponible a inicios de 2025. Google también lanzará Gemini, una experiencia de búsqueda completamente renovada impulsada por IA y con mayores niveles de satisfacción de los usuarios, comenzando en Estados Unidos. Este nuevo modelo de búsqueda permite consultas más complejas y búsquedas con fotos, además de ofrecer resultados estructurados para una experiencia de usuario mejorada.
Nuevas funciones de IA de Google y próximas innovaciones
Google presentará nuevas páginas de resultados de búsqueda organizadas por IA, comenzando con comida y recetas y expandiéndose luego a otras categorías. La IA podrá usar factores contextuales como la temporada para ofrecer una visión general de la causa de un problema y los pasos para resolverlo. Gemini, la IA de Google, pronto ofrecerá una experiencia en vivo con expertos personales personalizados llamados "gems", y se integrará con Project Astra para funciones de comprensión de video.
Presentamos Gemini, el nuevo asistente de IA para Android
Gemini es un nuevo asistente de IA para Android que ofrece experiencias de IA en el dispositivo mientras prioriza la privacidad de los datos. Está diseñado para brindar sugerencias contextuales, como ayudar con tareas escolares y ofrecer instrucciones paso a paso para problemas complicados. Además, Gemini puede ayudar con tareas como encontrar imágenes y responder preguntas específicas, integrándose de forma fluida en el flujo de trabajo del usuario.
El impacto de Gemini de Google en el uso del smartphone
Gemini de Google ofrece funciones de IA a los usuarios de smartphones, permitiendo acceder fácilmente a la información contenida en documentos y obtener respuestas claras a preguntas específicas. El modelo fundacional en el dispositivo mejora la experiencia en el smartphone al ofrecer respuestas más rápidas mientras prioriza la privacidad del usuario. El próximo modelo Gemini Nano ampliará aún más estas posibilidades al permitir que los teléfonos entiendan el mundo a través de texto, imágenes, sonido y lenguaje hablado.
Corely, ¡el contenido clave dentro de YouTube en solo 10 segundos! - https://corely.ai/content/google-io-2024-everything-revealed
Gemini Flash
Google DeepMind Veo
https://killedbygoogle.com
Me pregunto cuándo entrará Gemini a esta lista. Si no da dinero, Google suele cerrarlo sin dudar, así que no me genera mucho apego.
Si no hubiera sido por el anuncio de GPT-4o, habría estado bastante bien, pero al final se sintió bastante desinflado.
Desde la perspectiva de Google, seguro que OpenAI les cae bastante mal.
OpenAI sí lanzó eso de piedra, papel o tijera que Google había mostrado hace tiempo, pero Google todavía ni se le acerca... Vi esta presentación pensando algo como: ¿y esto otra vez cuándo lo irán a implementar? jajaja