Demos de IA de Meta

(aidemos.meta.com)

1 puntos por GN⁺ 2025-02-10 | 1 comentarios | Compartir por WhatsApp

Meta reúne sus experimentos de IA más recientes y demos técnicas en un solo lugar, para que se puedan probar nuevas herramientas antes que nadie
Presenta ideas donde se cruzan la investigación, la creatividad y la tecnología, incluyendo experimentos de FAIR y otros equipos de investigación dentro de Meta
Los demos se dividen en herramientas basadas en los modelos más recientes, herramientas relacionadas con Segment Anything, demos ligeros de carácter lúdico y demos técnicos centrados en resultados de investigación
Los usuarios pueden probar nuevas herramientas de IA mientras contribuyen al proceso de desarrollo de la tecnología de IA
Algunas tecnologías podrían integrarse en el futuro en productos de Meta, por lo que sirve como una ventana previa para conocer funciones que aún están en etapa experimental

Espacio para explorar los experimentos de IA de Meta

AI Demos muestra una colección de los experimentos de IA y demos técnicos más recientes creados por Meta
Incluye demos creados por FAIR y otros equipos de investigación de Meta
Los usuarios pueden tener acceso anticipado a nuevas herramientas de IA y probarlas directamente

Estructura de los demos

Featured Experiments
- Permite ver herramientas impulsadas por las capacidades de los modelos más recientes
Featured Segment Anything tools
- Agrupa en una categoría aparte las herramientas relacionadas con Segment Anything
Playful Ideas
- Presenta demos ligeros orientados a la creatividad y lo lúdico
Technical Explorations
- Incluye demos técnicos que muestran nuevos resultados de investigación
- Las pruebas de los usuarios pueden contribuir al desarrollo de tecnologías de IA, y algunas de ellas podrían integrarse en el futuro en productos de Meta

1 comentarios

GN⁺ 2025-02-10

Opiniones en Hacker News

Es una colección de herramientas demo, y Segment Anything 2 permite crear recortes de video y efectos visuales con unos cuantos clics.
Seamless Translation te deja escuchar tu propia voz hablando en otro idioma; Animated Drawings le da vida con animación a bocetos hechos a mano, y Audiobox permite crear historias de audio con voces y sonidos generados por IA.
- Dice: “Esta demo de investigación no está disponible para residentes de Illinois o Texas, ni para personas que accedan desde esos estados”.
  No se puede acceder desde Illinois o Texas, probablemente porque la parte de conversión de voz entra en conflicto con alguna ley relacionada con IA.
  Ojalá los legisladores también vean los casos de uso beneficiosos y ajusten las leyes para apuntar al abuso, en vez de bloquear de forma burda toda la IA generativa.
Seamless Translation es bastante sorprendente.
Hablo inglés y español, así que grabé una frase en inglés y escuché la salida en español; se parecía bastante a mi español.
Claro que mi español tiene más expresiones de estilo castellano, pero no esperaba que supiera eso.
- La verdadera prueba sería hacer que lo use un amigo de Mendoza, Argentina.
  Soy bilingüe, pero todavía no entiendo lo que dice ese amigo, y ni siquiera estoy seguro de que la mitad de sus palabras sean palabras reales.
- Lo probé y para nada sonaba como mi voz; era simplemente una voz masculina “genérica” traduciendo al alemán lo que dije.
  Mi esposa dijo: “no está bueno, no se parece en nada a tu voz”, y con eso basta.
- Lo clave es si la voz realmente sonaba como la de uno; en mi caso, no sonaba así en absoluto.
- Todavía se debate si la tecnología de traducción “ya llegó”, pero en algún momento probablemente se considerará lo suficientemente buena para la mayoría de los usos prácticos y eliminará en la práctica las barreras lingüísticas.
  Para entonces, sin duda empezará a afectar en cierta medida el habla oral, así que da miedo y resulta interesante a la vez.
- Fue una lástima que los ejemplos proporcionados fueran tan malos y robóticos.
  Me quitaron las ganas de probarlo directamente, aunque quizá lo reconsidere.
Me pregunto si, como en el título de HN, lo escribieron intencionalmente como Aidemos, o si lo correcto es AI Demos.
- Como HN reajusta automáticamente las mayúsculas y minúsculas de los títulos enviados, parece posible que originalmente se haya enviado como “AIDemos by Meta”.
La demo de Seamless Translation es excelente.
La voz traducida también pasa razonablemente por mi voz real, y si esto se pudiera hacer en tiempo real sería impresionante.
- Ya es posible.
  Kyutai presentó la semana pasada una demo de traducción de voz en tiempo real que se ejecuta en el dispositivo, y por ahora solo funciona en iPhone 16 Pro para traducción de francés→inglés: https://x.com/neilzegh/status/1887498102455869775
  También publicaron el código de inferencia y los pesos, disponibles en GitHub: https://github.com/kyutai-labs/hibiki
No tengo muy claro qué busca Meta con la IA
Parece que investiga mucho, pero no queda claro cuál es el objetivo final; entiendo a Google o a MSFT, pero Meta no me termina de convencer
- Meta parece ver que, al final de la competencia en IA, donde se genera dinero no será en los centros de datos ni en los modelos, sino en los ecosistemas cerrados y los datos exclusivos
  Mientras los modelos y los centros de datos sean la restricción, hará todo lo posible para que nadie pueda sacudir a Meta
  Es parecido a cómo Google dificultó la monetización de la capa de aplicaciones de la web para impedir ecosistemas cerrados que bloquearan la búsqueda
  Si al final de la competencia los modelos y el hardware se vuelven commodities, Meta tendrá perfiles psicológicos completos a nivel individual y grupal, podrá estudiarlos y entregar contenido extremadamente preciso
  El verdadero competidor podría ser una app tipo “her” que saque a la gente de las redes sociales y la envíe a su propio mundo aislado; en cierto sentido, Discord es un mundo alternativo al ecosistema de Meta, por ser una comunidad pequeña, hiperconcentrada y solo por invitación
- https://gwern.net/complement
  El gran patrón de los negocios tecnológicos del que habló Joel Spolsky en 2002 es la commoditización de los complementos
  En lugar de integración vertical, la estrategia consiste en dominar una capa de un producto compuesto por varias capas esenciales y fomentar la competencia en las capas superiores e inferiores para impedir que surja un monopolista competidor, bajando los precios en otras partes del stack hasta el costo marginal y reduciendo el precio total para aumentar la demanda
  Aunque el producto original sea muy valioso y se pueda cobrar por él, si aumenta las ganancias en otro lugar puede ser más valioso hacerlo gratuito
  El ejemplo clásico es que el monopolio de Microsoft en sistemas operativos commoditizó el hardware de PC, lo que perjudicó a IBM y benefició a MS
  Este patrón también explica por qué las grandes tecnológicas entran en áreas que, a primera vista, parecen no relacionadas o incluso autodestructivas. La alta tasa de contribuciones open source de las empresas de internet, y casos de Google, una empresa de publicidad, metiéndose en fabricación de smartphones, desarrollo de navegadores web, software estadístico, redes de fibra óptica, WiFi municipal, subastas de espectro inalámbrico y DNS, pueden verse como intentos de commoditizar de forma preventiva a otras empresas del stack, o como defensa para que no les hagan lo mismo
- Yo también tenía curiosidad, pero ahora la mayor parte parece una fase de exploración
  Es similar a cuando antes tocaron un poco crypto y luego hicieron el experimento del “metaverse”, que ya casi terminó. Claro que incluso estas exploraciones a veces cuestan muchísimo dinero
  Estas demos muestran para qué podría usarse la IA, pero aún está abierto si eso es realmente tan importante como para cambiar las reglas del negocio de Meta, o si es algo bueno para los usuarios comunes
  Las interfaces viejas y pésimas de Facebook e Instagram casi no han cambiado en más de 10 años, y aunque es una empresa con 70.000 empleados, hoy parece enfocarse más en meter publicidad de forma agresiva que en la utilidad
  Incluso si el negocio sigue siendo el Facebook viejo, lleno de bugs y de 20 años, y la app de Instagram de más de 10 años, si contribuye al avance de los modelos open source como lo hizo con React, en general lo veo como algo positivo
- Después del fracaso del “metaverse”, puede que estén desesperados por gastar dinero en otra cosa que quizá se convierta en The Future(TM)
  Aunque uno piense que es poco probable que los LLM sean la próxima gran ola, desde el punto de vista de Meta puede ser bastante razonable. Tienen muchísimo dinero e ingresos, así que pueden subirse a cada nueva moda con la estrategia de no quedarse atrás si alguna resulta ser real; y si no, pueden absorberlo
  Sospecho que la razón por la que la mayoría de Big Tech se interesa por los LLM es, al final, más cercana a la gestión de riesgos
- Parafraseando lo que escuché de alguien involucrado, el objetivo de la IA de Meta es mejorar el targeting publicitario
  Mejores clasificaciones y clustering, mejores “recomendaciones” para anunciantes, incluidos elementos visuales, textos y videos
  Estas demos son efectos secundarios o algo cercano al “greenwashing”. El negocio central y único de Meta es la publicidad, y todas las demás formas de monetización han fracasado
La demo de Segment Anything es bastante impresionante; me pregunto si está integrada en algún producto real
Como hobby hago ediciones simples de video para amigos y parece bastante útil
[0] https://sam2.metademolab.com/
- Photoroom [0] salió de Y Combinator y el producto, en esencia, se parece mucho a SAM con muchos ajustes y una buena experiencia de usuario encima
  No sé si realmente lo usan, pero si no lo hacen, creo que deberían
  [0] https://www.photoroom.com/
- SwarmUI, un frontend para modelos de generación de imágenes, integró SAM2 para permitir enmascarar rápidamente partes de una imagen en tareas como inpainting
  Es muy bueno
- Probablemente ya se esté usando, pero no creo que se publicite de esa forma
Para quien tenga curiosidad, Meta FAIR era la sigla de “Facebook Artificial Intelligence Research” y luego cambió de nombre a “Meta AI”[1]
[1]: https://en.wikipedia.org/wiki/Meta_AI
La lista no está completa
Por ejemplo, falta la demo de Meta Motivo, un modelo de control para humanoides: https://metamotivo.metademolab.com/
Meta entiende profundamente el impacto de la diferencia entre GPT-3 y ChatGPT
El modelo es el punto de partida, y la experiencia de usuario que define qué haces con ese modelo es lo que revela la inteligencia
Esto es especialmente evidente en los modelos visuales: decir que SAM2 “puede ver cualquier cosa” resulta interesante, pero ver cómo rastrea de forma fluida una pelota de fútbol a lo largo de todo un video, incluso cuando queda oculta, es sorprendente
Aparece el mensaje: “El sitio no está disponible actualmente en esta región”
- Como los mercados internacionales y algunos estados de EE. UU. tienen distintas regulaciones sobre IA, las empresas tienen que manejar sus productos de IA con mucha cautela.
  Por eso, los modelos de última generación suelen llegar más tarde a ciertas regiones.
  Revisar y documentar todo el cumplimiento normativo para cada pequeña demo tiene poco valor en relación con el costo, así que probablemente lo hayan marcado para permitirlo solo en EE. UU. y algunas regiones.
- También aparece este mensaje en EE. UU.
- Vi este mensaje dentro de EE. UU., pero pude evitarlo configurando la VPN en LA.
  Me pregunto si será porque los ingenieros de Meta están ahí ¯_(ツ)_/¯
  Después de entrar, aparecía este texto:
  “Esta demo de investigación no está abierta a residentes de Illinois o Texas, ni a personas que accedan desde esos estados”.
  Estoy en Texas

Demos de IA de Meta

Espacio para explorar los experimentos de IA de Meta

Estructura de los demos

Featured Experiments

Featured Segment Anything tools

Playful Ideas

Technical Explorations

Lecturas relacionadas

1 comentarios

Opiniones en Hacker News