1 puntos por GN⁺ 2025-02-10 | 1 comentarios | Compartir por WhatsApp

1 comentarios

 
GN⁺ 2025-02-10
Comentarios de Hacker News
  • Es una explicación de una caja de herramientas con varios demos

    • Segment Anything 2: genera recortes de video y efectos visuales divertidos con unos pocos clics
    • Seamless Translation: puedes escuchar tu propia voz como si hablara en otro idioma
    • Animated Drawings: da vida a bocetos dibujados a mano con animación
    • Audiobox: crea historias de audio usando voces y sonidos generados por IA
  • Seamless Translation es una función bastante sorprendente

    • Cuando un usuario que habla inglés y español grabó una frase en inglés y escuchó la salida generada en español, sonaba casi igual a su propio español
    • Aun así, el español del usuario incluye más expresiones propias del castellano
  • Me pregunto por qué en el título dice Aidemos

  • Me da curiosidad la dirección de investigación en IA de Meta

    • Entiendo los objetivos de Google y MSFT, pero no me queda claro cuál es el objetivo final de Meta
  • El demo de Seamless Translation es excelente

    • La voz traducida suena parecida a la voz original
    • Si pudieran implementar esta función en tiempo real, sería impresionante
  • Meta entiende profundamente el impacto de GPT-3 y ChatGPT

    • El modelo es el punto de partida, y la UX construida sobre el modelo es la que muestra la inteligencia
    • Esto destaca especialmente en los modelos visuales
    • Es interesante que SAM2 diga que puede "ver cualquier cosa"
    • Sorprende ver cómo haces clic en un balón de fútbol y el modelo lo sigue con fluidez en el video incluso cuando queda oculto
  • No están incluidos todos los demos

    • Por ejemplo, falta el demo de Meta Motivo (modelo de control de humanoides)
  • Aparece el mensaje: "Actualmente el sitio no está disponible en su región"

  • Me pregunto dónde están todos los enlaces a los modelos

  • Es interesante, pero ojalá Meta dejara más claro qué es lo que realmente quiere

    • Probablemente signifique: "Por favor, dennos datos In the Wild para seguir entrenando los modelos"
  • Hace unos años tuve una experiencia con una tecnología de estimación de edad

    • El usuario subía una imagen y, si ayudaba a alinear el 10% de los puntos de referencia faciales, se ejecutaba el estimador
    • Si salía mal, le pedían correcciones para mejorarlo
    • Sigue siendo genial, pero no me impresiona tanto en comparación con esa experiencia anterior