Flipbook - un sitio web transmitido en vivo directamente desde el modelo

(flipbook.page)

6 puntos por GN⁺ 2026-04-23 | 3 comentarios | Compartir por WhatsApp

Generación bajo demanda en tiempo real para crear cada página como una imagen, y al hacer clic en un objeto dentro de la imagen se genera una nueva pantalla para explorar más a fondo
La pantalla no tiene HTML ni campos de entrada y funciona como una interfaz centrada en píxeles, donde incluso el texto es renderizado directamente en píxeles por el modelo de imágenes
La información de la página se crea usando en conjunto agentic web search y el conocimiento del mundo del modelo de imágenes, y se indica que la precisión es similar a la que se esperaría de ChatGPT, Gemini o Claude
La función de live video stream anima las imágenes de exploración y suaviza las transiciones, pero por ahora está oculta detrás de un toggle porque su comportamiento es difícil de predecir y consume muchos recursos
Por ahora se parece más a una herramienta experimental de exploración y aprendizaje, pero a medida que mejoren la precisión y el rendimiento de los modelos de imagen y video, podría expandirse a un entorno que incluya más datos reales, interacción, ejecución de tareas y almacenamiento de datos

Descripción general

Es un navegador visual infinito que funciona con generación bajo demanda en tiempo real y compone como imágenes todas las páginas a las que llega el usuario
En la pantalla no hay HTML, código, enlaces específicos ni campos de entrada, y al hacer clic en un objeto dentro de la imagen se genera una nueva imagen para explorar ese objeto con más profundidad
Replantea la web no como un conjunto de documentos y elementos de UI, sino como una interfaz centrada en píxeles generada en pantalla

Cómo funciona y hacia dónde puede expandirse

Todo el texto en pantalla también es renderizado directamente en píxeles por el modelo de imágenes, sin superponer una capa de texto separada sobre la imagen
- Como resultado, a veces el texto puede verse incompleto o aparecer en una posición incorrecta, y se indica que esto podría mejorar a medida que el modelo avance
La información dentro de la imagen se crea usando en conjunto agentic web search y el conocimiento propio del mundo del modelo de imágenes
- Aunque a veces puede ser inexacta, se presenta como un punto de partida útil generalmente basado en datos reales en línea
- Se indica que la precisión factual es parecida al nivel que puede esperarse al usar ChatGPT, Gemini o Claude
En lugar de una pantalla basada principalmente en texto y rectángulos de colores, apunta a una experiencia de cómputo que transmita información mediante una expresión visual rica
Parte de la idea de que solo con código y reglas fijas es difícil transmitir ideas complejas y detalladas, y enfatiza una dirección en la que según el contexto se elige la forma de expresión más efectiva, ya sea una palabra, una ilustración o un renderizado realista
live video stream es una función experimental que convierte imágenes estáticas en un flujo de video más continuo, animando cada imagen de exploración y haciendo más suaves las transiciones entre ellas
- Por ahora su comportamiento es algo impredecible y también consume muchos recursos, por eso está detrás de un toggle que puede activarse o desactivarse
- Actualmente usa en conjunto un modelo personalizado de generación de video altamente optimizado y dos sistemas de generación de imágenes, y se indica que en el futuro planean integrarlo todo en un solo sistema
Aunque hoy está diseñado como una herramienta experimental de exploración y aprendizaje, si la precisión y el rendimiento de los modelos de imagen y video mejoran, podría expandirse a páginas que incluyan más datos reales, permitan interacción, ejecuten tareas directamente y almacenen sus propios datos
- Como ejemplo, se menciona que podría pasar de investigar el próximo viaje y luego hacer la reserva en otro sitio, a completar todo el proceso dentro de Flipbook
- Se indica que tareas que hoy requieren apps y sitios web separados podrían resolverse cada vez más dentro de un entorno que se vea y funcione como Flipbook
No se reproducirá en navegadores que no admitan video embebido
La demostración usa un video pregrabado y está editada por motivos de velocidad

3 comentarios

xguru 2026-04-24

Solo con verlo y con el video de presentación dan ganas de probarlo una vez... pero dicen que hay que esperar 3 horas. Parece que está entrando muchísima gente.

arthurk 2026-04-24

https://x.com/DongwooKim/status/2047499005580738657
Probé rotar la Torre Namsan de Seúl y quedó muy bonito, con mucho encanto.

GN⁺ 2026-04-23

Comentarios en Hacker News

Esto sí que es sorprendente. Subí un diagrama de un sistema hidropónico que encontré por ahí
y me generó diagramas separados y de alta calidad para partes detalladas como tuberías, suministro de nutrientes y cableado eléctrico
No era totalmente exacto, pero me gusta mucho el concepto en sí
Le pedí que hiciera un diagrama de especificaciones de torque de la suspensión de un auto, y como es un tema que conozco, lo revisé:
dibujó casi todo correctamente y los valores de torque también estaban bien
Podías hacer clic en piezas individuales para ampliar más y ver especificaciones adicionales
Fue de las demos más impresionantes que he visto en mucho tiempo, y se podía usar como un manual de reparación Haynes vivo
- Le pedí que diseñara un sistema solar de 12V para una caseta de jardín, y solo acertó en lo más general; todo lo demás estaba mal
  Acertó en que se necesitan paneles solares, controlador de carga, batería y cargas, pero el cableado no tenía sentido
  En cuanto entrabas en detalles como la configuración del controlador de carga, se derrumbaba por completo
  No serviría jamás como información en la que realmente puedas confiar, pero como curiosidad es entretenido y la implementación impresiona
- Planeo hacer un cobertizo para bicicletas con una puerta vieja del patio trasero, así que le pedí un diseño
  El resultado fue básicamente un cobertizo común con una upcycled door pegada
  Ni se veía dónde entrarían las bicicletas, y solo proponía una estructura que ni siquiera se parecía a la forma final real
  Igual que otras demos de IA, por fuera se ve convincente, pero el sistema en el fondo no entiende lo que está haciendo
- Lo probé yo mismo
  Le pedí que etiquetara los componentes del compartimento del motor de un Jeep Wrangler JK y al principio salió un diagrama bastante convincente
  Pero el depósito de líquido de frenos estaba del lado opuesto, y en ese lugar había una etiqueta del tanque de rebose del refrigerante; el tanque de rebose real sí estaba dibujado, pero sin etiqueta
  La ubicación de la batería también estaba mal, la parte superior de la parrilla delantera decía que era la tapa del filtro de aceite, y la posición del tapón de aceite también era incorrecta
  La mitad de la batería estaba etiquetada como caja de fusibles, mientras que la caja de fusibles real estaba bien dibujada del otro lado pero sin etiqueta
  El depósito del limpiaparabrisas también aparecía como dos tanques pegados entre sí
  Al hacer clic en el tanque de refrigerante mal etiquetado, me llevó a otra página donde esta vez la posición sí era correcta, pero el tanque se veía totalmente distinto, y además habían puesto la tapa del radiador encima del tanque
  En realidad debería estar sobre el radiador
  Alguien que sepa del tema puede encontrar fallas en todas partes, pero a ojos de quien no sabe se ve bastante creíble; esa es exactamente la historia de los LLM
- Tenía un Mac Pro 5,1 completamente desarmado sobre el escritorio y le pedí un diagrama interno
  A simple vista se parecía a un MacPro, pero todos los elementos visuales estaban mal
  El texto también solo parecía correcto en una mirada rápida, y al hacer clic casi todo lo de dentro estaba mal
  Se veía genial, pero ver a una IA equivocarse de forma tan constante así se siente como algo que no veía desde 2023
- Puse "your mom" y me devolvió una línea de tiempo social histórica de la maternidad con una placenta superpuesta
  Esto sí lo apruebo
Es un proyecto genial, pero siempre me pregunto de dónde salen los recursos y el dinero para construir algo así y mantenerlo como servicio público
Supongo que tendrán GPUs propias o usarán la API de GPT/Gemini con inferencia subsidiada a nivel empresa
Pero desde la perspectiva de alguien que ha vivido con austeridad, todavía me cuesta imaginarlo
- Lamentablemente, esto simplemente lo estoy pagando de mi bolsillo
  Para nada esperaba que explotara de esta manera
- Si recibe un solo abrazo de la muerte de HN y de la noche a la mañana llega una factura de 50 mil dólares en costos de inferencia, seguro no durará mucho
- Capaz que pertenece a una universidad
- Si piensas en gastar dinero en hobbies, tampoco es algo tan raro
  Hay gente que gasta en videojuegos, arte o carpintería
  y otros usan el presupuesto libre que les queda de un salario nivel FAANG en un proyecto de arte GenAI en vez de alcohol o deportes
  Puede no ser de tu gusto, pero en el presupuesto de cualquiera suele haber al menos un gasto que desde fuera parece un lujo
- Yo tampoco quería ni intentarlo por una razón parecida
  Aquí a eso le llaman immigrant mentality, no como insulto, sino más bien como la austeridad propia de quien tuvo que reconstruir su vida desde cero
  Además era lentísimo, así que al final no esperé
  No culpo a quien lo hizo, simplemente era demasiado lento
Al principio pensé que esto no generaba diagramas, sino que creaba la página web en tiempo real
Siempre me ha parecido interesante la idea de un futuro donde las aplicaciones se construyen al momento según las necesidades del usuario
Me pregunto si existe algún caso real en que hayan hecho algo así
Me salió un Mac Neo, con 2 chips cuánticos M4, solid state battery y graphene connector
https://flipbook.page/n/942776fea47c4274a9a4589134924ef5
Sale Sneed's Feed and Seed. También aparece como Formerly Chuck's
https://flipbook.page/n/4a5e1797903b478c876a35e64c6c57fe
- Seguí el historial de propiedad y al final puso el apellido como Chuck's Feed and Seed
  Si eso lo hubiera acertado bien, de verdad me habría impresionado
- Sinceramente creo que es uno de los mejores chistes de Los Simpson
Parece que no está dentro de sus datos de entrenamiento
https://flipbook.page/n/d739a0bbc3664ba2aad331c90fef7406
La idea es interesante, pero por ahora casi todo está fallando
Probablemente por el abrazo de la muerte de HN
Aparece 429 RESOURCE_EXHAUSTED junto con Gemini generateContent request failed,
y dice que se superó la cuota actual y que revises el plan y la información de facturación
También muestra un enlace con información detallada sobre los límites
La demo de la página principal muestra Paris Travel Overview / Visiting Notre Dame,
así que lo probé con algunas ciudades y lugares a los que sí he ido
A veces sí identifica correctamente los puntos de interés, pero las relaciones espaciales entre ellos estaban completamente mal
Ni siquiera se acercaba a la realidad
Esto parece un producto bastante caro como para recibir el abrazo de la muerte de HN
Los videos de muestra que subieron a Twitter se veían realmente geniales
Pero por ahora no funciona bien, así que voy a esperar a que baje un poco el tráfico y volveré a probarlo en unos días