- Casi nadie disfruta del software de trabajo.
- Incluso los mejores productos, al aplicarlos al trabajo real, suelen ser poco flexibles o poco sofisticados y tener una curva de aprendizaje empinada, además de ser difíciles de adoptar.
- La IA generativa ofrece la oportunidad de reinventar por completo los flujos de trabajo y hacer posible crear productos completamente nuevos desde cero.
- Los flujos de trabajo AI Native ayudan a los usuarios a realizar tareas existentes de manera más eficiente.
- Estas plataformas permiten que los usuarios deleguen tareas de bajo nivel al asistente de IA y dediquen más tiempo al pensamiento de alto nivel.
- Ayudan a desbloquear nuevas capacidades técnicas y estéticas para que cualquiera pueda convertirse en programador, productor, diseñador o músico.
- La brecha entre creatividad y técnica se reduce.
- Con productos de flujo de trabajo basados en IA que son de nivel profesional y, al mismo tiempo, amigables para el consumidor, cualquier persona puede convertirse en un prosumidor de próxima generación.
- (prosumidor: alguien que desempeña tanto el rol de productor como de consumidor. El término fue usado por Alvin Toffler en La Tercera Ola.)
¿Cómo serán los productos prosumidor AI Native?
- Todos los productos de flujos de trabajo AI Native de Gen AI comparten una característica común: convertir modelos de última generación en una interfaz de usuario accesible y efectiva.
- Los usuarios se interesan menos por la infraestructura detrás del producto y más por cómo éste les ayuda.
- El salto técnico logrado con Gen AI es impresionante, pero los productos exitosos aún comienzan con una comprensión profunda del usuario y de sus puntos de dolor.
- Un producto exitoso parte de:
- comprender en profundidad los puntos de dolor del usuario,
- entender qué puede abstraerse con IA,
- ubicar dónde hay puntos de decisión que requieren aprobación,
- y localizar el punto de palanca donde se puede generar el mayor impacto.
Funciones clave de los productos prosumidor AI Native
- Herramientas generativas que resuelven el problema de la "página en blanco"
- Generan medios a partir de prompts en lenguaje natural para ayudar con el arranque inicial.
- Pueden ejecutarse con un modelo propio o combinando varios modelos.
- Ej.) la herramienta de renderizado de Vizcom y el constructor de sitios web de Durable
- Combinación multimodal (y multimedia)
- Muchos proyectos creativos requieren más de dos tipos de contenido: imagen y texto, música y video, animación y locución, entre otros.
- Pero por ahora no existe un solo modelo capaz de generar todos esos tipos de activos.
- Esto abre una oportunidad para productos de flujo de trabajo donde el usuario pueda crear, mejorar y combinar distintos tipos de contenido en un solo lugar.
- Ej.) los avatares de HeyGen (combina su propio avatar con TTS de ElevenLabs para crear avatares que hablen de forma realista).
- Editores inteligentes que permiten más iteraciones
- Un resultado de trabajo "obtenido de una sola vez" casi nunca existe.
- Con IA de aleatoriedad propia ocurre aún más: rara vez se obtiene exactamente lo deseado en la primera ejecución.
- Pulsar el botón de regenerar o ajustar el prompt es importante, pero suele ser un proceso largo y a veces frustrante.
- La primera ola de productos de IA no permitía ninguna iteración: si ejecutabas el mismo prompt de nuevo, obtenías un resultado completamente distinto.
- Ahora empieza a hacerse evidente la función para tomar una salida existente y pulirla sin empezar desde cero.
- Ej.) la herramienta de variación y zoom de Midjourney y la edición de áreas específicas de Pika.
- Refinement (refinamiento) dentro de la plataforma
- Otro elemento importante de la edición inteligente es el refinamiento.
- El último 10% del trabajo de pulido suele ser la diferencia entre crear algo "bueno" y crear algo "excelente".
- Pero puede ser muy difícil tanto (1) encontrar qué refinar como (2) hacerlo sin tener que moverse a otro lugar.
- Los productos de flujo de trabajo con IA ayudan a identificar qué mejorar y luego ayudan a mejorarlo automáticamente.
- Se parece al "retoque automático" de Apple en fotos, pero imagina que funcione con todo.
- Ej.) la función de escalado de Krea y el flujo de trabajo de audiolibro de ElevenLabs
- Output remezclable y transformable
- Todo contenido puede ser un posible "punto de partida" para otra iteración.
- Si alguna vez has copiado un prompt creado por otra persona en Midjourney o ChatGPT y lo has modificado, ya estás participando.
- Las plataformas que aprovechan bien esta flexibilidad pueden crear productos más potentes y más consistentes.
- Para los creadores iniciales, tiene gran valor que puedan convertir un video en una publicación de blog o convertir una guía en texto en un video animado de uso.
- Ej.) función central de la plataforma de publicación de Gamma: generar un deck, un documento o una página web desde un prompt o archivo cargado y, si es necesario, convertir el formato.
- Con estos productos también es posible exponer el flujo de trabajo para que otros lo repliquen.
- Puede ser una secuencia de prompts o una combinación de modelos, o incluso un botón de "copiar" para que un usuario con menor nivel técnico imite la salida o la estética.
- Ej.) Imagen AI, una plataforma de edición para fotógrafos profesionales:
- Ayuda a entrenar el modelo según el estilo individual de cada fotógrafo, facilitando la edición por lotes.
- Además, el usuario puede editar con el estilo de fotógrafos líderes de la industria que tengan su perfil publicado en la plataforma.
¿Cómo evolucionarán los productos prosumidor?
- Las herramientas prosumidor de próxima generación todavía están en una etapa inicial.
- La capacidad de generación de activos de las herramientas existentes se volvió finalmente lo suficientemente fuerte para agregar flujos de trabajo con sentido, pero la mayoría de los productos todavía se enfocan en un solo tipo de contenido y son bastante limitados en capacidades.
- Productos esperados:
- Editores que combinen diferentes modalidades de contenido
- El video podría ser el mejor ejemplo.
- Para producir una película corta con IA hoy en día, primero debes generar varios clips en productos como Pika o Runway y luego trasladarte a otra plataforma como Capcut o Kapwing para editar o mezclar audio.
- ¿Qué pasaría si todas esas etapas del proceso se pudieran hacer en una sola plataforma?
- Se espera que algunos productos de próxima generación añadan más funciones de flujo de trabajo y se expandan a la creación de otros tipos de contenido mediante entrenamiento de modelos propios, uso de modelos open source o alianzas con otros actores.
- También podrían surgir nuevos editores AI Native independientes que permitan al usuario "enchufar" modelos diversos.
- Productos que aprovechen modos de interacción alternativos
- El prompt en texto no siempre es la forma más efectiva de comunicarse con un producto de IA.
- Creo que debemos poder trabajar con herramientas generativas del mismo modo en que colaboramos con un socio humano para hacer brainstorming con voz, bocetos o compartir imágenes de referencia.
- En especial, hay grandes expectativas para la voz como formato para compartir pensamientos más sofisticados y complejos (o divagar de formas imposibles con texto).
- Ya están apareciendo productos como Oasis, TalkNotes y AudioPen que convierten notas de voz en correos electrónicos, publicaciones de blog o tweets.
- Se prevé que en más productos de flujo de trabajo el audio y el video se ofrezcan como fuentes de entrada, cambiando la forma y el momento en que las personas trabajan.
- Productos que traten por igual el contenido generado por humanos y por IA
- Sería ideal contar con herramientas que permitan usar en paralelo contenido de IA y contenido humano. Hoy la mayoría de los productos se centra en uno de los dos.
- Por ejemplo, algunos son excelentes al corregir fotos reales pero no hacen nada con imágenes de IA.
- Otras pueden crear nuevos videos, pero no pueden retocar clips o cambiar estilo en un iPhone.
- En el futuro, se espera que la mayoría de los creadores de contenido profesionales trabajen mezclando contenido creado por IA con contenido creado por personas.
- Los productos que usen deberán aceptar ambos tipos de contenido y facilitar su combinación.
- El editor de Runway lo ejemplifica bien:
- Trae clips e imágenes del propio modelo generativo e importa assets reales para usarlos en la misma línea de tiempo.
- Luego, ambas herramientas mágicas de la compañía, como inpainting y pantalla verde, se pueden aplicar a ambos tipos de contenido.
- Los productos de flujo de trabajo de contenido revisados aquí a fondo son solo uno de los elementos importantes que conforman el futuro del software para prosumidores.
- Muy pronto veremos con más detalle el segundo componente clave, las herramientas de productividad, para volver a examinar qué herramientas de productividad pueden renacer de forma similar en la era de la IA
2 comentarios
Creo que la combinación de flujos de trabajo propuesta como diferencia de los productos de AI prosumidor tiene la misma esencia que las limitaciones de las plataformas low-code existentes.
No todo el trabajo que se le asigna a los profesionales tiene una complejidad moderada que pueda controlarse con low-code; a menudo, la propia complejidad de la tarea es alta, por lo que puede ser mejor controlar esa complejidad con habilidades de programación profesionales que resolverla con una plataforma low-code. Si se compara la programación con la configuración de un circuito electrónico, la solución low-code se equipara a una breadboard.
Con una breadboard puedes montar y probar distintos componentes para crear un prototipo de un circuito electrónico que funcione, pero no puedes hacer con ella un circuito integrado que requiera fiabilidad.
Si lo aplicamos a la creación de contenido, existe la preocupación de que por las limitaciones de las herramientas de generación de IA tal vez no se pueda controlar ni la rigurosidad ni los detalles del resultado. Es como las imágenes de IA que salen ahora, que no logran dibujar bien los dedos. Es probable que la curva de aprendizaje baje, pero no creo que sea tan drástica.