Grabo todo lo que digo 24x7 y lo proceso con IA. ¿Será este el futuro?

(roberdam.com)

19 puntos por xguru 2022-11-17 | 3 comentarios | Compartir por WhatsApp

¿Qué pasaría si el teléfono grabara siempre lo que decimos y lo procesara con IA? Yo lo probé primero
Grabo siempre mientras estoy despierto, excepto cuando duermo (a veces lo apago en situaciones inapropiadas). Es una PoC y todavía es difícil aplicarlo en la práctica
La motivación para hacerlo fue que OpenAI publicó Whisper

Cómo funciona

Con dos micrófonos grabo todo lo que digo durante el día y, cuando termina el día, lo proceso con Whisper para convertirlo en texto
Me di cuenta de que con esto se puede crear un asistente digital básico al estilo de "Ok Google"
Hay dos tipos de información que se pueden extraer cada día
- Active: lo que le indico conscientemente al asistente
- Passive: toda la demás información que debería extraerse sin que yo tenga que hacer ninguna acción

Funciones activas

Para las cosas que deben procesarse de forma asíncrona cada noche, las digo con el formato 'KEYWORD COMMAND data END KEYWORD'
- 'Robert WEIGHT 60.1 end Robert': Robert es el nombre del asistente y end es la palabra clave de cierre
- Razones para no usar "OK Google": es limitado, no me gusta que la información vaya a Google y además funciona de forma síncrona, procesando en el momento
- Claro, como se procesa de manera asíncrona, tiene la desventaja de que no puedes saber el resultado hasta que termina el día

Ver resultados

Me subo a la báscula y luego digo 'Robert WEIGHT 62.8 end Robert'
Al despertar, leo el rastreador de sueño (Mi Band): 'Robert SLEEP 7 hours 14 minutes end Robert'
- Aunque los dispositivos electrónicos sí envían datos al teléfono, no hay forma de extraerlos, así que simplemente uso el asistente digital como una especie de Analog API
Después de comer digo 'Robert LUNCH two toasts with a fried egg end Robert'
- Calcula las calorías de la comida diaria usando una API externa
Después de escuchar un pódcast digo 'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert'
- Guarda todas las notas e ideas
Después de cargar gasolina digo 'Robert SPENT 250,000 on fuel end Robert'
- Guarda el registro diario de mis gastos
Se siente un poco raro hablarle así a uno mismo, pero tiene la ventaja de no tener que sacar el teléfono para hacer algo

Panel de control

Creé un dashboard para ver toda la información ingresada de esta forma
Hice My Journal para registrar automáticamente qué hice durante el día

Información pasiva - todavía en desarrollo

RELATIONSHIP THERMOMETER: termómetro de relaciones
SENTIMENT ANALYS: análisis de sentimiento
TOTAL RECALL: buscar todo lo que he dicho sobre un tema específico y también lo que pensaba sobre ese tema en un momento determinado

Conclusión preliminar

Se necesita audio + contexto
El potencial que se obtiene con esto es enorme, tanto para bien como para mal
- Positivo: memoria perfecta, psicólogo/coach personal, mi clon virtual
- Negativo: que todo eso esté en manos de otras personas
La diferencia entre una utopía y una distopía es quién puede acceder a esa información

3 comentarios

budlebee 2022-11-17

"La diferencia entre una utopía y una distopía es quién puede acceder a esa información". Buena frase.

nicewook 2022-11-17

Es atractivo. Parece bastante posible que se haga realidad.
También podrían existir contenidos para compartir una vida cotidiana ejemplar de vez en cuando, como un vlog.

xguru 2022-11-17

El autor lo publicó directamente en HN y también respondió comentarios https://news.ycombinator.com/item?id=33608437
También incluye el enlace de AliExpress del micrófono que usó jaja

Whisper - sistema multilingüe de reconocimiento de voz (ASR) que OpenAI publicó como código abierto