- ¿Qué pasaría si el teléfono grabara siempre lo que decimos y lo procesara con IA? Yo lo probé primero
- Grabo siempre mientras estoy despierto, excepto cuando duermo (a veces lo apago en situaciones inapropiadas). Es una PoC y todavía es difícil aplicarlo en la práctica
- La motivación para hacerlo fue que OpenAI publicó Whisper
Cómo funciona
- Con dos micrófonos grabo todo lo que digo durante el día y, cuando termina el día, lo proceso con Whisper para convertirlo en texto
- Me di cuenta de que con esto se puede crear un asistente digital básico al estilo de "Ok Google"
- Hay dos tipos de información que se pueden extraer cada día
- Active: lo que le indico conscientemente al asistente
- Passive: toda la demás información que debería extraerse sin que yo tenga que hacer ninguna acción
Funciones activas
- Para las cosas que deben procesarse de forma asíncrona cada noche, las digo con el formato
'KEYWORD COMMAND data END KEYWORD'
'Robert WEIGHT 60.1 end Robert': Robert es el nombre del asistente y end es la palabra clave de cierre
- Razones para no usar "OK Google": es limitado, no me gusta que la información vaya a Google y además funciona de forma síncrona, procesando en el momento
- Claro, como se procesa de manera asíncrona, tiene la desventaja de que no puedes saber el resultado hasta que termina el día
Ver resultados
- Me subo a la báscula y luego digo
'Robert WEIGHT 62.8 end Robert'
- Al despertar, leo el rastreador de sueño (Mi Band):
'Robert SLEEP 7 hours 14 minutes end Robert'
- Aunque los dispositivos electrónicos sí envían datos al teléfono, no hay forma de extraerlos, así que simplemente uso el asistente digital como una especie de Analog API
- Después de comer digo
'Robert LUNCH two toasts with a fried egg end Robert'
- Calcula las calorías de la comida diaria usando una API externa
- Después de escuchar un pódcast digo
'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert'
- Guarda todas las notas e ideas
- Después de cargar gasolina digo
'Robert SPENT 250,000 on fuel end Robert'
- Guarda el registro diario de mis gastos
- Se siente un poco raro hablarle así a uno mismo, pero tiene la ventaja de no tener que sacar el teléfono para hacer algo
Panel de control
- Creé un dashboard para ver toda la información ingresada de esta forma
- Hice My Journal para registrar automáticamente qué hice durante el día
Información pasiva - todavía en desarrollo
- RELATIONSHIP THERMOMETER: termómetro de relaciones
- SENTIMENT ANALYS: análisis de sentimiento
- TOTAL RECALL: buscar todo lo que he dicho sobre un tema específico y también lo que pensaba sobre ese tema en un momento determinado
Conclusión preliminar
- Se necesita audio + contexto
- El potencial que se obtiene con esto es enorme, tanto para bien como para mal
- Positivo: memoria perfecta, psicólogo/coach personal, mi clon virtual
- Negativo: que todo eso esté en manos de otras personas
- La diferencia entre una utopía y una distopía es quién puede acceder a esa información
3 comentarios
"La diferencia entre una utopía y una distopía es quién puede acceder a esa información". Buena frase.
Es atractivo. Parece bastante posible que se haga realidad.
También podrían existir contenidos para compartir una vida cotidiana ejemplar de vez en cuando, como un vlog.
El autor lo publicó directamente en HN y también respondió comentarios https://news.ycombinator.com/item?id=33608437
También incluye el enlace de AliExpress del micrófono que usó jaja
Whisper - sistema multilingüe de reconocimiento de voz (ASR) que OpenAI publicó como código abierto