19 puntos por xguru 2022-11-17 | 3 comentarios | Compartir por WhatsApp
  • ¿Qué pasaría si el teléfono grabara siempre lo que decimos y lo procesara con IA? Yo lo probé primero
  • Grabo siempre mientras estoy despierto, excepto cuando duermo (a veces lo apago en situaciones inapropiadas). Es una PoC y todavía es difícil aplicarlo en la práctica
  • La motivación para hacerlo fue que OpenAI publicó Whisper

Cómo funciona

  • Con dos micrófonos grabo todo lo que digo durante el día y, cuando termina el día, lo proceso con Whisper para convertirlo en texto
  • Me di cuenta de que con esto se puede crear un asistente digital básico al estilo de "Ok Google"
  • Hay dos tipos de información que se pueden extraer cada día
    • Active: lo que le indico conscientemente al asistente
    • Passive: toda la demás información que debería extraerse sin que yo tenga que hacer ninguna acción

Funciones activas

  • Para las cosas que deben procesarse de forma asíncrona cada noche, las digo con el formato 'KEYWORD COMMAND data END KEYWORD'
    • 'Robert WEIGHT 60.1 end Robert': Robert es el nombre del asistente y end es la palabra clave de cierre
    • Razones para no usar "OK Google": es limitado, no me gusta que la información vaya a Google y además funciona de forma síncrona, procesando en el momento
    • Claro, como se procesa de manera asíncrona, tiene la desventaja de que no puedes saber el resultado hasta que termina el día

Ver resultados

  • Me subo a la báscula y luego digo 'Robert WEIGHT 62.8 end Robert'
  • Al despertar, leo el rastreador de sueño (Mi Band): 'Robert SLEEP 7 hours 14 minutes end Robert'
    • Aunque los dispositivos electrónicos sí envían datos al teléfono, no hay forma de extraerlos, así que simplemente uso el asistente digital como una especie de Analog API
  • Después de comer digo 'Robert LUNCH two toasts with a fried egg end Robert'
    • Calcula las calorías de la comida diaria usando una API externa
  • Después de escuchar un pódcast digo 'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert'
    • Guarda todas las notas e ideas
  • Después de cargar gasolina digo 'Robert SPENT 250,000 on fuel end Robert'
    • Guarda el registro diario de mis gastos
  • Se siente un poco raro hablarle así a uno mismo, pero tiene la ventaja de no tener que sacar el teléfono para hacer algo

Panel de control

  • Creé un dashboard para ver toda la información ingresada de esta forma
  • Hice My Journal para registrar automáticamente qué hice durante el día

Información pasiva - todavía en desarrollo

  • RELATIONSHIP THERMOMETER: termómetro de relaciones
  • SENTIMENT ANALYS: análisis de sentimiento
  • TOTAL RECALL: buscar todo lo que he dicho sobre un tema específico y también lo que pensaba sobre ese tema en un momento determinado

Conclusión preliminar

  • Se necesita audio + contexto
  • El potencial que se obtiene con esto es enorme, tanto para bien como para mal
    • Positivo: memoria perfecta, psicólogo/coach personal, mi clon virtual
    • Negativo: que todo eso esté en manos de otras personas
  • La diferencia entre una utopía y una distopía es quién puede acceder a esa información

3 comentarios

 
budlebee 2022-11-17

"La diferencia entre una utopía y una distopía es quién puede acceder a esa información". Buena frase.

 
nicewook 2022-11-17

Es atractivo. Parece bastante posible que se haga realidad.
También podrían existir contenidos para compartir una vida cotidiana ejemplar de vez en cuando, como un vlog.

 
xguru 2022-11-17

El autor lo publicó directamente en HN y también respondió comentarios https://news.ycombinator.com/item?id=33608437
También incluye el enlace de AliExpress del micrófono que usó jaja

Whisper - sistema multilingüe de reconocimiento de voz (ASR) que OpenAI publicó como código abierto