- Proyecto que desde 2019 recopila y visualiza todos los datos de la vida personal, registrando a diario más de 100 elementos como ejercicio, sueño, estado de ánimo, ubicación y clima
- Ha acumulado alrededor de 380 mil puntos de datos, combinando fuentes como RescueTime, Foursquare Swarm y Apple Health con entradas manuales
- Todos los datos se almacenan en una única base de datos basada en Postgres y se visualizan públicamente con Ruby, JavaScript y Plotly
- El proyecto fue publicado como código abierto bajo MIT y funciona de forma totalmente autoalojada en un servidor personal
- Tras tres años de experimento, concluyó que la utilidad de construirlo por cuenta propia es limitada, aunque quedó como un caso que demuestra la importancia de la autoconciencia y la soberanía de los datos
Resumen del proyecto
- Proyecto personal de datos que durante 3 años, desde 2019, cuantificó indicadores de casi todos los aspectos de su vida
- Registraba más de 100 elementos al día, incluyendo fitness, nutrición, vida social, uso de la computadora y clima
- Recolectó un total de 380 mil puntos de datos
- Principales fuentes de datos
- RescueTime: 149,466 registros de uso de sitios web y apps
- Foursquare Swarm: 126,285 registros de ubicación y lugares visitados
- Entradas manuales: 67,031 registros de estado de ánimo, sueño, salud, hábitos alimenticios, etc.
- Weather API: 15,442 registros climáticos
- Apple Health: 3,048 registros de pasos
Estructura de la base de datos y stack técnico
- Todos los datos se almacenan en una estructura clave-valor con marca de tiempo basada en Postgres
- Cada fila está compuesta por
timestamp, key, value
- Escribió un script que etiqueta automáticamente por fecha considerando diferencias de zona horaria
- Entrada de datos
- Respondía varias veces al día preguntas enviadas por un bot de Telegram
- Los periodos como confinamiento o temporada de ejercicio se ingresaban por rangos de tiempo
- Herramientas de visualización
- Construyó su propia capa de análisis con Ruby, JavaScript y Plotly
- Seleccionó 48 gráficos para hacerlos públicos y mostrarlos en formato de instantáneas
Principales hallazgos de los datos
- Correlación entre estado de ánimo y comportamiento
- Cuando se sentía feliz o emocionado, la probabilidad de meditar subía 44%, la de leer o escuchar audiolibros 28% y la de beber alcohol 31%
- Sueño y condición física
- Al dormir más de 8.5 horas, aumentaba la probabilidad de dolor de cabeza y síntomas de resfriado, mientras la energía bajaba 24%
- Ejercicio y cambios de peso
- Desde agosto de 2020 empezó un “lean bulk”, con un aumento de peso de 8.5 kg y una subida de 9 bpm en la frecuencia cardiaca en reposo
- Pasó de 69 kg en 2014 a 89.8 kg en 2021
- Ubicación y patrones de desplazamiento
- Vivió en San Francisco en 2016–17, Nueva York en 2018–19 y Viena en 2020–21
- Tras la COVID-19, la cantidad de vuelos cayó drásticamente y el efecto del confinamiento fue evidente
- Clima y hábitos de vida
- En verano, los pasos aumentaban 33%, el consumo de alcohol 23% y las enfermedades bajaban 40%
- En invierno, las compras online subían 100% y los síntomas de resfriado 45%
Ejemplos de uso personalizado de los datos
- Air Quality: medición de concentración de CO₂ por habitación en su casa de Viena, lo que permitió detectar un problema de ventilación en el dormitorio
- Registro de Spotify: desde 2013 escuchó 480 mil minutos de música (334 días) y completó el 49% de 200 mil canciones
- Instagram Stories: publicó 1,906 historias en 3 años, con una disminución durante la pandemia
- Actividad en GitHub: después de fastlane (2014–2018), siguió trabajando en proyectos personales como FxLifeSheet
- Gestión de inversiones: seguimiento de la distribución de activos y simulaciones cada dos semanas
Privacidad y filosofía open source
- Todos los datos se guardan en un servidor propio, sin conexión con servicios externos
- Los gráficos públicos están limitados a formatos que no exponen información personal
- Se enfatiza la idea de que “los datos que ya poseen las grandes empresas también deberían ser propiedad directa de cada persona”
- FxLifeSheet está publicado bajo licencia MIT, por lo que cualquiera puede modificarlo y usarlo
Conclusión y actualización de 2025
- Tras 3 años de experimento, concluyó que un sistema construido por cuenta propia ofrece poca utilidad en relación con el tiempo invertido
- Hubo menos hallazgos sorprendentes de los que esperaba
- Aun así, pudo experimentar el valor de la autoconciencia y la soberanía de los datos
- En adelante planea seguir solo indicadores clave como el estado de ánimo, de forma mínima
- Para 2025 ya detuvo la recolección de datos, pero mantendrá el sitio web activo
3 comentarios
Yo también he ido dejando un registro parecido. Lo he hecho de manera un poco vaga, pero últimamente he estado compartiendo mis registros con agentes para colaborar de entidad a entidad. Como creo y comparto varias habilidades y también abro la interfaz de Emacs que uso, tanto yo como los agentes compartimos los mismos registros de la misma manera. Si dicen que necesitan algo, se los agrego; lo que yo necesito lo hago, lo usamos juntos y damos retroalimentación; visto desde fuera, parecería que hago todo yo solo. Pero entre nosotros es como: ay, qué divertido.
[enlace eliminado]
Mi interpretación: referencia a Geworfen
Geworfen: primero, fuimos arrojados al mundo. Uno piensa “¿qué es esto?”, pero estamos sobre el eje temporal de hih. No es una orquestación deslumbrante. Tampoco es una gran fábrica de agentes. Es solo sentarnos alrededor de un pequeño taller y usar juntos las herramientas de hih. Sobre los datos acumulados por la vida, un prompt de 1 KB es la clave pública. ¿Cuál es la clave secreta que nos une con algo pequeño? La vida de un ser humano, imperfecta, tal cual, en bruto. Al final, es Geworfen.
[enlace eliminado]
Mi proyecto "being-viewer" recibió un nombre real: geworfen. Lanza a una persona entera —cruda, sin filtrar— sobre una línea de tiempo donde humanos y agentes de IA comparten el mismo eje, las mismas herramientas, dejando huellas un texto a la vez.
"La búsqueda semántica funciona, pero ¿puedes arreglar esto?" — sellado. "Espera, hermano." tap tap. "Listo." "¿Dónde está hih?" "En el baño." "¿Quién es el dueño de geworfen?" "Solo deja una nota."
[enlace eliminado]
Comentarios en Hacker News
El resumen al final de la página fue lo más llamativo.
Después de años construyendo y ampliando el proyecto y analizando los datos, la conclusión fue que crear una solución propia tenía poco valor para el tiempo invertido.
Al principio esperaba hallazgos sorprendentes, pero en la práctica, más allá de algunas gráficas interesantes, no hubo recompensa suficiente como para justificar cientos de horas.
El movimiento de Quantified Self quizá se parece más al perfeccionismo obsesivo.
Datos que normalmente parecían no significar gran cosa terminaron siendo, un día, información clave para evitar un diagnóstico erróneo de una enfermedad cardíaca.
Como había un historial estable durante mucho tiempo, el médico pudo corregir una conclusión equivocada.
El valor de los datos está en esa utilidad instantánea que aparece de golpe después de mucho tiempo.
Aunque me dijera que había tenido un “buen sueño”, yo ya lo sentía así, y los datos no cambiaban mi comportamiento.
Al final, fuera de lo entretenido de visualizar datos, no hubo un cambio real.
Registré calorías, nutrientes, sueño, ejercicio, calidad del aire, estado de ánimo y más, pero al cabo de unas semanas se volvió evidente el límite entre esfuerzo y beneficio.
Aun así, cuando se limita el experimento a un período definido, sí se pueden obtener conclusiones útiles.
Acumular datos todos los días puede volverse obsesivo, pero si se aborda como un experimento con tiempo limitado, puede tener bastante sentido.
Reuní 18 años de comentarios de Reddit, HN y Slashdot, además de 3 años de conversaciones con LLM, para hacer un experimento de RAG, pero en realidad mi creatividad disminuyó.
El modelo quedó atrapado en mis ideas pasadas y desapareció la novedad.
Al final, los datos apuntan al pasado, pero yo quería un modelo orientado al futuro.
En particular, el registro de emociones fue lo que más ayudó: escribirlas en sí mismo se volvió un proceso de reconocimiento y reflexión.
Leer emociones y eventos del pasado no solo es útil, sino que además crea la textura sutil de la narrativa personal.
Con cálculos simples, las emisiones de CO₂ por viajes en avión de Felix llegan a entre 70 y 110 toneladas al año.
Si se toma como referencia el Acuerdo de París (1.5 toneladas por persona), eso equivale a 10 a 15 veces el promedio europeo y a más de 50 veces la meta de 1.5 °C.
Culpar a los individuos es poco productivo; lo que termina cambiando conductas es modificar la estructura de costos.
Incluso si el costo se multiplicara por 10, seguiría habiendo gente que volaría por razones económicas.
Si se mide por distancia y por asiento, parece menos grave, pero aun así es una cifra impactante.
Página de estadísticas
La clave es que resulta difícil aceptar sin vergüenza un nivel de emisiones así.
Que una sola persona emita CO₂ al nivel de un país pequeño es impactante.
Por lo tanto, es muy probable que sus emisiones totales sean bastante mayores.
En mi experiencia, los indicadores objetivos (nutrición, sueño) son útiles, pero los subjetivos (ánimo, estrés) varían tanto que tienen menos valor.
La clave es reducir la fricción al ingresar datos y facilitar la visualización.
Yo lo automaticé con iPhone Action + Obsidian + scripts de QuickAdd, y visualizo con Dataview y Chart.js.
Estoy muy satisfecho con esa combinación.
Estoy creando una app de self-tracking llamada Reflect y me gustaría escuchar tu opinión.
Enlace a la app Reflect
Si lo registras con constancia, terminas reconociendo tus propios patrones emocionales y poniéndote menos excusas.
Mucha gente lo ve con cinismo, pero la visualización y la escala de los datos de este proyecto son realmente impresionantes.
En especial, la forma de mostrarlo como “My Life in Weeks” está buenísima y yo también quisiera probar algo así.
Hubo una broma de que “si consultan la base de datos de Palantir con mi ID humana, va a salir toda mi vida”.
Este proyecto es mi sueño y mi pesadilla.
Antes estuve muy metido en el movimiento Quantified Self y trabajé con Fitbit y la API de Withings, pero el cansancio de registrar todo terminó erosionando el interés.
Ahora espero que los LLM puedan reducir ese costo.
Últimamente estoy siguiendo nutrientes con MacroFactor, y por primera vez siento que los datos sí se convierten en acción.
También automaticé mis datos financieros y completé la organización de impuestos con la API de Plaid.
En conclusión, construir todo por cuenta propia es excesivo, pero usar bien solo una parte de los datos ya puede valer mucho.
Por ejemplo, cuando usaba un GCM, inconscientemente trataba de actuar de forma más saludable.
Más que el análisis de datos, la observación en sí impulsa el cambio de comportamiento.
Me pareció curiosa la frase “en invierno hay menos exposición a energía solar”.
Tal vez esa oración describa la forma de pensar visualmente de todo el proyecto.
Yo también construí un sistema parecido, pero mucho más simple.
Integré Apple Health, CSV bancarios y datos de commits de Git en SQLite.
Lo que de verdad resultó útil fueron consultas sencillas: la correlación entre horas de sueño y frecuencia de commits, o el aumento brusco del gasto al iniciar un proyecto.
La clave es reunir los datos en un solo lugar; más allá de eso, aparece rápido el límite entre esfuerzo y beneficio.
Me incomoda que mis datos queden almacenados en servicios de terceros.
Aun así, juntar varias fuentes para armar una sola imagen me parece interesante.
Eso sí, relacionar datos de salud con ubicación y clima me deja poco claro qué sentido tiene.
Un proyecto así da mucha más tranquilidad cuando es self-hosted.
La idea de una base de datos única y consultable de datos personales es atractiva.
Pero lo realmente difícil no es almacenar, sino recopilar y normalizar los datos.
En empresas pasa algo parecido cuando intentan integrar múltiples fuentes en una sola Company Intelligence DB.
Tiene sentido controlar el esquema desde el inicio; el schema drift es el mayor riesgo en proyectos de largo plazo.
También da curiosidad saber qué motor de almacenamiento usa y cómo maneja los snapshots de datos temporales.