Ha llegado la era del almacenamiento de datos personales

(blog.muni.town)

10 puntos por GN⁺ 2025-10-06 | 1 comentarios | Compartir por WhatsApp

El concepto de almacenamiento de datos centrado en el usuario propuesto por el creador de la web, Tim Berners-Lee, se está haciendo realidad
Su idea inicial, el protocolo Solid, busca una estructura en la que las personas sean dueñas directas de sus datos y las aplicaciones accedan a ellos solo con permiso del usuario
Recientemente, el protocolo AT de Bluesky también ha evolucionado en la misma dirección, implementando una web social descentralizada que almacena los datos en servidores personales (PDS)
Este tipo de almacenamiento personal de datos va más allá de la implementación técnica y se está expandiendo hacia estructuras propiedad y gestionadas por la ciudadanía en forma de cooperativas de datos (Data Coop)
En última instancia, esto puede verse como un movimiento para devolver la web al espacio personal, un intento de reconfigurar de raíz la estructura de internet dependiente de plataformas

La visión de Tim Berners-Lee: Socially Aware Cloud Storage

En 2009, Berners-Lee propuso “Socially Aware Cloud Storage”, una especificación web diseñada para que las aplicaciones funcionen sobre una capa de almacenamiento independiente
- Los usuarios se gestionan mediante identificadores globales basados en URI, y el control de acceso se realiza de forma estandarizada
- Los repositorios de datos se separan de las aplicaciones y se definen como recursos universales e intercambiables

Aparición y evolución del protocolo Solid

En 2015, Tim Berners-Lee consiguió financiamiento para desarrollar el protocolo Solid y llevó a cabo investigación en el MIT
- El objetivo de Solid es construir una arquitectura web que devuelva la propiedad de los datos a las personas y permita cambiar libremente entre aplicaciones
- Los usuarios administran sus datos en un solo lugar, y las apps deben solicitar acceso con el permiso del usuario
Solid evolucionó hasta convertirse en una especificación web oficial del W3C, pero todavía no ha alcanzado una adopción masiva
- Inrupt, cofundada por Berners-Lee, está comercializándolo principalmente en el mercado empresarial

El protocolo AT y los servidores personales de datos (PDS)

El protocolo AT (Atproto) desarrollado por el equipo de Bluesky es actualmente una red social abierta utilizada por más de 30 millones de personas
- Aunque su estructura técnica es distinta de Solid, comparte la misma filosofía de almacenamiento de datos con soberanía del usuario
- En el protocolo AT, los datos personales se almacenan en un Personal Data Server (PDS), similar al concepto de “Pod” en Solid
Los usuarios pueden usar su propio dominio como handle de internet para mantener una identidad independiente entre distintas redes sociales
- Ejemplo: una estructura en la que se usa un dominio personal como handle, como @alice.com

El auge de las cooperativas de datos (Data Co-op)

La mayoría de los usuarios comunes aún prefieren el almacenamiento institucional en la nube antes que una PC personal
Se está discutiendo una transición hacia una estructura de banco de datos de propiedad colectiva de sus miembros, similar al modelo de cooperativas de ahorro y crédito de la banca tradicional
- Esto aplica el modelo de credit union a los datos, con una gestión transparente centrada en sus miembros como elemento clave
De hecho, plataformas cooperativas de datos como social.coop, data.coop y cosocial.ca ya operan activamente dentro del ecosistema del fediverso
- El nuevo proyecto Northsky también se está preparando como una institución colectiva de datos basada en la red AT
Estas organizaciones no necesariamente tienen que ser cooperativas en el sentido legal, sino que abarcan cualquier forma de gestión de datos democrática y transparente

Un nuevo paradigma de soberanía de datos

Cuando los datos se almacenan en instituciones controladas por la ciudadanía, y no por empresas, cambia el foco del debate sobre la propiedad de los datos
- Ya no se trata de “qué datos podemos descargar”, sino de “qué datos puede copiar una plataforma desde nuestros servidores”
También está creciendo el intercambio técnico entre Solid y AT, y hay debates activos sobre interoperabilidad con estándares como ActivityPub
El almacenamiento de datos personales ya se ha expandido más allá de un protocolo específico, y los formatos de datos son convertibles y los protocolos intercambiables entre sí
Lo esencial es que, al controlar sus propios datos, las personas aseguran la libertad de restaurar su identidad digital incluso si una plataforma colapsa

Conclusión: devolver la web al espacio personal

El almacenamiento personal de datos no es solo una tecnología, sino un retorno a la filosofía original de internet
Estamos pasando de una web centrada en plataformas a una estructura donde las personas y las comunidades poseen y operan directamente sus datos
Los distintos intentos de Solid, AT y ActivityPub convergen todos en el mismo objetivo: devolver la web a las personas

Enlaces de referencia

1 comentarios

GN⁺ 2025-10-06

Opiniones en Hacker News

Participo en un proyecto FOSS llamado Blobcache
https://github.com/blobcache/blobcache
Creo que es totalmente distinto que el servidor almacene el estado de una aplicación a que tenga permisos para modificarlo o leer los datos
En el futuro, creo que los servidores deberían limitarse a guardar mis datos de forma segura, mientras que los clientes deberían volverse más inteligentes
Quiero una estructura donde, al usar una app, el estado cifrado E2E (de extremo a extremo) se reciba desde el servidor, se modifique y luego se vuelva a guardar en el servidor como nuevos datos cifrados
El servidor solo debería ser responsable de la durabilidad de los datos, y ni siquiera haría falta confiar en que realmente cumple bien ese rol
Blobcache ofrece una API para que servidores de almacenamiento “tontos” y clientes “inteligentes” hagan transacciones en un estado E2EE
Puedes instalar Blobcache y una VPN como Tailscale en hardware viejo para mover fácilmente datos entre otros dispositivos
La configuración es parecida a SSH: solo agregas una clave al archivo de configuración y ya tienes acceso
Desaparece la mayor parte de las molestias asociadas con usar almacenamiento
Estoy creando con Blobcache una herramienta de control de versiones E2EE estilo Git para el directorio home completo de una casa
https://github.com/gotvc/got
- La forma en que Peergos permite que las apps usen datos E2EE es muy parecida a Blobcache
  Me gustaría contactarlos porque creo que sería bueno colaborar
  https://peergos.org/posts/a-better-web
- También puede ser útil tener en cuenta que existe https://remotestorage.io/ como almacenamiento por usuario
Por lo que he leído, creo que este tipo de propuestas no pasan una prueba evolutiva
Para ejecutar una idea a gran escala, en vez de dibujar un objetivo lejano, hay que mejorar gradualmente la situación actual paso a paso
La situación actual ya está bastante cerca de un máximo local alto, así que quienes proponen nuevas formas de controlar la información solo han presentado métodos con costos o esfuerzos muy altos
No hace falta conocer todo el proceso, pero al menos los primeros dos intentos deberían ser mejores que la situación actual
En resumen, si al final quieres volar, primero tienes que evolucionar plumas
- Creo que una dirección realista de evolución sería la siguiente
  - Si usas Bluesky para chatear como reemplazo de Twitter, te familiarizas con el Fediverse y obtienes un PDS (servicio de datos personales)
  - Guardas la información de pago en tu PDS y al principio eso permite una nueva experiencia donde el cliente envía esos datos de pago
  - Luego, el siguiente paso natural sería que los comercios ofrezcan un token para tomar la información de pago desde mi PDS
    Para las primeras tiendas que lo adopten, eso reduce la carga de almacenar PCI/PII y les da un incentivo para implementarlo
  - A medida que más usuarios y comercios se acostumbren a este modelo, se extenderá la percepción de que controlar directamente tus propios datos es mejor que la UX incómoda actual, como no poder cancelar suscripciones
  - Si guardar información de pago en un PDS es tan fácil como guardarla en el navegador y además ofrece beneficios extra, aumentará la demanda y se acelerará la adopción
  - Si técnicamente los sitios pueden operar sin almacenar PII/PCI, entonces también sería realista aprobar leyes que prohíban ese almacenamiento
- En cada etapa se sentiría como una mejora frente al sistema actual
- Estoy de acuerdo con la idea de que no hace falta un gran cambio de una sola vez, sino mejoras perceptibles en cada etapa
  Desde la perspectiva de un usuario común, ¿realmente sentiría que la UX mejoró solo por “poseer mis datos”?
  Creo que podría ser posible si eso viene acompañado de menos publicidad y de productos que de verdad prioricen al usuario
  Me preocupa que haga falta mucho trabajo que no genere mucho dinero, pero aun así trato de mantenerme optimista
- Hoy, el 99.9% de los usuarios de BlueSky solo usa el servicio BlueSky, pero BlueSky tiene un Personal Data Service (PDS) para cada usuario
  En cualquier momento puedes sacar tus datos de BlueSky y moverlos a otro lado, y recientemente también se hizo posible volver a moverlos a BlueSky
  En tu propio PDS puedes guardar los datos que quieras, por ejemplo datos de git desde https://tangled.org, historial de escucha musical desde https://teal.fm, blogs desde https://leaflet.pub, etc.
  Están creciendo rápidamente los casos de personas que operan su propio PDS o lo alojan a nivel comunitario
  También están avanzando los servidores de retransmisión que agregan y conectan datos de PDS, y aunque operar la capa de agregación que proporciona conectividad total a la red es más difícil, está mejorando poco a poco
  En comparación con la estructura anterior, definitivamente se puede llamar una innovación, y la pasión visible de los desarrolladores transmite mucha fuerza
  Gracias a la separación de la arquitectura, es posible avanzar en muchos ámbitos distintos, y la base es sólida, así que la escalabilidad también es alta
  Da la impresión de que realmente se están llevando a cabo experimentos evolutivos, y eso entusiasma mucho
Me encanta la idea del almacenamiento de datos personales y ojalá se vuelva la opción por defecto
Pero hay un problema que quizá ni siquiera sea resoluble técnicamente
Por ejemplo, en este texto no se menciona el “schema”, pero el esquema es un factor enorme que realmente obstaculiza la portabilidad de datos
Incluso en una app CRUD simple, he vivido en carne propia lo difícil que es cambiar el formato de los campos
Puedes exportar tus datos desde Google o Facebook, pero reproducir cómo se veían y usaban esos datos en la app original es tan difícil que casi implica clonar toda la UI original, y si el esquema del servicio original cambia, aparecen problemas de renderizado o integración, e incluso pérdida de datos
En silos de datos independientes puedes cambiar el formato libremente, pero si varios almacenes cambian sus esquemas de datos por separado, al final sincronizarlos se vuelve casi imposible y el riesgo de pérdida de datos es alto
Además, la autorización y la verificación de identidad por esquema también son un problema muy molesto
Por ejemplo, hay que restringir que A solo pueda ver ciertos campos, pero durante la sincronización entre varios servidores algunos no saben quién es userA, así que tratan esos datos como si no existieran
En sistemas distribuidos, donde la confianza, la identidad y los procesos de auditoría también están distribuidos, el control de acceso fino es un problema realmente difícil
Viendo los posts destacados de Hacker News últimamente, circulan muchas ideas de “recuperemos la web” o “revivamos el autoalojamiento, la federación y demás como en los 90”
En la práctica, siento que no cambia nada y que todo empeora poco a poco, mientras siguen apareciendo generaciones que no conocieron la sensibilidad de la internet de los 90 ni la de antes de los dispositivos móviles
Hoy, para registrarte en cualquier cosa, solo se multiplican copias innecesarias de información personal en innumerables bases de datos de todo el mundo, y al final lo de siempre: hackeos, mal uso, venta o abandono
Ni siquiera sé si hay una solución, y a veces hasta da la impresión de que sería más fácil darle la vuelta al planeta
- En Europa, este problema de los datos personales está prácticamente resuelto en gran medida
  Como la ley sí tiene efectos reales, las empresas de verdad no pueden almacenar ni vender datos ilegalmente así como así
  Pero parece que la gente solo ve lo superficial, como los banners de cookies, y no percibe bien los logros reales
  En la práctica, Europa está liderando cambios en el mundo digital que mejoran la calidad de vida de los ciudadanos
  Por ejemplo, bienes públicos como las transferencias bancarias inmediatas sin comisiones
- Si incluso nosotros, que sí vivimos una época distinta, nos rendimos porque “nada cambia”, entonces de verdad nunca habrá cambios
  Viéndolo en la práctica, hoy es más fácil y simple que nunca construir alternativas open source y autoalojadas
  La gente característica que estaba en línea en los 90 sigue existiendo, y continúa activa en internet al estilo de antes
  El resultado de que internet sea hoy mucho más simple y accesible es que mucha gente común, que no lo vive como algo divertido o mágico, puede usarla fácilmente
  Me da pena esa actitud de hablar siempre del entorno online actual como si todo fuera malo, porque termina menospreciando servicios y comunidades valiosas que aún quedan
  Los servicios existentes quizá no sean sofisticados ni cool, pero siguen ahí y siguen cumpliendo una función
- Respecto a la preocupación de no saber qué hacer con la copia indiscriminada de datos personales, su abandono, hackeo o venta
  creo que solo habrá posibilidades de mejora cuando los datos se perciban más bien como un “pasivo peligroso” para su dueño
  Por ejemplo, tendría que volverse común algo como “Megabank quiebra por filtración de datos y encarcelan a sus ejecutivos” para que cambie por completo la actitud hacia la gestión de datos
  Mientras siga siendo algo como “otra filtración de datos, ¡esta vez con LifeLock gratis!”, será difícil cambiar la percepción
- La razón por la que el ejemplo mencionado no es solo una fantasía simple es que Bluesky y AT-net ya son redes que están funcionando de verdad, y tienen impacto en el mundo real hasta el punto de recibir amenazas de varios estados autoritarios
- La solución más convincente y razonable que he visto para este problema es Solid, el estándar creado por Tim Berners Lee (el creador de la web)
  [https://en.wikipedia.org/wiki/Solid_(web_decentralization_project)](https://en.wikipedia.org/wiki/Solid_(web_decentralization_pr...)
  Creo que con eso ya tiene legitimidad suficiente para cambiar la estructura de datos de internet, y la tecnología de Solid en sí también es bastante sólida
  Lo lamentable es que Solid no haya logrado difundirse ampliamente
  Probablemente porque el entorno web existente es demasiado grande y porque la mayor parte del stack tecnológico actual no está construido bajo la premisa de una “verdadera propiedad de los datos”
  No se trata solo de cambiar unas cuantas librerías; hay que repensar de raíz la forma de desarrollar y procesar datos, así que hay una barrera importante de entrada para adoptarlo
  El equipo de Solid entiende bien estos problemas y ha venido creando buenas herramientas y librerías para que implementarlo en proyectos nuevos sea gradualmente más fácil
  Por eso tengo bastante expectativa sobre el futuro y la escalabilidad de Solid
No estoy de acuerdo con la idea de que “en vez de estar dispersos entre varias empresas o sitios, mis datos estén en un solo lugar bajo mi control”
En la realidad, en el momento en que subes datos a un sitio, ellos pueden copiarlos o venderlos como quieran, y no existe una forma real de impedirlo
Al final, me parece que no es más que trasladar al usuario, en vez de al sitio, la responsabilidad de la movilidad e interoperabilidad de los datos, además del bloqueo y la gestión del spam
No siento que eso resuelva el problema de fondo de la privacidad o de “controlar directamente con quién comparto mi información”
Aunque yo solo le entregue mis datos al sitio A y no al recolector de datos B, no hay ninguna razón por la que A no pueda vendérselos a B
En la práctica, no sería distinto de lo que ya pasa hoy
Para mantener los datos en un solo lugar, tendrías que no compartir absolutamente ningún dato con sitios o servicios externos, pero eso no es realista
- No hay forma de impedirlo, pero al menos lo que se lleva un tercero es una “copia”
  La propiedad de mis datos sigue siendo mía y es más fácil acceder a ellos, compartirlos, respaldarlos y analizarlos desde un solo lugar
  Eso tiene un gran efecto para liberar a los datos del lock-in
  Tampoco es imposible determinar si un tercero vendió mis datos y demandarlo, y además se obligaría a que los formatos de datos no fueran propietarios
  Me parece mucho mejor que el sistema actual
- Si realmente pudiera afirmarse con claridad cuál es el original y la propiedad de mis datos, creo que sí se podría prohibir su reventa
  En Europa (UE), de hecho ya existe el derecho a exigir a una empresa la “eliminación de datos personales”,
  y este tipo de derechos es más fácil de reclamar cuanto más claramente se defina que los datos “son míos”
- Los datos recientes valen muchísimo más que los datos antiguos
  Yo mismo podría gestionar a quién le entrego qué datos y con qué propósito, e incluso activar y desactivar el acceso cuando lo necesite
  La reventa de datos debería considerarse ilegal en principio
  Así como existe el sentido común de que un abogado o un médico jamás deberían vender mi información, creo que la misma ley debería aplicarse a cualquiera que trate datos personales
El deseo de autoalojar todo siempre ha existido
Pero esta tendencia se expandió porque a las empresas les resulta más fácil centralizar, y además pueden monetizar los datos desde ahí
- La verdad es que para los usuarios es muchísimo más fácil usar grandes servicios como Facebook, instagram o gmail que alojar algo por su cuenta, y como todos están ahí, también es más cómodo quedarse ahí
  Creo que todavía no han aparecido suficientes soluciones descentralizadas realmente accesibles para el usuario común, y los incentivos reales también son débiles
  Si no se resuelve esa accesibilidad de fondo, será difícil cambiar la tendencia
- Por mi experiencia con Plex, siento que la gente tiene mucho más deseo de autoalojar de lo que creemos, aunque le cuesta ordenar claramente esa idea
  Plex no es una solución totalmente autoalojada, pero está mucho más cerca de eso que servicios como Netflix, y últimamente se ve cada vez más gente sin grandes habilidades de IT intentando montar su propio servidor Plex
  Muchas veces no lo hacen solo para ver películas gratis, sino por sus hijos
  Al curar directamente el contenido, pueden controlar qué ven sus hijos y eso da mucha más tranquilidad
  Se parece a esa sensación de calma que daban los tiempos en que los padres limitaban los canales de TV cuando uno era niño
  Hoy mucha gente siente que internet es demasiado caótica y llena de riesgos, y cada vez más padres quieren recuperar aunque sea un poco de control con sus propias manos
  Tengo curiosidad por ver si estas ideas podrán conectarse algún día con una corriente más útil
Qué bueno que alguien mencionó Opera Unite
Era una idea revolucionaria: cualquiera podía crear fácilmente un sitio estático simple usando solo el navegador, sin necesidad de conocimientos especiales
Si esto hubiera triunfado y se hubiera consolidado una cultura donde la gente compartiera su contenido de forma autónoma, hoy tendríamos una internet mucho más sana en lugar de las redes sociales comerciales y manipuladas que abundan ahora
Me gusta mucho el concepto de PDS (servicio de datos personales)
Pero creo que la comunidad debería tratar como prioridad más alta problemas como las granjas de contenido, el spam y la claridad del origen de las fuentes
Sin estas protecciones, actores maliciosos pueden derrumbar fácilmente una estructura federada
Basta con mirar la red de correo electrónico (SMTP) para entender la gravedad de este problema
Las apps verticalmente integradas son mucho más baratas de operar
Instagram solo almacena una parte de las fotos, pero es muy rentable
En cambio, servicios de cuenta como iCloud casi no tienen API web y en la práctica son solo para dispositivos Apple, pero aun así la gente paga con gusto por ellos (aunque sea para evitar tener que comprar un iPhone más grande)
Y aun así no hay tantas apps que funcionen de manera independiente sobre un sistema de archivos web porque
1. Amazon fija los costos de tráfico/ancho de banda muchísimo más altos que los de almacenamiento, así que si quieres acceder directamente a tus datos, el uso resulta caro a menos que todo esté físicamente en el mismo centro de datos
2. Hay una gran brecha de seguridad y usabilidad entre seleccionar una sola foto y dar acceso a toda una carpeta de Dropbox
  Al final, cuando realmente usas estas soluciones genéricas, muchas resultan demasiado lentas o difíciles de usar en la práctica por problemas de velocidad o de costo
  Si además ya estás pagando dos veces por el almacenamiento, son poquísimos los usuarios dispuestos a asumir también un costo adicional de ancho de banda
Me cuesta estar de acuerdo con la afirmación de que “cuando los datos se almacenan en organizaciones centradas en las personas y no en empresas, cambia el discurso sobre la propiedad de los datos”
Las empresas también son organizaciones dirigidas por personas
Son estructuras controladas por accionistas a través de una junta directiva; no las manejan extraterrestres ni el sistema se mueve por sí solo
Tal vez lo que se quería decir era una oposición a empresas con fines de lucro donde los clientes del servicio no pueden votar directamente sobre la gestión
La palabra “empresa” a veces se usa como si significara “fuerzas del mal”, pero al final no deja de ser una organización propiedad de un pequeño grupo de personas
Y además resulta curioso que el ejemplo “@alice.com” use precisamente .com, que irónicamente representa el ámbito comercial
https://en.wikipedia.org/wiki/Institution#Examples
https://en.wikipedia.org/wiki/.com
- La verdad es que hoy .com se siente más como un dominio “oficial, principal, representativo” que como algo comercial
  Incluso en sitios no comerciales, muchas veces lo primero que se intenta conseguir es una dirección .com

Ha llegado la era del almacenamiento de datos personales

La visión de Tim Berners-Lee: Socially Aware Cloud Storage

Aparición y evolución del protocolo Solid

El protocolo AT y los servidores personales de datos (PDS)

El auge de las cooperativas de datos (Data Co-op)

Un nuevo paradigma de soberanía de datos

Conclusión: devolver la web al espacio personal

Enlaces de referencia

Lecturas relacionadas

1 comentarios

Opiniones en Hacker News