29 puntos por GN⁺ 2026-01-06 | 1 comentarios | Compartir por WhatsApp
  • 2025 fue un año resumido por el fortalecimiento del dominio de PostgreSQL, la expansión del estándar MCP, grandes fusiones y adquisiciones, el reinicio de la competencia entre formatos de archivo y el ascenso de Larry Ellison
  • PostgreSQL se consolidó como el DBaaS clave de las principales empresas cloud, y surgieron nuevos proyectos distribuidos (Multigres, Neki, PgDog)
  • Todos los DBMS principales adoptaron el Model Context Protocol (MCP) de Anthropic, iniciando de lleno la integración entre LLM y bases de datos
  • MongoDB presentó una demanda relacionada con la replicación de API contra FerretDB, y en el área de formatos de archivo se intensificó la competencia por reemplazar a Parquet
  • Con una intensa actividad de adquisiciones, cierres y levantamiento de capital en toda la industria, 2025 fue evaluado como un año en el que se aceleraron la reconfiguración y la concentración de la industria de bases de datos

Expansión continua de PostgreSQL

  • PostgreSQL 18 se publicó en noviembre de 2025 e introdujo un subsistema de almacenamiento de I/O asíncrono y la función skip scan
    • Reduce la dependencia de la caché de páginas del sistema operativo y mejora el aprovechamiento de índices de múltiples claves
  • Databricks adquirió Neon por 1,000 millones de dólares, y Snowflake compró CrunchyData por 250 millones de dólares
    • Microsoft lanzó HorizonDB, por lo que todas las grandes empresas cloud pasaron a tener servicios basados en PostgreSQL
  • Aparecieron nuevos proyectos de PostgreSQL distribuido como Multigres de Supabase, Neki de PlanetScale y PgDog
    • Supabase incorporó a Sugu, cofundador de Vitess, para liderar el desarrollo de middleware de sharding
  • Entre los servicios independientes de PostgreSQL estuvieron activos Supabase, YugabyteDB, TigerData, PlanetScale, Xata, PgEdge y Nile
    • Algunas startups, como Hydra y PostgresML, cerraron en 2025
  • La competencia de M&A y la evolución tecnológica centradas en PostgreSQL actuaron como motor clave de la industria

Expansión total de MCP (Model Context Protocol)

  • En 2025, todos los DBMS principales pasaron a ser compatibles con el estándar MCP de Anthropic
    • MCP es una interfaz basada en JSON-RPC que permite a los LLM interactuar con bases de datos
  • Después de que OpenAI anunciara soporte para MCP en marzo de 2025, sistemas importantes como ClickHouse, Snowflake, Oracle y MongoDB lanzaron servidores MCP
    • Los servicios basados en PostgreSQL también ofrecieron sus propios servidores MCP (Supabase, Timescale, Xata, etc.)
  • Los servidores MCP acceden a la base de datos por solicitud individual y no admiten joins entre bases de datos heterogéneas
  • Neon, mediante su función de data branching, quedó a cargo del 80% de las bases de datos generadas por agentes de IA
  • En materia de seguridad, se subrayó la necesidad de mínimo privilegio y mecanismos automáticos de protección
    • Algunos sistemas ofrecen protecciones básicas como restricciones de solo lectura, timeout de consultas y límites de resultados

Disputa legal entre MongoDB y FerretDB

  • MongoDB presentó en 2025 una demanda por infracción de patentes, copyright y marca registrada contra FerretDB
    • FerretDB es un proxy middleware que traduce consultas de MongoDB a PostgreSQL, y se señaló como problemática la expresión “drop-in replacement”
  • Microsoft donó a la Linux Foundation DocumentDB, un proyecto open source compatible con MongoDB
    • Amazon, Yugabyte y otros también participaron en el proyecto
  • Frente a la afirmación de MongoDB de que “pionerizó las bases de datos no relacionales”, se señaló que ya existían sistemas previos como IDS e IMS en la década de 1960
  • También se mencionó la polémica por confusión de marca debido a que el nombre inicial de FerretDB era “MangoDB”

Reinicio de la competencia entre formatos de archivo

  • En 2025 aparecieron cinco nuevos formatos de archivo open source que desafían el dominio de Parquet
    • FastLanes (CWI), F3 (CMU + Universidad de Tsinghua), Vortex (SpiralDB), AnyBlox (investigadores de Alemania), Amudai (Microsoft)
  • Vortex de SpiralDB recibió atención al ser donado a la Linux Foundation, y AnyBlox ganó el premio al mejor paper de VLDB
  • El equipo de desarrollo de Parquet respondió impulsando una modernización de la especificación
  • El formato F3, en el que participó Pavlo, busca resolver problemas de interoperabilidad con un decodificador integrado basado en WASM
  • Es muy probable que la próxima competencia se traslade a la compatibilidad con GPU

Tendencias de adquisiciones, inversión y cierres

  • Principales adquisiciones de 2025
    • IBM adquirió DataStax y Confluent; Databricks adquirió Neon, Tecton y Mooncake
    • Snowflake adquirió CrunchyData y Datometry; Salesforce adquirió Informatica; Nvidia adquirió HeavyDB
    • Fivetran y dbt Labs se fusionaron sorpresivamente, reconfigurándose como una plataforma integrada de ETL
  • Principales rondas de inversión
    • Databricks (4,000 millones y 1,000 millones de dólares), ClickHouse (350 millones de dólares), Supabase (200 millones y 100 millones de dólares), Timescale (110 millones de dólares), etc.
  • Casos de cierre
    • Fauna, PostgresML, Hydra, MyScaleDB, Voltron Data, Apache Derby, entre otros
    • El cierre del laboratorio IBM Research Almaden fue mencionado como un punto final simbólico para la investigación en bases de datos
  • Pavlo señaló las limitaciones comerciales de las bases de datos basadas en GPU y enfatizó la madurez de los motores OLAP basados en CPU y la competencia centrada en la experiencia de usuario

El ‘mejor año’ de Larry Ellison

  • En 2025, Larry Ellison, fundador de Oracle, se convirtió en la persona más rica del mundo (393,000 millones de dólares)
    • Su fortuna se disparó por el alza de las acciones de Oracle y la inversión en centros de datos para IA
  • Oracle participó en grandes operaciones como la adquisición de TikTok US y el intento de adquisición de Warner Bros por parte de Paramount
  • Pavlo describe la trayectoria de Ellison como “el símbolo de una figura que conquistó el mundo con bases de datos”
    • A pesar de las críticas, la influencia de Oracle y la presencia de Ellison siguen siendo enormes

Conclusión

  • La industria de bases de datos en 2025 se resume en una reconfiguración centrada en PostgreSQL, la aceleración de la integración de IA y LLM y la polarización entre grandes M&A y cierres
  • Pavlo enfatiza que tanto investigadores como la industria deben concentrarse en seguridad, estandarización y automatización operativa
  • Finalmente, cierra el texto anticipando el lanzamiento de Sydht.ai, una nueva startup del equipo de investigación de CMU

1 comentarios

 
GN⁺ 2026-01-06
Comentarios de Hacker News
  • Definitivamente hay que ver el estilo de enseñanza tan particular del CMU DB Group
    Se puede ver en los resultados de búsqueda de YouTube.
    En especial, la intro gangsta y el set de DJ fueron realmente impresionantes.
    También recuerdo un video de alguien durmiéndose en el piso durante una clase. Me dio más curiosidad por el historial y contexto de Andy

    • Si eres fan de Wu-Tang y del hip-hop, seguro lo entiendes. Esa intro estuvo increíble
    • Me confunde si “Intro to Database Systems” de CMU es a nivel licenciatura o si es un curso avanzado sobre estructuras internas. Como principiante en bases de datos, quiero encontrar un buen curso de introducción
    • Le agregué “https://” al enlace para que se pudiera hacer clic
  • Me da pena que en los reviews de los últimos años no se hayan mencionado las bases de datos inmutables o bi-temporales
    Este tipo de DB son especialmente útiles en la industria fintech.
    Algunos ejemplos son XTDB v2 (2025) y Datomic Free (2023)

    • Hace 5 semanas en CMU dieron un seminario técnico sobre XTDB.
      Me pregunto si basta con mencionarlo como “simplemente existe”
    • Con el tipo tstzrange de PostgreSQL y la extensión pg_bitemporal se puede llegar bastante lejos.
      Nosotros implementamos historial de cambios y función de undo con un sistema de logs de auditoría basado en row triggers.
      También movemos los logs a un almacenamiento separado para mantener backups offline
    • Cada vez se reconocen más las ventajas de las DB inmutables. No solo sirven para auditoría simple, también ofrecen lecturas concurrentes, replicación rápida, undo de transacciones y otras ventajas.
      Ahora mismo estoy desarrollando SQLite inmutablexitdb-java
    • Algunos están agregando temporalidad e inmutabilidad a los triple stores, porque xtdb y datomic son lentos para recorridos de grafos con SPARQL.
      Espero ver un triple store con soporte de viaje en el tiempo
    • Yo también dejé una opinión parecida en otro comentario
  • Las tendencias de bases de datos en 2025 se resumen en dos cosas
    1️⃣ mover todo a SQLite
    2️⃣ usar principalmente campos JSON
    SQLite es fácil de manejar gracias a su estructura de archivo único y a que no necesita daemon. Y con sus funciones JSON también da gusto trabajar datos flexibles

    • Desde mi punto de vista, ahora todo es DuckDB. Archivo único, soporte para muchos formatos, S3, Parquet, almacenamiento columnar, WASM... lo tiene todo
    • La verdad, a veces pienso: “¿de verdad hace falta una DB?”. SQLite queda en un punto intermedio entre una DB completa y un object storage hecho a mano.
      Te da una especie de API de acceso a objetos normalizada
    • Cuando SQLite no se usa en un entorno multiusuario, me pregunto cuánto aguanta si varias conexiones web intentan escribir al mismo tiempo
    • Antes existía la idea de que no había que usar SQLite en producción, pero parece que eso ya cambió
    • Para mí, la combinación ideal es “SQLite si se puede, PostgreSQL si hace falta, DuckDB para analítica y BigQuery para BI a gran escala”
  • Entiendo por qué Pavlo es escéptico con la seguridad de MCP. MCP tiene una filosofía centrada en exponer contexto, lo opuesto al principio de mínimo privilegio
    Si expones una DB por medio de este tipo de protocolo, no solo revelas los datos, sino también la complejidad del esquema al modelo.
    Al final, se siente como una reaparición de SQL injection — solo que esta vez la causa no es un usuario malicioso, sino las alucinaciones del modelo

    • Aprovechando que los LLM son stateless, construí un gateway de MCP que rastrea el origen del contexto de entrada y bloquea cambios de estado peligrosos.
      Está basado en el framework lethal trifecta de Simon Willison, y se puede ver en open-edison
    • Nadie va a usar una DB MCP con permisos de escritura en producción. Echarle la culpa al protocolo por eso no me parece justo
    • Me pregunto si de verdad había suficiente valor como para abandonar nuestros principios. Probablemente no sea más que otra versión de la mentalidad de “move fast, break things”
  • Siento que necesitamos movernos hacia las DB inmutables.
    Datomic es potente, pero es complejo y tiene una curva de aprendizaje pronunciada, e immudb todavía no parece lista para producción.
    Empiezan a aparecer problemas al pasar de unos cuantos cientos de miles de registros

  • Supabase está mostrando un crecimiento enorme.
    Incluso escuché que cerca del 70% de las startups de YC la están usando. Me pregunto si luego se moverán a una versión self-hosted

  • Se mencionó por qué EdgeDB cambió de nombre a Gel, pero también debió añadirse en la sección de adquisiciones.
    Gel se unió a Vercel

    • Gracias. Agregué un enlace de corrección en el blog.
      Tenemos que encontrar una forma de rastrear automáticamente estos cambios
    • Sinceramente, me decepciona. Incluso viendo la publicación oficial de Vercel, el futuro de Gel se ve incierto.
      El último commit en GitHub fue hace 2 semanas
  • Gracias a Andy de CMU y al DB Group, las bases de datos se volvieron mucho más populares. De verdad es un equipo de clase mundial

    • Me gustaría saber específicamente qué hicieron
  • El lanzamiento de PostgreSQL 18 es realmente excelente.
    Casi todo el mundo habla solo de los async IO workers, pero Unicode locale, agregar constraints no validadas, columnas virtuales, btree skip scan y UUIDv7 también son mejoras importantes

  • Impresionan mucho las tendencias de varios años recientes.
    Databricks y Snowflake demostraron agilidad y capacidad de supervivencia incluso en plena competencia en la nube.
    En cambio, Cloudera y Hortonworks fracasaron.
    Además, ClickHouse sigue llenando silenciosamente su propio nicho a la perfección