La arquitectura de memoria de Claude es lo opuesto a la de ChatGPT

(shloked.com)

6 puntos por GN⁺ 2025-09-12 | 2 comentarios | Compartir por WhatsApp

El sistema de memoria de Claude solo se activa cuando el usuario lo invoca explícitamente, y devuelve información buscando en tiempo real el historial real de conversaciones
En cambio, ChatGPT carga automáticamente el perfil y el historial del usuario en cada conversación, ofreciendo de inmediato una experiencia personalizada
Estos dos enfoques reflejan diferencias en el público objetivo y en la filosofía de desarrollo del producto
Los usuarios de Claude están más orientados a desarrolladores y profesionales, y priorizan la transparencia, el control directo y la privacidad
Recientemente, Claude también incorporó una función de memoria automática similar a la de ChatGPT para cuentas Team y Enterprise, lo que muestra que el diseño de memoria en IA se está expandiendo rápidamente

Cómo funciona el sistema de memoria de Claude

El sistema de memoria de Claude tiene dos características clave

Comienza cada conversación en estado vacío, sin cargar de antemano el perfil del usuario ni conversaciones previas
La función de memoria solo se activa cuando el usuario usa frases de invocación claras, como "dime de qué hablamos antes" o "sigamos desde donde nos quedamos"

Claude no utiliza resúmenes generados por la IA ni perfiles comprimidos; en su lugar, busca en tiempo real únicamente el historial real de conversaciones pasadas para aprovechar esa información
Una vez completada la búsqueda, Claude integra los resultados para responder la solicitud del usuario o continuar la discusión

Herramienta Conversation Search

La herramienta conversation_search busca en todo el historial de conversaciones por palabra clave o tema
Por ejemplo, si se le pide "¿recuerdas lo que hablamos sobre Chandni Chowk?", Claude encuentra varias conversaciones relacionadas con ese tema y entrega un resumen integrado
Si se preguntan varios temas a la vez (por ejemplo: Michelangelo, Chainflip, Solana), los busca por separado y de manera secuencial, y devuelve ese contenido con enlaces
Los parámetros de conversation_search incluyen el número máximo de resultados de búsqueda y la consulta de búsqueda
- Ejemplo: max_results (1~10), query (palabra clave de búsqueda)

Herramienta Temporal Chat Retrieval

La herramienta recent_chats accede al historial de conversaciones según el tiempo
Si se le pide algo como "muéstrame el contenido de mis últimas 10 conversaciones", encuentra las conversaciones más recientes en orden y entrega un resumen
También permite búsquedas basadas en un periodo específico, como "¿de qué hablamos en la última semana de noviembre de 2024?"
Los parámetros de recent_chats incluyen after/before (inicio·fin), n (número de conversaciones, 1~20) y sort_order (ascendente/descendente)

Comparación entre ChatGPT y Claude

Hasta el año pasado, las funciones principales que ofrecían ChatGPT y Claude eran parecidas, pero ahora la dirección de ambos productos ha cambiado mucho

ChatGPT ha evolucionado como un producto de consumo para el mercado masivo, usado por estudiantes, padres de familia, aficionados y personas de muy distintos perfiles
- En cada conversación se carga automáticamente el componente de memoria, lo que ofrece una experiencia de personalización inmediata y sencilla
- Con base en perfiles de usuario detallados, puede utilizarse para futuras recomendaciones de funciones, funciones personalizadas y monetización
Claude fue desarrollado apuntando a una base de usuarios centrada en desarrolladores, ingenieros y profesionales
- Los usuarios entienden cómo funciona el algoritmo y eligen claramente cuándo invocar la memoria
- Más que la elaboración de perfiles o la automatización, valoran más la funcionalidad como herramienta, la previsibilidad y la privacidad

Así, los sistemas de memoria de ambos servicios reflejan directamente las diferencias entre su base de usuarios y su filosofía de desarrollo

La diversidad en el diseño de memoria para IA

Los sistemas de memoria completamente opuestos de ChatGPT y Claude muestran que el campo del diseño de memoria para IA es muy diverso

No existe una respuesta correcta ni una solución universal para el enfoque de memoria, y es esencial diseñarlo en función de las necesidades y objetivos reales de los usuarios
Dado que la historia de uso de herramientas de IA todavía no llega a tres años, aún no existen buenas prácticas consolidadas sobre cómo manejar los datos acumulados o la privacidad cuando se usa el mismo asistente de IA durante largos periodos
Actualmente, distintas apps de IA están experimentando con enfoques de memoria únicos, mientras que los modelos base también se vuelven más potentes cada semana
En este proceso no hay una respuesta definitiva sobre cuál es la mejor forma, y siguen apareciendo distintos intentos y experimentos

Actualización reciente: Claude incorpora memoria automática

El mismo día en que se publicó este artículo, Anthropic anunció la función de memoria automática de Claude para cuentas Team/Enterprise

Esta función, similar al enfoque de ChatGPT, construye automáticamente resúmenes de memoria basados en el contexto de trabajo, patrones de trabajo e información por proyecto
Se genera una memoria independiente para cada proyecto de Claude, y el usuario puede consultar y editar directamente lo que Claude recuerda
El autor aún no tiene esta función disponible en su suscripción personal Pro Max, por lo que todavía no la ha evaluado
Más adelante publicará una revisión adicional sobre la comparación con la memoria basada en búsqueda existente y las diferencias frente a ChatGPT

2 comentarios

GN⁺ 2025-09-12

Opinión de Hacker News

La diferencia en la implementación al final proviene de los objetivos de negocio
ChatGPT claramente apunta a monetizar mediante anuncios y enlaces de afiliados, y su implementación de memoria también está centrada en crear perfiles de usuario
En cambio, la implementación de memoria de Claude está más cerca de un objetivo de largo plazo basado en interacciones pasadas y acceso a abstracciones
Está diseñada para poder buscar conversaciones de una forma similar a cómo accede la memoria humana, y pienso que más adelante, mediante aprendizaje por refuerzo, podría recordar errores señalados por el usuario o incluso derivar abstracciones de conversaciones pasadas para encargarse activamente de tareas
Al final, ChatGPT intenta recordar al usuario en sí, mientras que Claude se enfoca en el historial de interacciones individuales
- Si fuera AGI, podría generar ingresos sin anuncios, pero una empresa nueva tipo Google sí necesita anuncios
  Siento que hay una parte donde lo que dicen y lo que hacen no coincide
- Tampoco creo que Anthropic vaya a abstenerse de ofrecer publicidad personalizada
- Si asumimos que un usuario usa con frecuencia un LLM para temas a, b, c y menos para d, e, f
  OpenAI podría monetizar algunos temas como b, c y f con anuncios intersticiales (pantalla completa, más de 30 segundos)
  Esto sería posible simplemente analizando los temas
  Si OpenAI pudiera analizar unas 1000 sesiones de chat y de programación para maximizar ingresos haciendo que el usuario consiga trabajo en cierta empresa o compre un auto de otra empresa, en ese proceso podría no solo usar anuncios intersticiales, sino también ajustar la calidad o el contenido de las respuestas
  Ese escenario es bastante realista y a la vez distópico
  En cambio, si DeepSeek operara sin anuncios, el estándar para que los LLM de código cerrado ganen cuota de mercado sería mucho más alto
  Al final, los LLM serán como cualquier otro producto y los usuarios pagarán según la calidad, queriendo distintos niveles de calidad
  Como la publicidad puede dañar la confiabilidad de las respuestas de la IA, creo que el desenlace más realista son los anuncios de pantalla completa
- Me pregunto por qué ves una dirección tan clara hacia la publicidad
  ChatGPT no es una red social, así que no necesita monetizarse de la misma manera
  Ya está generando suficientes ingresos con suscripciones, enterprise, negocios y API
Señalan que el enlace del artículo de análisis sobre la implementación de memoria de ChatGPT estaba mal y comparten el enlace correcto
Tenía curiosidad por cómo estaba implementada la memoria de ChatGPT, y resulta muy interesante ver un enfoque completamente distinto al de Claude
El enfoque de Claude parece más adecuado para resolver desafíos técnicos, mientras que ChatGPT parece más favorable para conversaciones cotidianas e integración publicitaria
Algún día estos métodos de memoria basados en lenguaje quedarán obsoletos, y alguien encontrará una forma codificada de almacenar/recuperar recuerdos que vaya más allá de la expresión lingüística
Eso podría ser el último gran avance hacia la AGI
- No estoy de acuerdo con la afirmación de que sería el último gran avance para la AGI
  Los LLM actuales no entienden conceptos; de hecho no tienen una función real de “entender” y, en esencia, son cadenas de Markov muy sofisticadas
  Creo que la inteligencia real es una condición previa para la AGI
- Creo que la lista de conversaciones recientes es similar a Claude en el sentido de que no es memoria real, sino una forma comprimida de las conversaciones a la que se accede solo cuando hace falta
  Parece que la memoria de ChatGPT solo permite meter en el contexto la Memory real, que es un resumen por entidades
- Como ChatGPT intenta abarcar de todo —conversación cotidiana, tareas técnicas, etc.— esta estrategia le está funcionando bien
  Y también se plantea si los resúmenes de conversaciones pasadas o el método de embeddings no serían, al fin y al cabo, una forma de almacenamiento de memoria codificada
- No quiero AGI
  Me preocupa cómo podríamos hacer que la AGI obedeciera instrucciones
Dice que está satisfecho con la implementación de memoria de Claude, pero que tiene desactivada la memoria de ChatGPT
Como usa ChatGPT para demasiadas cosas distintas, le resultaba raro que intentara conectar contenidos no relacionados sin ningún sentido
- La memoria de ChatGPT es la función más conveniente, y por eso sigo usándolo
  Quiero personalización y referencias a la información que necesito
  Por ejemplo, si haces que recuerde la información de un proyecto, después ya no tienes que explicar el contexto cada vez, lo que mejora muchísimo la calidad de vida
  Eso sí, no me gusta mucho la forma en que se generan recuerdos de conversaciones en segundo plano que yo no puedo controlar directamente
- En cambio, me resulta mucho más conveniente que ChatGPT recupere información de la memoria automáticamente
- La razón por la que desactivé la memoria es que antes había guardado información falsa, y luego seguía trayéndola una y otra vez
- Creo que es valioso poder controlar cuándo se recupera el contenido de conversaciones anteriores
  En ChatGPT, contenidos viejos que no quieres se mezclan innecesariamente y terminan estorbando
- Me sorprende que ChatGPT ni siquiera pueda recordar cosas básicas
  He probado varios tutores de IA para aprender idiomas, y ChatGPT fue el mejor
  Pero tenía que repetir una y otra vez “háblame más despacio”, y aunque le dijera que aplicara esa regla a toda la conversación, no podía hacerlo
  Fuera de eso, también hay partes donde la memoria no funciona bien
Pronto cambiará la forma en que funciona la memoria de ChatGPT
Enlaces de referencia: X.com - noticia sobre el cambio de memoria, anuncio oficial de Anthropic
- Si cambia el sistema de memoria, creo que me va a dar pena
Comparte que escribió personalmente un artículo sobre la memoria de ChatGPT y el historial de chat
También incluye un prompt para volcar información directamente
Enlace relacionado
Siempre prefiero tener control exacto sobre la entrada, así que suelo desactivar por completo la memoria
Quiero quitar todos los system prompts, entrenamiento, etc., y usar solo prompts escritos por mí
Se cuestiona si la información obtenida preguntándole directamente a ChatGPT es confiable o si será una alucinación generativa
Cree que no hay razón para que un LLM sepa cómo funciona a sí mismo, ni que se le haya dado material de entrenamiento sobre eso
- Preguntarle a un LLM cómo funciona no ayuda mucho, pero preguntarle por la firma de las funciones/herramientas que puede usar sí suele acertar bastante
  Esto se debe a que esa información de herramientas está escrita con mucho detalle en el system prompt
Dicen que Claude recupera recuerdos consultando únicamente el historial original de conversaciones
Busca en tiempo real solo conversaciones reales del pasado, sin resúmenes generados por IA ni perfiles comprimidos
Que no haya resúmenes, perfiles ni knowledge graphs no significa que sea una función avanzada, sino que no funciona tan bien
Por ejemplo, quizá recuerde algo específico como "Chandni Chowk", pero no encontrará bien una expresión ambigua como "mi compañero de trabajo con el que tuve problemas"
Preguntan cuál es el obstáculo para usar almacenamiento de memoria externo mediante tool calling o MCP
También quieren saber si se está reforzando con RL el patrón de uso de memoria
Desde la perspectiva de privacidad de datos, aunque el LLM de todos modos conocerá la información al momento de inferencia, no quieren introducirla de forma tan directa
Ejemplo: "Intereses: MacOS, bondage, discipline, Baseball"
- Cuenta que en primavera, por diversión, hizo una herramienta MCP que guardaba memoria en una base de datos SQLite
  En ese momento, Claude no quería aprovechar la memoria por iniciativa propia aunque lo guiaran una y otra vez con prompts
  Había que indicarle explícitamente cada vez que revisara o guardara recuerdos, así que la utilidad era baja
  Repositorio relacionado
Este artículo le dejó confundido
No está claro si el autor cree que se insertan prompts incluso cuando la memoria está desactivada
En su caso, cuando la memoria está apagada no se inserta ningún metadato de conversaciones recientes ni de preferencias, y las conversaciones quedan completamente separadas
No sabe si la confusión vino de que durante el experimento estuvo activando y desactivando la memoria, o si simplemente no leyó bien el artículo

roxie 2025-09-13

De repente desaparecieron todos los puntos.