- El sistema de memoria de Claude solo se activa cuando el usuario lo invoca explícitamente, y devuelve información buscando en tiempo real el historial real de conversaciones
- En cambio, ChatGPT carga automáticamente el perfil y el historial del usuario en cada conversación, ofreciendo de inmediato una experiencia personalizada
- Estos dos enfoques reflejan diferencias en el público objetivo y en la filosofía de desarrollo del producto
- Los usuarios de Claude están más orientados a desarrolladores y profesionales, y priorizan la transparencia, el control directo y la privacidad
- Recientemente, Claude también incorporó una función de memoria automática similar a la de ChatGPT para cuentas Team y Enterprise, lo que muestra que el diseño de memoria en IA se está expandiendo rápidamente
Cómo funciona el sistema de memoria de Claude
El sistema de memoria de Claude tiene dos características clave
- Comienza cada conversación en estado vacío, sin cargar de antemano el perfil del usuario ni conversaciones previas
- La función de memoria solo se activa cuando el usuario usa frases de invocación claras, como "dime de qué hablamos antes" o "sigamos desde donde nos quedamos"
Claude no utiliza resúmenes generados por la IA ni perfiles comprimidos; en su lugar, busca en tiempo real únicamente el historial real de conversaciones pasadas para aprovechar esa información
Una vez completada la búsqueda, Claude integra los resultados para responder la solicitud del usuario o continuar la discusión
Herramienta Conversation Search
- La herramienta conversation_search busca en todo el historial de conversaciones por palabra clave o tema
- Por ejemplo, si se le pide "¿recuerdas lo que hablamos sobre Chandni Chowk?", Claude encuentra varias conversaciones relacionadas con ese tema y entrega un resumen integrado
- Si se preguntan varios temas a la vez (por ejemplo: Michelangelo, Chainflip, Solana), los busca por separado y de manera secuencial, y devuelve ese contenido con enlaces
- Los parámetros de conversation_search incluyen el número máximo de resultados de búsqueda y la consulta de búsqueda
- Ejemplo: max_results (1~10), query (palabra clave de búsqueda)
Herramienta Temporal Chat Retrieval
- La herramienta recent_chats accede al historial de conversaciones según el tiempo
- Si se le pide algo como "muéstrame el contenido de mis últimas 10 conversaciones", encuentra las conversaciones más recientes en orden y entrega un resumen
- También permite búsquedas basadas en un periodo específico, como "¿de qué hablamos en la última semana de noviembre de 2024?"
- Los parámetros de recent_chats incluyen after/before (inicio·fin), n (número de conversaciones, 1~20) y sort_order (ascendente/descendente)
Comparación entre ChatGPT y Claude
Hasta el año pasado, las funciones principales que ofrecían ChatGPT y Claude eran parecidas, pero ahora la dirección de ambos productos ha cambiado mucho
- ChatGPT ha evolucionado como un producto de consumo para el mercado masivo, usado por estudiantes, padres de familia, aficionados y personas de muy distintos perfiles
- En cada conversación se carga automáticamente el componente de memoria, lo que ofrece una experiencia de personalización inmediata y sencilla
- Con base en perfiles de usuario detallados, puede utilizarse para futuras recomendaciones de funciones, funciones personalizadas y monetización
- Claude fue desarrollado apuntando a una base de usuarios centrada en desarrolladores, ingenieros y profesionales
- Los usuarios entienden cómo funciona el algoritmo y eligen claramente cuándo invocar la memoria
- Más que la elaboración de perfiles o la automatización, valoran más la funcionalidad como herramienta, la previsibilidad y la privacidad
Así, los sistemas de memoria de ambos servicios reflejan directamente las diferencias entre su base de usuarios y su filosofía de desarrollo
La diversidad en el diseño de memoria para IA
Los sistemas de memoria completamente opuestos de ChatGPT y Claude muestran que el campo del diseño de memoria para IA es muy diverso
- No existe una respuesta correcta ni una solución universal para el enfoque de memoria, y es esencial diseñarlo en función de las necesidades y objetivos reales de los usuarios
- Dado que la historia de uso de herramientas de IA todavía no llega a tres años, aún no existen buenas prácticas consolidadas sobre cómo manejar los datos acumulados o la privacidad cuando se usa el mismo asistente de IA durante largos periodos
- Actualmente, distintas apps de IA están experimentando con enfoques de memoria únicos, mientras que los modelos base también se vuelven más potentes cada semana
- En este proceso no hay una respuesta definitiva sobre cuál es la mejor forma, y siguen apareciendo distintos intentos y experimentos
Actualización reciente: Claude incorpora memoria automática
El mismo día en que se publicó este artículo, Anthropic anunció la función de memoria automática de Claude para cuentas Team/Enterprise
- Esta función, similar al enfoque de ChatGPT, construye automáticamente resúmenes de memoria basados en el contexto de trabajo, patrones de trabajo e información por proyecto
- Se genera una memoria independiente para cada proyecto de Claude, y el usuario puede consultar y editar directamente lo que Claude recuerda
- El autor aún no tiene esta función disponible en su suscripción personal Pro Max, por lo que todavía no la ha evaluado
- Más adelante publicará una revisión adicional sobre la comparación con la memoria basada en búsqueda existente y las diferencias frente a ChatGPT
2 comentarios
Opinión de Hacker News
La diferencia en la implementación al final proviene de los objetivos de negocio
ChatGPT claramente apunta a monetizar mediante anuncios y enlaces de afiliados, y su implementación de memoria también está centrada en crear perfiles de usuario
En cambio, la implementación de memoria de Claude está más cerca de un objetivo de largo plazo basado en interacciones pasadas y acceso a abstracciones
Está diseñada para poder buscar conversaciones de una forma similar a cómo accede la memoria humana, y pienso que más adelante, mediante aprendizaje por refuerzo, podría recordar errores señalados por el usuario o incluso derivar abstracciones de conversaciones pasadas para encargarse activamente de tareas
Al final, ChatGPT intenta recordar al usuario en sí, mientras que Claude se enfoca en el historial de interacciones individuales
Siento que hay una parte donde lo que dicen y lo que hacen no coincide
OpenAI podría monetizar algunos temas como b, c y f con anuncios intersticiales (pantalla completa, más de 30 segundos)
Esto sería posible simplemente analizando los temas
Si OpenAI pudiera analizar unas 1000 sesiones de chat y de programación para maximizar ingresos haciendo que el usuario consiga trabajo en cierta empresa o compre un auto de otra empresa, en ese proceso podría no solo usar anuncios intersticiales, sino también ajustar la calidad o el contenido de las respuestas
Ese escenario es bastante realista y a la vez distópico
En cambio, si DeepSeek operara sin anuncios, el estándar para que los LLM de código cerrado ganen cuota de mercado sería mucho más alto
Al final, los LLM serán como cualquier otro producto y los usuarios pagarán según la calidad, queriendo distintos niveles de calidad
Como la publicidad puede dañar la confiabilidad de las respuestas de la IA, creo que el desenlace más realista son los anuncios de pantalla completa
ChatGPT no es una red social, así que no necesita monetizarse de la misma manera
Ya está generando suficientes ingresos con suscripciones, enterprise, negocios y API
Señalan que el enlace del artículo de análisis sobre la implementación de memoria de ChatGPT estaba mal y comparten el enlace correcto
Tenía curiosidad por cómo estaba implementada la memoria de ChatGPT, y resulta muy interesante ver un enfoque completamente distinto al de Claude
El enfoque de Claude parece más adecuado para resolver desafíos técnicos, mientras que ChatGPT parece más favorable para conversaciones cotidianas e integración publicitaria
Algún día estos métodos de memoria basados en lenguaje quedarán obsoletos, y alguien encontrará una forma codificada de almacenar/recuperar recuerdos que vaya más allá de la expresión lingüística
Eso podría ser el último gran avance hacia la AGI
Los LLM actuales no entienden conceptos; de hecho no tienen una función real de “entender” y, en esencia, son cadenas de Markov muy sofisticadas
Creo que la inteligencia real es una condición previa para la AGI
Parece que la memoria de ChatGPT solo permite meter en el contexto la Memory real, que es un resumen por entidades
Y también se plantea si los resúmenes de conversaciones pasadas o el método de embeddings no serían, al fin y al cabo, una forma de almacenamiento de memoria codificada
Me preocupa cómo podríamos hacer que la AGI obedeciera instrucciones
Dice que está satisfecho con la implementación de memoria de Claude, pero que tiene desactivada la memoria de ChatGPT
Como usa ChatGPT para demasiadas cosas distintas, le resultaba raro que intentara conectar contenidos no relacionados sin ningún sentido
Quiero personalización y referencias a la información que necesito
Por ejemplo, si haces que recuerde la información de un proyecto, después ya no tienes que explicar el contexto cada vez, lo que mejora muchísimo la calidad de vida
Eso sí, no me gusta mucho la forma en que se generan recuerdos de conversaciones en segundo plano que yo no puedo controlar directamente
En ChatGPT, contenidos viejos que no quieres se mezclan innecesariamente y terminan estorbando
He probado varios tutores de IA para aprender idiomas, y ChatGPT fue el mejor
Pero tenía que repetir una y otra vez “háblame más despacio”, y aunque le dijera que aplicara esa regla a toda la conversación, no podía hacerlo
Fuera de eso, también hay partes donde la memoria no funciona bien
Pronto cambiará la forma en que funciona la memoria de ChatGPT
Enlaces de referencia: X.com - noticia sobre el cambio de memoria, anuncio oficial de Anthropic
Comparte que escribió personalmente un artículo sobre la memoria de ChatGPT y el historial de chat
También incluye un prompt para volcar información directamente
Enlace relacionado
Siempre prefiero tener control exacto sobre la entrada, así que suelo desactivar por completo la memoria
Quiero quitar todos los system prompts, entrenamiento, etc., y usar solo prompts escritos por mí
Se cuestiona si la información obtenida preguntándole directamente a ChatGPT es confiable o si será una alucinación generativa
Cree que no hay razón para que un LLM sepa cómo funciona a sí mismo, ni que se le haya dado material de entrenamiento sobre eso
Esto se debe a que esa información de herramientas está escrita con mucho detalle en el system prompt
Dicen que Claude recupera recuerdos consultando únicamente el historial original de conversaciones
Busca en tiempo real solo conversaciones reales del pasado, sin resúmenes generados por IA ni perfiles comprimidos
Que no haya resúmenes, perfiles ni knowledge graphs no significa que sea una función avanzada, sino que no funciona tan bien
Por ejemplo, quizá recuerde algo específico como "Chandni Chowk", pero no encontrará bien una expresión ambigua como "mi compañero de trabajo con el que tuve problemas"
Preguntan cuál es el obstáculo para usar almacenamiento de memoria externo mediante tool calling o MCP
También quieren saber si se está reforzando con RL el patrón de uso de memoria
Desde la perspectiva de privacidad de datos, aunque el LLM de todos modos conocerá la información al momento de inferencia, no quieren introducirla de forma tan directa
Ejemplo: "Intereses: MacOS, bondage, discipline, Baseball"
En ese momento, Claude no quería aprovechar la memoria por iniciativa propia aunque lo guiaran una y otra vez con prompts
Había que indicarle explícitamente cada vez que revisara o guardara recuerdos, así que la utilidad era baja
Repositorio relacionado
Este artículo le dejó confundido
No está claro si el autor cree que se insertan prompts incluso cuando la memoria está desactivada
En su caso, cuando la memoria está apagada no se inserta ningún metadato de conversaciones recientes ni de preferencias, y las conversaciones quedan completamente separadas
No sabe si la confusión vino de que durante el experimento estuvo activando y desactivando la memoria, o si simplemente no leyó bien el artículo
De repente desaparecieron todos los puntos.