6 puntos por GN⁺ 2025-09-12 | 2 comentarios | Compartir por WhatsApp
  • El sistema de memoria de Claude solo se activa cuando el usuario lo invoca explícitamente, y devuelve información buscando en tiempo real el historial real de conversaciones
  • En cambio, ChatGPT carga automáticamente el perfil y el historial del usuario en cada conversación, ofreciendo de inmediato una experiencia personalizada
  • Estos dos enfoques reflejan diferencias en el público objetivo y en la filosofía de desarrollo del producto
  • Los usuarios de Claude están más orientados a desarrolladores y profesionales, y priorizan la transparencia, el control directo y la privacidad
  • Recientemente, Claude también incorporó una función de memoria automática similar a la de ChatGPT para cuentas Team y Enterprise, lo que muestra que el diseño de memoria en IA se está expandiendo rápidamente

Cómo funciona el sistema de memoria de Claude

El sistema de memoria de Claude tiene dos características clave

  • Comienza cada conversación en estado vacío, sin cargar de antemano el perfil del usuario ni conversaciones previas
  • La función de memoria solo se activa cuando el usuario usa frases de invocación claras, como "dime de qué hablamos antes" o "sigamos desde donde nos quedamos"

Claude no utiliza resúmenes generados por la IA ni perfiles comprimidos; en su lugar, busca en tiempo real únicamente el historial real de conversaciones pasadas para aprovechar esa información
Una vez completada la búsqueda, Claude integra los resultados para responder la solicitud del usuario o continuar la discusión

Herramienta Conversation Search

  • La herramienta conversation_search busca en todo el historial de conversaciones por palabra clave o tema
  • Por ejemplo, si se le pide "¿recuerdas lo que hablamos sobre Chandni Chowk?", Claude encuentra varias conversaciones relacionadas con ese tema y entrega un resumen integrado
  • Si se preguntan varios temas a la vez (por ejemplo: Michelangelo, Chainflip, Solana), los busca por separado y de manera secuencial, y devuelve ese contenido con enlaces
  • Los parámetros de conversation_search incluyen el número máximo de resultados de búsqueda y la consulta de búsqueda
    • Ejemplo: max_results (1~10), query (palabra clave de búsqueda)

Herramienta Temporal Chat Retrieval

  • La herramienta recent_chats accede al historial de conversaciones según el tiempo
  • Si se le pide algo como "muéstrame el contenido de mis últimas 10 conversaciones", encuentra las conversaciones más recientes en orden y entrega un resumen
  • También permite búsquedas basadas en un periodo específico, como "¿de qué hablamos en la última semana de noviembre de 2024?"
  • Los parámetros de recent_chats incluyen after/before (inicio·fin), n (número de conversaciones, 1~20) y sort_order (ascendente/descendente)

Comparación entre ChatGPT y Claude

Hasta el año pasado, las funciones principales que ofrecían ChatGPT y Claude eran parecidas, pero ahora la dirección de ambos productos ha cambiado mucho

  • ChatGPT ha evolucionado como un producto de consumo para el mercado masivo, usado por estudiantes, padres de familia, aficionados y personas de muy distintos perfiles
    • En cada conversación se carga automáticamente el componente de memoria, lo que ofrece una experiencia de personalización inmediata y sencilla
    • Con base en perfiles de usuario detallados, puede utilizarse para futuras recomendaciones de funciones, funciones personalizadas y monetización
  • Claude fue desarrollado apuntando a una base de usuarios centrada en desarrolladores, ingenieros y profesionales
    • Los usuarios entienden cómo funciona el algoritmo y eligen claramente cuándo invocar la memoria
    • Más que la elaboración de perfiles o la automatización, valoran más la funcionalidad como herramienta, la previsibilidad y la privacidad

Así, los sistemas de memoria de ambos servicios reflejan directamente las diferencias entre su base de usuarios y su filosofía de desarrollo

La diversidad en el diseño de memoria para IA

Los sistemas de memoria completamente opuestos de ChatGPT y Claude muestran que el campo del diseño de memoria para IA es muy diverso

  • No existe una respuesta correcta ni una solución universal para el enfoque de memoria, y es esencial diseñarlo en función de las necesidades y objetivos reales de los usuarios
  • Dado que la historia de uso de herramientas de IA todavía no llega a tres años, aún no existen buenas prácticas consolidadas sobre cómo manejar los datos acumulados o la privacidad cuando se usa el mismo asistente de IA durante largos periodos
  • Actualmente, distintas apps de IA están experimentando con enfoques de memoria únicos, mientras que los modelos base también se vuelven más potentes cada semana
  • En este proceso no hay una respuesta definitiva sobre cuál es la mejor forma, y siguen apareciendo distintos intentos y experimentos

Actualización reciente: Claude incorpora memoria automática

El mismo día en que se publicó este artículo, Anthropic anunció la función de memoria automática de Claude para cuentas Team/Enterprise

  • Esta función, similar al enfoque de ChatGPT, construye automáticamente resúmenes de memoria basados en el contexto de trabajo, patrones de trabajo e información por proyecto
  • Se genera una memoria independiente para cada proyecto de Claude, y el usuario puede consultar y editar directamente lo que Claude recuerda
  • El autor aún no tiene esta función disponible en su suscripción personal Pro Max, por lo que todavía no la ha evaluado
  • Más adelante publicará una revisión adicional sobre la comparación con la memoria basada en búsqueda existente y las diferencias frente a ChatGPT

2 comentarios

 
GN⁺ 2025-09-12
Opinión de Hacker News
  • La diferencia en la implementación al final proviene de los objetivos de negocio
    ChatGPT claramente apunta a monetizar mediante anuncios y enlaces de afiliados, y su implementación de memoria también está centrada en crear perfiles de usuario
    En cambio, la implementación de memoria de Claude está más cerca de un objetivo de largo plazo basado en interacciones pasadas y acceso a abstracciones
    Está diseñada para poder buscar conversaciones de una forma similar a cómo accede la memoria humana, y pienso que más adelante, mediante aprendizaje por refuerzo, podría recordar errores señalados por el usuario o incluso derivar abstracciones de conversaciones pasadas para encargarse activamente de tareas
    Al final, ChatGPT intenta recordar al usuario en sí, mientras que Claude se enfoca en el historial de interacciones individuales

    • Si fuera AGI, podría generar ingresos sin anuncios, pero una empresa nueva tipo Google sí necesita anuncios
      Siento que hay una parte donde lo que dicen y lo que hacen no coincide
    • Tampoco creo que Anthropic vaya a abstenerse de ofrecer publicidad personalizada
    • Si asumimos que un usuario usa con frecuencia un LLM para temas a, b, c y menos para d, e, f
      OpenAI podría monetizar algunos temas como b, c y f con anuncios intersticiales (pantalla completa, más de 30 segundos)
      Esto sería posible simplemente analizando los temas
      Si OpenAI pudiera analizar unas 1000 sesiones de chat y de programación para maximizar ingresos haciendo que el usuario consiga trabajo en cierta empresa o compre un auto de otra empresa, en ese proceso podría no solo usar anuncios intersticiales, sino también ajustar la calidad o el contenido de las respuestas
      Ese escenario es bastante realista y a la vez distópico
      En cambio, si DeepSeek operara sin anuncios, el estándar para que los LLM de código cerrado ganen cuota de mercado sería mucho más alto
      Al final, los LLM serán como cualquier otro producto y los usuarios pagarán según la calidad, queriendo distintos niveles de calidad
      Como la publicidad puede dañar la confiabilidad de las respuestas de la IA, creo que el desenlace más realista son los anuncios de pantalla completa
    • Me pregunto por qué ves una dirección tan clara hacia la publicidad
      ChatGPT no es una red social, así que no necesita monetizarse de la misma manera
      Ya está generando suficientes ingresos con suscripciones, enterprise, negocios y API
  • Señalan que el enlace del artículo de análisis sobre la implementación de memoria de ChatGPT estaba mal y comparten el enlace correcto
    Tenía curiosidad por cómo estaba implementada la memoria de ChatGPT, y resulta muy interesante ver un enfoque completamente distinto al de Claude
    El enfoque de Claude parece más adecuado para resolver desafíos técnicos, mientras que ChatGPT parece más favorable para conversaciones cotidianas e integración publicitaria
    Algún día estos métodos de memoria basados en lenguaje quedarán obsoletos, y alguien encontrará una forma codificada de almacenar/recuperar recuerdos que vaya más allá de la expresión lingüística
    Eso podría ser el último gran avance hacia la AGI

    • No estoy de acuerdo con la afirmación de que sería el último gran avance para la AGI
      Los LLM actuales no entienden conceptos; de hecho no tienen una función real de “entender” y, en esencia, son cadenas de Markov muy sofisticadas
      Creo que la inteligencia real es una condición previa para la AGI
    • Creo que la lista de conversaciones recientes es similar a Claude en el sentido de que no es memoria real, sino una forma comprimida de las conversaciones a la que se accede solo cuando hace falta
      Parece que la memoria de ChatGPT solo permite meter en el contexto la Memory real, que es un resumen por entidades
    • Como ChatGPT intenta abarcar de todo —conversación cotidiana, tareas técnicas, etc.— esta estrategia le está funcionando bien
      Y también se plantea si los resúmenes de conversaciones pasadas o el método de embeddings no serían, al fin y al cabo, una forma de almacenamiento de memoria codificada
    • No quiero AGI
      Me preocupa cómo podríamos hacer que la AGI obedeciera instrucciones
  • Dice que está satisfecho con la implementación de memoria de Claude, pero que tiene desactivada la memoria de ChatGPT
    Como usa ChatGPT para demasiadas cosas distintas, le resultaba raro que intentara conectar contenidos no relacionados sin ningún sentido

    • La memoria de ChatGPT es la función más conveniente, y por eso sigo usándolo
      Quiero personalización y referencias a la información que necesito
      Por ejemplo, si haces que recuerde la información de un proyecto, después ya no tienes que explicar el contexto cada vez, lo que mejora muchísimo la calidad de vida
      Eso sí, no me gusta mucho la forma en que se generan recuerdos de conversaciones en segundo plano que yo no puedo controlar directamente
    • En cambio, me resulta mucho más conveniente que ChatGPT recupere información de la memoria automáticamente
    • La razón por la que desactivé la memoria es que antes había guardado información falsa, y luego seguía trayéndola una y otra vez
    • Creo que es valioso poder controlar cuándo se recupera el contenido de conversaciones anteriores
      En ChatGPT, contenidos viejos que no quieres se mezclan innecesariamente y terminan estorbando
    • Me sorprende que ChatGPT ni siquiera pueda recordar cosas básicas
      He probado varios tutores de IA para aprender idiomas, y ChatGPT fue el mejor
      Pero tenía que repetir una y otra vez “háblame más despacio”, y aunque le dijera que aplicara esa regla a toda la conversación, no podía hacerlo
      Fuera de eso, también hay partes donde la memoria no funciona bien
  • Pronto cambiará la forma en que funciona la memoria de ChatGPT
    Enlaces de referencia: X.com - noticia sobre el cambio de memoria, anuncio oficial de Anthropic

    • Si cambia el sistema de memoria, creo que me va a dar pena
  • Comparte que escribió personalmente un artículo sobre la memoria de ChatGPT y el historial de chat
    También incluye un prompt para volcar información directamente
    Enlace relacionado

  • Siempre prefiero tener control exacto sobre la entrada, así que suelo desactivar por completo la memoria
    Quiero quitar todos los system prompts, entrenamiento, etc., y usar solo prompts escritos por mí

  • Se cuestiona si la información obtenida preguntándole directamente a ChatGPT es confiable o si será una alucinación generativa
    Cree que no hay razón para que un LLM sepa cómo funciona a sí mismo, ni que se le haya dado material de entrenamiento sobre eso

    • Preguntarle a un LLM cómo funciona no ayuda mucho, pero preguntarle por la firma de las funciones/herramientas que puede usar sí suele acertar bastante
      Esto se debe a que esa información de herramientas está escrita con mucho detalle en el system prompt
  • Dicen que Claude recupera recuerdos consultando únicamente el historial original de conversaciones
    Busca en tiempo real solo conversaciones reales del pasado, sin resúmenes generados por IA ni perfiles comprimidos
    Que no haya resúmenes, perfiles ni knowledge graphs no significa que sea una función avanzada, sino que no funciona tan bien
    Por ejemplo, quizá recuerde algo específico como "Chandni Chowk", pero no encontrará bien una expresión ambigua como "mi compañero de trabajo con el que tuve problemas"

  • Preguntan cuál es el obstáculo para usar almacenamiento de memoria externo mediante tool calling o MCP
    También quieren saber si se está reforzando con RL el patrón de uso de memoria
    Desde la perspectiva de privacidad de datos, aunque el LLM de todos modos conocerá la información al momento de inferencia, no quieren introducirla de forma tan directa
    Ejemplo: "Intereses: MacOS, bondage, discipline, Baseball"

    • Cuenta que en primavera, por diversión, hizo una herramienta MCP que guardaba memoria en una base de datos SQLite
      En ese momento, Claude no quería aprovechar la memoria por iniciativa propia aunque lo guiaran una y otra vez con prompts
      Había que indicarle explícitamente cada vez que revisara o guardara recuerdos, así que la utilidad era baja
      Repositorio relacionado
  • Este artículo le dejó confundido
    No está claro si el autor cree que se insertan prompts incluso cuando la memoria está desactivada
    En su caso, cuando la memoria está apagada no se inserta ningún metadato de conversaciones recientes ni de preferencias, y las conversaciones quedan completamente separadas
    No sabe si la confusión vino de que durante el experimento estuvo activando y desactivando la memoria, o si simplemente no leyó bien el artículo

 
roxie 2025-09-13

De repente desaparecieron todos los puntos.