25 puntos por xguru 2025-10-18 | 2 comentarios | Compartir por WhatsApp
  • App nativa de macOS desarrollada con SwiftUI que graba la pantalla a 1 FPS y realiza análisis con IA cada 15 minutos para generar automáticamente una línea de tiempo y resúmenes
    • Permite reproducir un timelapse para revisar visualmente el flujo del día
  • Apunta a ser ligera y de baja carga, con un objetivo de ~25 MB de tamaño, ~100 MB de RAM y <1% de CPU, y ofrece una experiencia centrada en lo local, sin componentes distribuidos
  • La IA puede procesarse eligiendo entre Gemini (con tu propia API key) y modelos locales (Ollama·LM Studio)
  • Los datos grabados se limpian automáticamente después de 3 días, optimizando la gestión de recursos y la privacidad
  • Coming Soon
    • Dashboard infinitamente personalizable: haces cualquier pregunta y el resultado se convierte en un mosaico para seguirlo continuamente
    • Diario diario: registra retrospectiva de momentos destacados, incorporación de prompts guiados, y capturas de pantalla y notas junto con la línea de tiempo
  • Cómo funciona
    • Capture: graba la pantalla a 1 FPS en segmentos de 15 segundos
    • Analyze: cada 15 minutos, envía los segmentos recientes al proveedor de IA seleccionado para analizarlos
    • Generate: crea tarjetas de resumen de la actividad para construir una línea de tiempo cronológica
    • Display: muestra el flujo del día con una interfaz de línea de tiempo visual
    • Cleanup: administra el almacenamiento con la eliminación automática de grabaciones tras 3 días

2 comentarios

 
oh3vci 2025-10-21

Lo he estado usando localmente, pero parece que no analiza muy bien el coreano. Por lo que se ve en lo que se registra, parece que solo se registran las partes que estaban escritas en inglés.

 
GN⁺ 2025-10-18
Comentarios de Hacker News
  • Creo que este producto tendría buena recepción si se vendiera a abogados o a otros profesionales que facturan por hora, porque podría recuperar trabajo del día que se pasó por alto y evitar fugas en la facturación, así que probablemente estarían dispuestos a pagar un precio alto

    • Por otro lado, también me hace pensar que usar esto podría dejar en evidencia lo poco que realmente trabajan los abogados en proporción al tiempo que facturan
    • Yo también, como contratista de software, siempre quise esta función; ahora mismo estoy haciendo un prototipo simple en Linux
    • En el Reino Unido ni siquiera se factura por hora, sino en bloques de 6 minutos; eso dice mucho de la cultura profesional
  • ¡Buen producto! Actualmente uso ActivityWatch en mi PC para hacer seguimiento del trabajo
    Lo que me gustaría de un software así es lo siguiente

    • Una función para detectar el punto en que empieza la distracción: por ejemplo, abro la ventana del correo para revisar un email específico, pero termino viendo correos no relacionados y me distraigo entre 5 y 15 minutos; tener esa información llevaría a acciones para reducir la distracción, por ejemplo instalé un plugin para ocultar videos recomendados de YouTube y de verdad redujo mis distracciones, y también cierro todas las ventanas que no uso para no desviar la atención a otras cosas
    • Identificar tareas repetitivas y su frecuencia: por ejemplo, si una vez por semana hago manualmente una factura casi de la misma manera para cierto caso excepcional, entonces puedo pensar si vale la pena automatizarlo
    • Registrar el estado de ánimo antes, durante y después del trabajo: esta es la pregunta más amplia y difícil de definir, pero creo que tiene mucho potencial para mejorar la procrastinación y facilitar empezar a trabajar
    • Estaría genial que hubiera funciones que ayudaran a entender los patrones de distracción de cada persona; yo también uso esa misma extensión de YouTube
  • De inmediato pensé que algo así también podría ayudar muchísimo a personas con ADHD
    Te permite identificar qué desencadena la distracción y qué patrones repetitivos existen (por ejemplo: después de cada git commit, entro a Hacker News y pierdo 15 minutos)
    El hecho de poder revisar un historial capturado automáticamente es enorme; antes tuve mucho éxito usando TimeRescue para medir con precisión el tiempo de clientes
    Pero las herramientas que requieren entrada manual siempre terminan interrumpiendo la concentración o se me olvida usarlas, así que nunca duran mucho
    Yendo un paso más allá, estaría bien una función que me avise en tiempo real (considerando la latencia del procesamiento) cuando me estoy distrayendo; también se podría imaginar un sistema donde el usuario defina qué cuenta como distracción, o que se vuelva más inteligente gradualmente con retroalimentación
    El producto me parece muy atractivo; me gustaba la idea de Windows Recall, así que da gusto ver un producto así enfocado en la privacidad

  • Me gusta mucho el concepto del producto, pero me preocupa que el desarrollador haya lanzado de repente una app que fácilmente podría convertirse en spyware cuando su GitHub estaba casi vacío, sobre todo por temas de seguridad como las contraseñas

    • Si el código fuente ya está en GitHub, es fácil disipar esas preocupaciones revisando directamente el código en lugar de fijarse tanto en el perfil
  • No me siento cómodo enviando a Gemini datos sensibles como información bancaria o contraseñas
    Me pregunto qué tanta diferencia habrá en rendimiento al usar un modelo local

    • Si lo califico con base en mi experiencia y evaluación, Gemini 2.5 pro sería A-, y qwen2.5vl estaría más o menos en B-/C+; como los resultados no siempre son deterministas, es difícil garantizar la calidad
      Según artículos recientes, parece que con técnicas de distillation los modelos locales también pueden alcanzar rendimiento SOTA, así que pienso experimentar yo mismo por ese lado
    • Si usas Gemini normal y no la versión enterprise, toda la información sensible contenida en los prompts y respuestas queda expuesta al 100% ante Google
    • Como Google ya tiene mi correo, mi navegador, el sistema operativo de mi smartphone e incluso algunas de mis contraseñas, básicamente asumo que todos mis datos confidenciales ya fueron comprometidos
    • En teoría, las contraseñas no deberían mostrarse en pantalla, porque van directo desde el gestor de contraseñas a un campo de entrada ya censurado, así que no deberían aparecer en la captura
  • Es un concepto parecido a screenpipe; screenpipe ofrece más personalización
    github.com/mediar-ai/screenpipe

    • Soy el fundador de screenpipe; me alegraría ver más productos así: OSS, locales, sin vendor lock-in y amigables con API/MCP sería lo ideal
      Lo malo es que por ahora solo soporta macOS; yo últimamente uso principalmente Windows
  • ¡Gran proyecto! Tuve una experiencia parecida con Rewind y me preocupaban los temas de privacidad
    Como referencia, Rewind procesa el OCR localmente y solo envía los datos de texto
    Si se van a enfocar en macOS, podrían aprovechar VNRecognizeTextRequest y saltarse gran parte del proceso complejo de OCR
    Sobre todo si usan IA en la nube, también podrían usar un modelo ligero como BERT para detectar y enmascarar información sensible

    • No conocía VNRecognizeTextRequest, está increíble; gracias por mencionarlo
  • Me pregunto si, al capturar una videollamada de Zoom o una reunión similar sin grabarla como tal, legalmente igual hay que avisar que se está “grabando”
    También quisiera saber si hay alguna diferencia en los requisitos legales cuando existen subtítulos en vivo o funciones de transcripción

    • En mi estado, por lo general es ilegal capturar la pantalla de Zoom sin avisar que estás grabando; puede que no sea exacto, pero el punto clave es si se está guardando video a 1fps, no si luego se hace un resumen con IA
  • Este producto está realmente muy bien; exige mucho menos carga mental que usar directamente un time tracker tradicional
    También me gusta que haya opciones locales y opción BYO key para elegir el nivel de privacidad
    Siento que un producto de este tipo debió haber aparecido antes; esta vez de verdad parece estar muy bien hecho

  • Yo también solo estaría dispuesto a usarlo con modelos locales; es un producto realmente genial

    • Entre mis amigos y yo, las preferencias están divididas mitad y mitad entre local y nube; me gusta que cada quien pueda elegir entre calidad o privacidad según sus preferencias