Ask HN: Desde la llegada de la IA, ¿qué herramientas han creado para ustedes mismos?
(news.ycombinator.com)- Con la expansión de las herramientas de programación con IA, se está extendiendo la tendencia de que los desarrolladores creen directamente sus propias herramientas, y están apareciendo en masa utilidades pequeñas y personalizadas que antes se habrían descartado por su baja relación costo-beneficio en tiempo
- Lo más destacado son las herramientas especializadas para hobbies y la vida diaria, como experimentos de música y audio, conversión de medios, automatización del hogar y seguimiento de la salud; hay muchos casos en los que se sustituyeron apps comerciales por implementaciones propias
- Aparecen repetidamente herramientas de sandbox y orquestación para aislar y ejecutar en paralelo agentes de programación, así como herramientas de flujo de trabajo de desarrollo basadas en tmux/worktree
- También se incluye el debate sobre la autoría de la creación, con críticas de que "eso no lo hiciste tú, lo hizo la IA" y la réplica de que programar con ayuda de IA no siempre es vibe coding
- En áreas donde las apps descargables solo cubrían el 80~90% de las necesidades debido a anuncios, suscripciones o limitaciones funcionales, ahora también está cambiando la percepción hacia que es más rápido crear software personalizado que encaje exactamente con cada persona
- Chocan la postura de que "también hace falta habilidad para sacarle a la IA una app realmente útil más allá de solo teclear" y la respuesta de que "usar un LLM no tiene ciencia y se aprende en unos días"
Cambios que perciben los desarrolladores
- Existe la percepción de que hay que reaprender (unlearning) el "sentido del costo" acumulado durante toda la carrera, es decir, tareas que antes se evitaban por tomar demasiado tiempo ya no se ven igual
- Si se exige un alto nivel de calidad, rendimiento y mantenibilidad, todavía se sigue programando a mano, y también convive una postura cautelosa según la cual los límites del LLM se sienten como límites de hardware
- La perspectiva de un futuro en el que "el software de consumo se crea al instante y bajo demanda", y en el que el software personalizado se volverá algo común
- Aun así, también se plantea una visión equilibrada: todos los casos pueden quedarse en el nivel de "qué imprimiste con la impresora", y el valor de estas herramientas personalizadas solo se concreta si existen herramientas base confiables y deterministas
8 comentarios
Para empezar, al pasar mi blog personal de 23 años, https://xguru.net/, de WordPress a Cloudflare + Hugo, terminé haciendo yo mismo tanto la herramienta de migración como el CMS. Era una instancia pequeña de Lightsail, pero con esto logré reducir el costo mensual a cero. Además, las funciones simples las hago y uso con Workers. También manejo dentro del blog una herramienta de administración para reuniones de juegos de mesa. Y para el envío de correos uso Resend.
También hice una herramienta para traducir al coreano cartas/manuales de juegos de mesa y la estoy usando. Como compro muchos juegos en inglés que casi no salen en el mercado local, los traduzco al coreano solo para uso personal. Traduce, lo convierte en plantillas para aplicarlas a las cartas y hasta genera automáticamente un PDF listo para imprimir, así que resulta bastante práctico.
Fuera de eso, tengo herramientas de nicho tan adaptadas a mis necesidades personales que ni da para publicarlas, pero básicamente ahora hago y uso yo mismo cosas por las que antes habría tenido que pagar. Como decía arriba, creo que lo más grande ha sido reemplazar el lugar de los shareware con cosas hechas por mí.
Hice un enfriador para el acuario de camarones para prepararme para la ola de calor de pleno verano. Lo armé combinando bien un esp32, un módulo Peltier, HAOS y otros componentes. No tenía conocimientos de electricidad y electrónica, pero recibí mucha ayuda.
Hice un framework serverless llamado
dokkebi-cli... Tiene una arquitectura peculiar en la que la lógica de negocio se cifra y se ejecuta del lado del cliente. Por eso, al desplegar, se despliegan juntos el cliente y el backend. Se lleva de maravilla con Cloudflare y el rollback también se hace con un solo clic; además, al actualizar, los usuarios pueden ver de inmediato un mensaje de actualización en el sitio... El mayor problema, claro, es el tema del hackeo... Por eso es obligatorio usar Workers, pero como el uso de CPU es tan bajo, creo que su mayor ventaja es que se pueden operar proyectos MVP casi sin costo durante todo el tiempo que se quiera.Incluso ahora estoy pagando 5 dólares y probando la creación infinita de servicios, pero la tendencia será client-first, y WebAssembly (
wasm) se volverá lo principal.¡Guau, qué genial!
Desde la perspectiva de alguien que usa AWS, la presión por los costos ocultos de los recursos de cómputo es fuerte,
pero la idea de llevar la lógica de negocio al lado del cliente con Cloudflare me parece novedosa.
¿Un proyecto MVP sin gastar?.... yo también debería intentarlo.
Hice y uso una app de bandeja para directorios de trabajo, una en macOS y otra en WPF. Todos los días cambiaba de repositorio tres o cuatro veces y, cada vez que creaba un proyecto varias veces por semana, me daba flojera hacer
git init/pully ejecutar el agente o la terminal, pero con esto lo resolví.Comentarios de Hacker News
ddahlen: Estudio la mecánica orbital de asteroides, cometas y polvo, así que hice una herramienta de visualización precisa que muestra los movimientos de todos los asteroides conocidos del sistema solar
Si haces clic en un asteroide específico, muestra una órbita de altísima precisión que coincide con los cálculos orbitales de JPL, incorporando toda la física, el problema de muchos cuerpos, la relatividad y planetas no esféricos. No es muy amigable para móviles https://dahlend.github.io/ketev/
yungbeto: Por diversión hago muchos experimentos de audio. Pueden consumir bastante CPU
https://www.noisetable.xyz/ es una colección de canales de audio probabilísticos con una interfaz estilo VCR, y https://concrete95.net/ es una app web de música concreta que parece Windows 95. Trae audios aleatorios de freesound.org y te deja repetir fragmentos cortos, superponer pads de sintetizador o loops melódicos de sintetizador, así que sirve muy bien para crear ambientación de fondo. https://windso.me es un secuenciador por pasos basado en samples donde no puedes elegir los samples directamente, así que es divertido, pero todavía tiene bastante por pulir
michaelbuckbee: Lo más gracioso es Moniker, una utilidad gratuita que revisa el contenido de los archivos y les cambia el nombre según el contexto. Usa un modelo de IA local y además consiguió muy buen dominio https://finalfinalreallyfinaluntitleddocumentv3.com/
Lo más útil es HutchDB, un servicio MCP para guardar datos desde chats o agentes de IA. Si dices “save that to Hutch”, infiere el esquema y los campos, crea vistas web como Kanban, Timeline, Grid y Calendar, y también permite compartir resultados. Lo uso para seguimiento de tiempo, traspaso entre agentes y personas, y para comparar actividades de marketing con el número de suscriptores https://hutchdb.com
También me pregunto cómo puede ser gratis si está alojado en Vercel. Si se vuelve aunque sea un poco viral, necesito alguna garantía de que no lo van a cerrar por costos o convertirlo en un cobro de 500 dólares al mes. Después de registrarte, https://hutchdb.com/ redirige a https://hutchdb.com/dashboard y ni siquiera puedes ver la política de privacidad ni la página de términos
Jordan-117: Gemini me ayudó muchísimo a pasar de Windows a Linux
Ya me manejaba más o menos, pero al cambiar de sistema operativo aparecieron preguntas aleatorias y casos borde extraños, y si hubiera estado solo creo que me habrían faltado confianza, paciencia y tiempo. Fue muy bueno poder obtener respuestas inmediatas a problemas concretos sin sentirme juzgado ni tener que esperar una respuesta. También me sirvió mucho Gemini al volver de Chrome a Firefox, ya sea para encontrar alternativas a extensiones que usaba mucho o, si no existían, para hacerlas yo mismo. También estoy haciendo un plugin personalizado para Quod Libet con Gemini y Claude, con funciones como descarga de metadatos y letras sincronizadas, una barra lateral que resalta la letra mientras suena la canción, y un botón para marcar mis partes favoritas de cada tema. Después quiero crear una búsqueda de letras para toda la biblioteca
En tu propia área no tienes que perder tiempo leyendo relleno para principiantes, y en áreas que no dominas no te tienen que decir RTFM o LMGTFY solo por hacer una pregunta básica
Creo que es el resultado de la combinación entre que Google cada vez empeora más y que los problemas cotidianos se han vuelto tan complejos que hay que resolverlos con scripts o cosas parecidas. Hace poco incluso tuve el problema de encontrar “campings baratos y abiertos ahora cerca del Pacific Crest Trail”
ingvay7: Practico shredding en guitarra por las noches, pero por el trabajo casi no tengo tiempo para ajustar tonos en un simulador de amplificador, así que hice una herramienta donde, si escribes algo como “Brian May Solo Bohemian Rhapsody”, un LLM llena un contrato JSON y un script genera XML para cargarlo directo en el plugin
En 2 minutos casi ya se siente como tocar en Wembley ’85. Si generalizo el patrón, el LLM busca presets, le subes archivos para que ajuste con más precisión, y el código se valida antes de cargarse en el plugin. También estoy usando este enfoque de contrato/adaptador para Terraform, presets de motores de juego y pipelines de CI https://vishsubramanian.me/lm-guitar-tone-generator-polychro...
Desde la perspectiva de un principiante en guitarra, da un poco de miedo pero es una madriguera de conejo muy interesante. Estaría bueno tener prompts “expertos” para distintos arquetipos y géneros
netcoyote: Tengo algunas herramientas hechas para uso personal
sandvault https://www.codeofhonor.com/projects/sandvault/ ejecuta agentes en una cuenta de usuario separada de macOS y lo refuerza con
sandbox-exec. También soporta navegación sin interfaz y el iOS Simulator dentro del sandbox. clodpod https://www.codeofhonor.com/projects/clodpod/ ejecuta agentes dentro de una VM de macOS. git-multi-hook https://www.codeofhonor.com/projects/git-multi-hook/ es un despachador que resuelve el problema de que solo se permita un script por evento de hook de git. TubeGate https://www.codeofhonor.com/projects/tubegate/ es una extensión de Chrome que bloquea videos de YouTube por palabra clave, y push10k https://www.codeofhonor.com/projects/push10k/ es una app de iOS para llevar el seguimiento de 10,000 lagartijas. El blog fue hecho con ayuda de IA usando Zola, Sveltia CMS, Cloudflare Pages/Workers y GitHub Actions https://www.codeofhonor.comBalgair: Es una tontería, pero hice un scraper que junta todas las noticias, busca noticias relacionadas con guerras, las resume y luego las muestra con el crawl inicial y la música de Star Wars
Rantenki: Hice a mano en Rust una GUI para pen plotter y transmisor de G-code. Lo hice a lo bruto y el único usuario soy yo
A veces el proceso en sí importa, y también importa ejercitar la cabeza. Entiendo la ansiedad existencial de que la IA quite trabajos y excluya a los humanos del proceso creativo, pero igual puedes simplemente escribir código por satisfacción personal https://github.com/armyofevilrobots/bap-egui
wizenheimer: Publiqué un arnés de QA para Claude Code. En vez de ir haciendo clic por los flujos de pantalla a mano, lee los cambios en el código, encuentra los flujos de UI afectados y los prueba en un navegador real
Después de cada ejecución entrega grabación de pantalla, logs de consola, solicitudes de red, HAR y trace de Playwright para que puedas verificar exactamente qué hizo el agente https://github.com/wizenheimer/canary
Intenté publicarlo en Show HN, pero por alguna razón lo marcaron
DonaldFisk: El Dartmouth Summer Research Project on Artificial Intelligence fue en 1956, y la IA en sí se remonta incluso a robots como Elmer y Elsie de William Grey Walter en 1948, cuando se le llamaba cibernética
Desde los años 80 he hecho IA simbólica de forma intermitente, pero supongo que aquí se refieren a los LLM. No he usado LLM directamente, y hace poco implementé en C una red neuronal artificial multicapa con fines de aprendizaje. Antes intenté reconocer fonemas conectando por pipes de Unix un espectrograma de voz que hice en Lisp con una sola capa oculta; funcionaba bastante bien cuando solo había vocales, pero al añadir sonidos como l, r, s y z el rendimiento empeoró. El código en C no parece tener bugs, pero no sé cómo entrenar bien una ANN. He probado aumentar el conjunto de entrenamiento, añadir capas y cambiar la cantidad de neuronas en la capa oculta, pero las técnicas normales de depuración no sirven mucho
linsomniac: rediseñó el sistema operativo de su estación de trabajo con NixOS y Claude Code y fue un gran éxito
Le gustan las configuraciones reproducibles basadas en repositorios git de NixOS y poder arrancar con una configuración anterior cuando algo sale mal, pero aprenderlo e implementarlo manualmente es mucho trabajo. Lo probó durante unos 2 años, pero no llegó a una configuración completa de estación de trabajo, y como tenía que actualizar Ubuntu 22.04, decidió intentar seriamente con NixOS antes de pasar a 26.04. Esta vez configuró todo con Claude Code y lleva una semana usándolo sin que le falte nada. Primero lo instaló en una laptop vieja y luego siguió un enfoque gradual reinstalando su estación de trabajo actual; gracias a NixOS, configurar la segunda máquina fue trivial. Ahora, aunque el hardware muera, solo tiene que recuperar
/etc/nixosy volver a compilar. También creó con Claude Code unneovim.nixde unas 700 líneas con solo las funciones que quería, en lugar de LunarVim/AstroVim, incluyendo LSP y TreeSitterrockmeamedee: https://github.com/amedeedaboville/mish es un clon de mosh que usa una capa de transporte QUIC
Puede usar tanto datagramas no confiables como UDP como streams confiables tipo TCP, así que tiene buffer de scrollback. Gracias a QUIC, también puede delegar el cifrado y no hace falta confiar en que un LLM implemente criptografía por su cuenta. Usa alacritty para manejar la terminal y, gracias a russh, una implementación SSH en Rust, funciona incluso en entornos donde SSH no está instalado, por ejemplo Windows, que el mosh original no soportaba. Claude ejecutó pruebas end-to-end, simulación de red al estilo FoundationDB, pruebas del orden de hilos asíncronos de tokio, 12 objetivos de fuzzing y una verificación ligera del modelo del protocolo antes y después; encontró bugs en cada ronda de fuzzing. Salvo por los casos del tipo “puede haber bugs, pero la corrección está demostrada”, parece tan confiable como el original, o quizá más
stonlyb: Workhorse es un conjunto de scripts/herramientas CLI para convertir laptops viejas en nodos headless de cómputo y almacenamiento vía SSH, y hacer que la máquina principal les delegue trabajo
La pieza principal es
onpro, un script enrutador que revisa las máquinas, ejecuta comandos de forma remota y, si están dormidas o desconectadas, cambia automáticamente a ejecución local. Los hooksPreToolUseen la configuración de AI coding interceptan comandos pesados como builds, tests, ffmpeg, OCR o trabajos grandes de pandas para ejecutarlos en el workhorse en vez de en la MacBook Air. El agente decide qué ejecutar, y una capa determinista garantiza que las tareas pesadas vayan a la máquina correcta. Piensa compartirlo después de probarlo un poco más. https://motate.app/ fue un intento de facilitar la escritura matemática porque estaba repasando álgebra lineal mientras tenía que cargar a un recién nacido; ahora está pensando cómo volverlo más útil de forma más amplia para escritura y educación científica y matemáticaxlii: Tiene varios, pero hay algunos de los que está especialmente orgulloso
https://github.com/exlee/pikchr_pl es un DiagramIDE con estilo Amiga workbench donde se pueden crear scripts de diagramas Pikchr con TCL, Prolog, Pikchr y, recientemente, mruby. https://svg.axk.sh es un editor SVG semimanual para vectorizar fácilmente imágenes pseudo-vectoriales generadas por IA. https://github.com/exlee/rik es un arnés de IA que usa un editor de texto como UI y le da risa cada vez que lo usa. Tiene personalidad y hace comentarios disparatados, pero fuera de eso es un agente muy limitado. No es vibe coding, pero la IA le ayuda a superar con mucha más facilidad grandes puntos de fricción, como la parte en la que no quería volver a crear un algoritmo de ajuste SVG
pikchr-in-wasm. Solo había hecho un PoC y fue antes del AI coding, pero viendo DiagramIDE, quizá simplemente podría usar eso. Este hilo está haciendo que HN se sienta como una app store de cosas que me gustanmelvinroest: hizo una app de notas de voz parecida a Notas de Voz de Apple
Ahora sube las notas de voz a iCloud, Claude Code las convierte en notas estructuradas y la app también muestra esas notas. La idea es hablar una hora mientras camina, en flujo de conciencia, y luego Claude las ordena. Le gusta poder simplemente pensar en voz alta y que eso se estructure. Lo hizo con vibe coding y ya va cerca de las 20 mil líneas incluyendo tests. Funciona bastante bien, pero tiene bugs y necesita hacer algo de ingeniería real; el UX sí funciona bien
vtbassmatt: me di cuenta de que casi todo lo que hice son herramientas de hobby alrededor de juegos
un recetario para guardar las recetas que le gustan a mi familia y algún día dejar Pinterest https://github.com/vtbassmatt/Cookbook, un pipeline de extracción de datos y motor de búsqueda para el juego de cartas Mood Swings https://moodswingsdata.github.io y https://moodswingsdata.github.io/feelings, una app para iterar y crear junto con amigos cubos de Magic: the Gathering https://github.com/vtbassmatt/popcorn-cube, un motor de wiki personalizado para una línea de podcasts que me gusta https://github.com/vtbassmatt/totalus-wikium, y un visor web de logs de systemd https://github.com/vtbassmatt/djournal
aleqs: hice una herramienta genérica de linting para repositorios https://alint.org/ https://github.com/asamarts/alint
al principio era para reemplazar varios scripts de validación de higiene y estructura del repositorio que fui agregando mientras veía cambios flojos hechos por IA. Luego revisé varios repositorios open source para ver qué tipo de validaciones resolvían con scripts y las incorporé a la herramienta como tipos de reglas generales y extensibles. Permite definir de forma declarativa la estructura del repositorio, su higiene y otras reglas, y es muy rápida, así que va muy bien para flujos de pre-commit y CI https://alint.org/benchmarks/
shibel: en Tailscale, si apuntas un dominio al FQDN de una máquina compartida, ese dominio solo funciona para la gente con la que se compartió https://www.youtube.com/watch?v=Vt4PDUXB_fg
pero si quieres que el usuario no tenga que saber el puerto de una app específica, necesitas permitir en las ACL de Tailscale el acceso a los puertos 443/80 de ese host. Entonces, aunque immich.familydomain.com sea cómodo para la familia, serveradmin.familydomain.com en el mismo host también queda accesible desde la perspectiva de red. En enero más o menos, pasé unas horas con Claude escribiendo un pequeño gateway de autenticación en Go que consulta tanto la API pública de Tailscale como
localapiy responde a Caddy según los puertos a los que el usuario solicitante realmente tiene permitido acceder. Ahora puedo compartir apps y subdominios distintos según la persona sin perder el control de acceso que da solo el archivo de políticas de Tailscale. La razón de no usar algo tipo Authentik fue que, si los usuarios ya iniciaron sesión en Tailscale, no veía necesidad de instalar y configurar otra app grande para hacer lo mismo y obligarlos a autenticarse dos vecesSerenacula: tengo un script que toma un prompt de entrada, crea un script nuevo y luego ejecuta skills para ir revisando y eliminando bugs de forma gradual
con eso también hice otro script para listar y seguir todos mis scripts personalizados. También tengo una herramienta que carga scripts locales para acotar comandos de CLI a entornos de carpetas específicas. En conjunto, lo estoy usando para crear cualquier cosa que crea que se pueda automatizar. En algún momento pensé escribir una entrada de blog sobre esto, y recién hace poco sentí de verdad que el mundo del software personalizado ya cambió de manera real
neonglow: Hice una extensión de navegador que detiene por defecto la reproducción automática de imágenes animadas tipo GIF
Siempre me ha molestado que el navegador reproduzca imágenes animadas automáticamente, y todavía no hay un control integrado. La extensión muestra el primer fotograma y agrega botones de reproducir/detener sobre la imagen. Empezó como una utilidad personal, pero la publiqué en las tiendas de extensiones de Firefox y Chrome. Es un proyecto pequeño que resolvió un problema con el que me topaba todos los días. Firefox: https://addons.mozilla.org/en-US/firefox/addon/gif-control/ Chrome: https://chromewebstore.google.com/detail/gif-control/nhoihin... Se agradecen reportes de errores y comentarios. Antes lo publiqué en Show HN, pero no tuvo respuesta https://news.ycombinator.com/item?id=48208916
thatmf: Hice con vibe coding una pequeña web app instalable en la pantalla de inicio que me dice cuándo es mi primera reunión del día siguiente
Tengo muchas reuniones y cambian todo el tiempo, pero no quiero iniciar sesión en cuentas del trabajo desde el teléfono ni pensar en ese mundo. Solo quiero saber a qué hora tengo que levantarme. La app muestra únicamente la hora, y al tocarla puedo ver el título. También cambia la tipografía y el color según qué tan temprano sea la reunión, y si es antes de las 8 a. m. usa Nosifer. Podría haberla hecho yo mismo, pero probablemente no lo habría hecho. Creo que este tipo de utilidades simples, ultracentradas y personalizadas encajan perfecto con el vibe coding
asciimoo: Estoy creando Hister, un servicio de búsqueda self-hosted para reducir la dependencia de motores de búsqueda en línea y respuestas de IA https://hister.org/ https://github.com/asciimoo/hister
Hister es un indexador de texto completo para sitios web y archivos locales, y guarda automáticamente páginas visitadas ya renderizadas por el navegador. Ofrece interfaces de búsqueda web y de terminal con vista previa offline de resultados y un lenguaje de consulta detallado, y permite pasar rápido a motores de búsqueda tradicionales cuando hace falta. Da una experiencia favorable para la privacidad en búsquedas de tipo “recordar”, para encontrar contenido que el usuario ya visitó antes, pero todavía se queda corto en búsquedas de tipo “descubrir”, para encontrar contenido nuevo
hakunin: Hice un barredor basado en SQLite que recorre escaneos, notas, PDF e imágenes del sistema de archivos, guarda sus rutas y permite buscar el texto y las descripciones proporcionadas por Mistral OCR
Puedes hacer preguntas como “¿cuándo tengo que darle mantenimiento a mi auto?” o “encuéntrame el dibujo que mi hijo hizo para el Día de la Madre”. Levanta este chat de documentos como un ejecutable bash sobre Raspberry Pi https://github.com/maxim/ringbinder
alphaBetaGamma: Hice una herramienta para diseñar en CAD joyería inspirada en informática y ciencia
Escribí un DSL para describir joyería e hice que un LLM creara un intérprete que genera archivos CAD con cadquery. También me dejó la lección de que los LLM son malos para el razonamiento 3D. Sin IA no habría podido sacar tiempo para hacerlo. Como no soy desarrollador frontend, también usé IA para diseñar la tienda en línea, y me sorprendió ver a mi esposa, que no tiene formación técnica, modificar el sitio web con Claude Code. El resultado final es una tienda que vende joyería con formas como diagramas lambda (diagramas de Tromp) para calcular el número de Graham, o como operadores de punto fijo cercanos al Y-combinator. El Y-combinator real era menos bonito desde el punto de vista de la joyería https://studio-galois.com
mybbor: Antes de que la programación agéntica se popularizara, hice diseños de stickers para conciertos y festivales de música. Hacer stickers y repartirlos era una buena forma de conocer gente nueva.
También hice un agente coach de salud y bienestar con OpenClaw que lleva el seguimiento de calorías y alcohol y lo registra en un dashboard personal. Si le mandas una foto de una comida, estima las calorías, las registra, te ayuda a decidir qué comer y además te da ánimo. Usé el repositorio de HAM dashboard https://github.com/VA3HDL/hamdashboard para hacer un dashboard personalizado que reúne video local y feeds del clima, y por el mismo rabbit hole también hice una guía de referencia de radio local para Sonoma County https://mybbor.com/petaluma-sonoma-ham-radio.html. También hice casi 12 sitios web pequeños y de una sola función para varios intereses y proyectos, y me gusta usar un cargador de archivos con dominio corto para alojar rápido Markdown y HTML y compartirlo con familia, amigos y colegas. Corre sobre Caddy y un VPS de DigitalOcean, y publiqué el código https://github.com/RobbyMcCullough/honeydrop
yablak: Hice una herramienta para hacer backup de Google Photos de forma más incremental que Google Takeout https://github.com/ebrevdo/gphoto-pull
Después de irme de Google, también hice una versión linter de IFTTT que extrañaba https://github.com/ebrevdo/ifttt-lint
jfim: Hice un montón de herramientas.
Hice una herramienta de archivado web self-hosted con soporte para pipelines de procesamiento extensibles; por ejemplo, extracción de texto → traducción → resumen → generación de etiquetas, o descarga de video → separación de audio → transcripción → resumen. En el proceso también hice un navegador Chromium administrado con soporte para extensiones y WARC, además de un sintetizador RSS que genera feeds a partir de cualquier página de lista de artículos que no tenga RSS. También hay un bucle de aprendizaje activo para un modelo que limpia artículos eliminando ruido como anuncios nativos y bloques patrocinados. Hice además una terminal por pestañas con funciones de gestión de proyectos: levanta base de datos, servidor de aplicaciones y Claude Code de una vez por pestaña, y si la terminal lee http://localhost:4000/ abre automáticamente el navegador en la URL correcta. También tengo un servidor MCP modular al que puedo agregar y desplegar ideas de servidores MCP en unos minutos con Claude, además de un proxy MCP y OAuth2 DCR. Hay también una herramienta pequeña que renderiza conversaciones de Claude y permite enlazarlas en un vault de Obsidian con links como convo://claude-code/-home-jfim-projects-foo/. En general, lo uso mucho para desplegar contenedores Docker en mi entorno self-hosted. La mayoría está en GitHub, pero el nivel de preparación varía bastante.
joddystreet: Hice varias cosas.
Tengo una alternativa self-hosted a POPSQL https://github.com/p-raj/collab-sqlc, una alternativa a CleanMyMac basada en herramientas open source https://github.com/p-raj/open-cleanmymac, una herramienta que convierte reuniones de standup en cómics https://github.com/p-raj/standup-to-comics y un Pomodoro configurable https://github.com/p-raj/open-tomato. También tengo algunas herramientas privadas más que todavía ni siquiera están cerca de funcionar.
SdtEE: Me cansé de todos los comportamientos rarísimos que pasan cuando abres un CSV en Excel, así que empecé a hacer un visor de CSV rápido y liviano.
Después me di cuenta de que la técnica para cargar al instante archivos CSV de tamaño arbitrario se podía generalizar en combinadores de parsers incrementales y servir para cualquier formato. Así que puede leer no solo archivos, sino también fuentes orientadas a streams, como pipes. Usé IA en el desarrollo, pero como invertí mucho tiempo en diseñar una UX intuitiva y consistente, no hubo una gran mejora de velocidad. Todavía no está listo para producción, pero si te interesa puedes verlo https://github.com/Verticalysis/Hitomi
AJRF: El momento de “no puedo creer que esto haya funcionado” fue cuando hice con GLM 5 un driver en espacio de usuario para Ubuntu para el Nintendo Switch Pro 2 Controller.
Al conectarlo, el dispositivo era reconocido, pero al presionar botones intentaba iniciar el proceso de emparejamiento y no entraba nada a evtest. Esa explicación fue casi exactamente el prompt, y 10 minutos después ya había un driver, incluyendo una unidad systemd que seguía funcionando incluso después de reiniciar. Increíble.
josh_p: Hice un bot de Telegram que básicamente me manda una lista de cosas por hacer en la mañana y en la tarde. Está conectado a Google Calendar y a una base de datos de memoria bastante improvisada (SQLite), y mis hijos pidieron que hablara como Yarnaby de Silksong
También hice un respaldo automático de partidas de Steam para cuando mis hijos juegan el mismo juego en mi cuenta y los guardados de Steam Cloud se desincronizan, además de un script que relanza automáticamente los GitHub Actions fallidos en repositorios con pruebas flaky. Es de esos usos donde uno piensa que quizá ni valga la pena arreglarlo. También hace que las ramas se pongan al día con
mainautomáticamente. Tengo además una extensión de YNAB para un arnés de agentes pi que ayuda con capturas de compras que hay que clasificar por categoría, y la puse en el bot de Telegram para poder describir compras por voz. Ya tenía un script en Python que generaba PDFs para imprimir proxies de Magic: The Gathering, y con un LLM hice que generara separadores con nombres y símbolos de sets para que ordenar cajas grandes de cartas fuera más fácilgeedy: Estoy haciendo un kernel CAD BRep desde cero
Planeo liberarlo como open source cuando los filetes funcionen realmente bien. Va a tomar tiempo, pero he avanzado bastante desde que empecé hace 10 semanas. Mi objetivo a mediano plazo es sacar una app con GUI que importe archivos STEP y solo haga filetes de muy alta calidad. Creo que sería útil para muchos aficionados
smeej: Llevo mucho tiempo usando Logseq, y por suerte tanto Logseq como sus plugins son open source
Es muy divertido clonar plugins que uso seguido y decir “Claude, haz que esto también haga X”, agregando funciones que siempre quise tener
mike-cardwell: https://gitlab.com/grepular/calendiff monitorea URLs de .ics y avisa por email cuando hay cambios en el calendario
https://gitlab.com/grepular/foxcage ejecuta Firefox dentro de podman para aislarlo del host, y le agregué unas cuantas funciones que quería. https://gitlab.com/grepular/claude-sandbox es otra sandbox para Claude, también corre dentro de podman y tiene un sistema de proxy potente para proteger credenciales. Ahora estoy trabajando en una herramienta de saneamiento de email, y cuando quede en un estado que otros puedan usar voy a publicar algo en https://www.grepular.com/blog/. Aplica políticas a partes HTML/SVG/calendar/vcard para permitir o bloquear etiquetas, atributos, CSS y esquemas de URL; limpia URLs; obtiene contenido remoto al momento de la entrega y lo adjunta al email para evitar rastreo; y hace muchas otras cosas como cifrado y descifrado automático de PGP y S/MIME
eternityforest: Hice una app de seguimiento de inventario que funciona solo dentro del navegador con yjs y se sincroniza con peer.js, aunque últimamente ya no la uso mucho https://eternityforest.github.io/Stuffer/
No es una app, pero también tengo un sistema de productividad. Cada vez que olvido algo se lo cuento a una IA, y lo fui puliendo pidiéndole referencias de investigaciones sobre errores humanos relacionadas con ese tipo específico de falla https://github.com/EternityForest/THUNDERWARS
david_shi: En los últimos 3 meses hice que fuera muy rápido configurar nuevos agentes OpenClaw en la nube https://operator.io
Ejecutar múltiples agentes aislados dentro de Telegram, cada uno con su propia memoria y tareas, me ha servido para automatizar notificaciones, seguir contexto y funcionar como una corteza externa personal
flutas: Armé una configuración de Home Agent, con agentes especializados a medida que gestionan varios aspectos de la casa a través de Home Assistant
Intentan aprender de la retroalimentación de quienes usan la casa para ajustarse en los momentos adecuados. También hice varios MCP relacionados. Tengo además un servidor remoto de Claude Code, para poder ver una vista general a nivel proyecto y ejecutar o desarrollar proyectos en el servidor de casa en lugar de hacerlo localmente en la laptop. Soporta SSH y una web UI; la web UI tiene una lista de proyectos, una shell renderizada con https://xtermjs.org/ y una vista en mosaico para ver el fin de turno cuando trabajo en varios proyectos. De forma similar, la versión local levanta automáticamente contenedores podman con alcance por proyecto, pasa el directorio de trabajo, instala CC/Codex/Grok y transmite la autenticación y configuración de cada agente, luego te mete a una shell con flags de entorno y alias que desactivan los prompts de permisos. Por ejemplo, claude =
claude --dangerously-bypass-permissions. También hay un MCP enorme que permite a los agentes acceder a funciones avanzadas de Obsidian, sugerir, instalar y configurar plugins, etc. Me ha ayudado en la productividad diaria, pero en su mayoría sigo prefiriendo tocar el código directamente en vez de pedir que todo se haga solo con promptsdanielvaughn: Estoy haciendo un navegador para diseñadores. También es para otros, pero sobre todo lo hago para usarlo yo mismo
Trabajo con código, pero muchas veces no quiero crear ramas ni llenar el codebase con componentes y archivos de demo solo para explorar ideas. Si un navegador normal tiene herramientas de desarrollo, este navegador tiene herramientas de diseño integradas. Visitas una app, abres un canvas alrededor, arrastras piezas al canvas, haces trabajo tipo diseño y luego puedes volver a integrarlo al código. Todo se maneja dentro de la misma UI. Es lo bastante genial como para que vaya a lanzarlo públicamente, pero incluso ahora ya me resulta muy útil https://matry.design/
margarita_dev: Siempre tuve en mi lista de cosas por crear desde cero un lenguaje de programación, y lo terminé con ayuda de IA.
En el trabajo vi dos problemas grandes con los flujos de trabajo de IA y las bibliotecas de habilidades. Cuando todo el flujo de trabajo es un archivo Markdown de 100 pasos, falta determinismo, y las bibliotecas de habilidades en Markdown tienen poca composabilidad, así que terminan violando DRY. Margarita hace que Markdown y los operadores lógicos coexistan, para aportar determinismo con estructura de código cuando hace falta y pasar a código dinámico con LLM cuando conviene. Además, permite prompts componibles al estilo de React, lo que también resuelve el problema de las bibliotecas de habilidades con texto disperso por todos lados. La reacción en Reddit fue tibia, así que probablemente lo deje, pero el proceso de construirlo fue muy divertido. Hice agentes de código para casi todos los proveedores de LLM y también armé mi propio arnés, y fue una gran experiencia de aprendizaje, así que lo recomiendo https://www.margarita.run https://github.com/Banyango/margarita
jtap: Sigo creando una herramienta para escanear e indexar cartas de Pokemon para mi hija, mis amigos y para mí https://MyBulkCards.com
Está compuesta por una app móvil y un sitio web; la app escanea cartas con la cámara, pasa la imagen por varios modelos y luego guarda la carta junto con su ubicación. Es básico, pero permite guardar ubicaciones de cajas como “Box 1 AAA, Box 1 BBB …” para encontrar las cartas fácilmente. También tiene una función de amigos para ver qué cartas tienen los amigos cercanos, y nos prestamos cartas con frecuencia. Ha sido realmente muy divertido construirlo, y acaban de aprobarlo en la tienda de apps de Android. Voy a ordenarlo un poco más y planeo lanzarlo pronto.
Yo uso una herramienta que hice para ayudar con el proceso, porque me resultaban engorrosos pasos como estos al seleccionar fotos desde la app Photo y escribir posts para mi blog personal con
hugo:imagedel blog dehugogit commitAdemás, le agregué una función que clasifica muchas fotos tomadas después de un viaje según tiempo y ubicación para poder agruparlas de forma adecuada y escribir un post del blog, así que también me resulta muy útil para dejar registro de mis viajes.