Las 28 herramientas de IA que me gustaría tener

(sharif.io)

19 puntos por GN⁺ 2025-10-02 | 2 comentarios | Compartir por WhatsApp

A septiembre de 2025, han aparecido potentes modelos de IA como Claude Opus 4.1, GPT-5 y Nano Banana, marcando la llegada de una edad de oro para el desarrollo de software
Con el entorno actual de la IA como telón de fondo, se proponen 28 herramientas de IA innovadoras que no existen de verdad, pero que sería genial que existieran
Las ideas propuestas abarcan diversos campos, como productividad personal, desarrollo de código, salud y creación de contenido
Las características que se enfatizan en común son la conciencia del contexto, la personalización para el usuario y la capacidad de mejora mediante aprendizaje automatizado y bucles de retroalimentación
En lugar de los agentes generales de hoy, se propone el concepto de agentes de IA especializados de propósito único y un marketplace donde puedan intercambiarse

Las 28 herramientas de IA propuestas

1. App de cámara basada en Nano Banana

Una app que convierte fotos comunes de iPhone para que parezcan tomadas con una Leica

2. Agente para añadir modo claro/oscuro automáticamente

Añade automáticamente soporte para modo claro, modo oscuro y temas personalizados a cualquier proyecto frontend
Usa visión para revisar cambios en la UI y hace ajustes iterativos con base en la UI renderizada

3. Agente para decompilar y depurar código ofuscado

Decompila código minificado en una base de código legible y lo depura
Requiere un potente bucle código-depuración

4. Un híbrido entre la app Strong y ChatGPT

El modelo accede a datos de entrenamiento y sugiere mejoras y coaching
Se puede chatear con un modelo que conoce el contexto detallado, incluso el tiempo entre cada serie

5. Motor de recomendaciones

Analiza el historial de navegación para identificar qué posts de blog o artículos se leyeron durante más tiempo
Cada noche busca en la web contenido que valga la pena leer y entrega un digest de links por la mañana
Mejora el digest del día siguiente con retroalimentación sobre recomendaciones buenas y malas

6. App de chat para registrar calorías

App de chat basada en una base de datos nutricional
Minimiza el esfuerzo cognitivo necesario para registrar comidas

7. App minimalista para escribir contenido de formato largo

El modelo resalta pasajes y deja comentarios en los márgenes
Permite configurar distintas "personas" para revisar lo escrito

8. Agente constructor de agentes de IA especializados

Si recibe una descripción como "créame un agente para decompilar código", genera automáticamente un agente hiperespecializado

9. Lector de ebooks minimalista

Mientras lees un ebook y resaltas un pasaje, el modelo lo explica con más profundidad al lado
Asume la persona del autor
Debe sentirse como una extensión del libro, no como una instancia de chat separada

10. Agente de Deep Research que razona durante varios días

Permite consultas extremadamente complejas
Crea cientos de subagentes y devuelve una respuesta tras razonar durante 3 días

11. App para hacer películas tipo paint-by-number

Hace brainstorming de ideas para cortometrajes y el modelo genera un storyboard detallado
El usuario solo tiene que grabar con su smartphone cada escena del storyboard
Funciona como rueditas de apoyo para hacer cine

12. App de grabación de pantalla y resumen semántico

Usa un modelo local para generar un resumen semántico detallado de lo que haces cada día en la computadora
Lo entrega como contexto a una app de chat: "¿A quién olvidé responderle ayer?"
Usó Rewind durante un año, pero no fue tan útil como esperaba

13. Filtro semántico para Twitter/X/YouTube

Permite escribir filtros abiertos como "ocultar tuits que probablemente me hagan enojar"
Elimina del feed el contenido que provoca enojo
Al dar forma al feed, nos damos forma a nosotros mismos

14. Agente para generar currículums personalizados sobre temas de nicho

Atiende pedidos como "quiero aprender todo lo que sabemos sobre la ciencia del progreso"
Busca en la web personas, blogs, videos de YouTube, ensayos y libros de texto
Lee todo el contenido y ofrece un currículum que te guía de principiante a experto

15. Un motor de recomendaciones de libros realmente bueno

Primero hace un quiz sobre lo leído antes, tus metas y el tipo de lectura que disfrutas
Cuando ya sabe mucho, otros agentes simulan cómo crees que reaccionarías a las sugerencias del agente principal
Solo saca a la superficie libros que es muy probable que disfrutes

16. Motor de búsqueda semántica para TikTok e Instagram Reels

Permite acceder a información útil atrapada en videos cortos
Necesita una función de búsqueda consultable

17. App de fitness del sueño

Integra datos de Apple Watch (frecuencia cardíaca, VO₂), Eight Sleep, Oura Ring y apps de entrenamiento
Da recomendaciones prácticas para mejorar el sueño y la recuperación
Envía mensajes de forma proactiva: "Tu HRV bajó esta semana, ¿podrías estar sobreentrenando?"

18. Biblioteca masiva de componentes

Diseñada para renderizarse dentro de una interfaz de chat
Las bibliotecas existentes tienen primitivas demasiado de bajo nivel
Prioriza widgets de alto nivel por encima de la personalización

19. Asistente de voz minimalista para Apple Watch

Para preguntas demasiado complejas para Siri, pero adecuadas para ChatGPT
Da respuestas cortas de unas pocas palabras

20. App de escritura que ofrece listas de lectura recomendadas

Busca en la web sobre el tema que estás escribiendo y arma una lista de materiales que podrían ayudarte
La app de escritura no debe escribir en lugar del usuario

21. App para correr

Genera planes personalizados y hace seguimiento del ritmo y la frecuencia cardíaca al correr
Ajusta iterativamente el programa de entrenamiento con base en datos reales

22. Superapp de edición de fotos con Nano Banana

Ofrece cientos de plantillas sin necesidad de escribir prompts
Probar peinados distintos, predecir cómo se verían hijos con tu pareja, hacerte ver como The Rock, etc.

23. Búsqueda de videos de YouTube al estilo Same.energy

Introduces una URL y encuentra videos con una vibra similar
El algoritmo actual de YouTube solo se enfoca en maximizar la interacción del usuario promedio

24. Dispositivo estilo Sony Walkman para niños

Dispositivo centrado en la voz con el que se le puede hacer preguntas a un LLM
Se enfoca en las explicaciones y es un dispositivo sin pantalla alguna
Mejor aún si es offline-first

25. Motor de búsqueda biográfica

Permite consultas basadas en cuestionarios sobre el problema actual, etapa de vida, campo, etc.
Devuelve como resultado capítulos de biografías/autobiografías de grandes figuras históricas que trataron situaciones similares

26. Agente de auditoría del consumo de contenido mediante grabación de pantalla

Observa el uso de la computadora y el smartphone
Audita cada día el contenido consumido
Screen Time no es lo suficientemente específico
Hace falta conocer el valor nutricional exacto de los tokens que consumimos

27. Marketplace de agentes de IA para tareas de nicho

En vez de agentes de propósito general, serían mejores agentes diseñados para casos de uso específicos
Un catálogo de agentes hiperespecializados para tareas de nicho, como encontrar un departamento en renta en San Francisco
Hacen falta decenas de miles de agentes utilizables vía web o API

28. Función para pedir la crítica de autores famosos

"¿Qué diría Hemingway sobre este post de blog?"
Identifica las partes que le confundieron y las que le gustaron

2 comentarios

shakespeares 2025-10-07

Los puntos 2 y 3 de verdad ojalá se pudieran hacer automáticamente.
Parece ser una de esas tareas repetitivas que da flojera tener que seguir agregando una por una.

GN⁺ 2025-10-02

Comentarios en Hacker News

Creo que hay que ser realmente cautelosos con "24. darles a los niños un dispositivo estilo Sony Walkman para que puedan hacerle preguntas a un LLM"
- A menos que sea AGI, las respuestas que escuche un niño serán en su mayoría muy precisas, pero una cantidad muy pequeña de respuestas incorrectas o malentendidos sutiles podría afectar de forma crítica su proceso de aprendizaje
- Incluso si fuera un LLM perfecto que nunca se equivoca, al final disminuiría la necesidad de comunicarse con otras personas, así que también se reducirían las oportunidades de desarrollar habilidades de colaboración
- Como padre, uno quiere un pequeño respiro, pero si el niño descubre un dispositivo que siempre responde de inmediato, desaparecerá ese valioso tiempo de vínculo compartido buscando juntos las respuestas. El niño podría ir distanciándose cada vez más de sus padres. Hay que pensar qué valores se le transmitirán
- Los padres que les ponen este tipo de sistema a sus hijos parten de la idea de que su visión del mundo y sus valores estarán bien reflejados en ese sistema. Los padres en HN quizá tengan una visión centrada en la ciencia, pero en otros países o regiones ese dispositivo podría convertirse en una herramienta de propaganda política, religiosa o cultural. Hay un gran riesgo de que este tipo de herramienta se use como arma de adoctrinamiento
- Creo que se pueden obtener resultados mucho mejores que preguntándole a un maestro de escuela
- Hace dos días le pedí a ChatGPT que explicara el sistema de valor posicional para que lo entendiera un niño de seis años. Pero confundió los conceptos de valor posicional y valor numérico, y dio una explicación incorrecta. Yo detecté el error y ChatGPT se disculpó, pero si el niño lo hubiera preguntado directamente, no se habría dado cuenta.
  Me preocupa cuánta información errónea podría terminar creyendo como verdadera mi hijo si usa un dispositivo así
Sobre la idea 19, hace unas semanas hice algo parecido yo mismo con iOS Shortcut

Es un asistente de voz mínimo para Apple Watch. Con Siri es difícil hacer preguntas complejas, pero con ChatGPT no hay problema. Las respuestas llegan como frases breves y concisas de no más de 150 caracteres
Recibe la voz con la acción Dictate Text, la envía a la API de OpenAI y usa un prompt de sistema como este
“CRITICAL: Como la respuesta solo se mostrará en una notificación push de iOS o en la pantalla del reloj, responde de forma concisa en menos de 150 caracteres. Prohibido usar Markdown, solo texto plano. Usa vocabulario y puntuación mínimos pero pulidos.
El usuario no puede hacer preguntas de seguimiento sobre la respuesta. Da una sola oración a la vez y, si hace falta, también debes asumir cosas sobre la pregunta; si la suposición es incorrecta, el usuario tendrá que preguntar otra vez.”
Funciona bastante bien. La mayor desventaja es que tarda entre 5 y 20 segundos en devolver una respuesta. Pero enviar la pregunta es casi instantáneo (no hace falta abrir otra app), así que me resulta muy satisfactorio
Lo que siento con muchas de estas ideas/artículos es que no están "pensando con portales" respecto a los LLM. Tenemos una tecnología del nivel de la "portal gun" (o al menos así la venden), pero da la impresión de que solo se está usando como una puerta mejor
- Lo que un LLM puede hacer, al final, es extender texto de manera lógicamente conectada. Las posibilidades de aplicación son amplias, pero en la práctica cuesta pasar de ser un editor de texto avanzado. Por ejemplo, si quisieras usarlo para edición de video, tendrías que crear un lenguaje de scripting y además sincronizar funciones con el editor. Para una gran empresa como Adobe, el valor frente al esfuerzo humano es ambiguo, y una startup tendría que competir durante años con Adobe en funciones y lock-in de usuarios. En ninguno de los dos casos hay mucho atractivo, salvo que el LLM sea realmente revolucionario. Además, el LLM no puede ver directamente el resultado en video y, por ahora, está apenas en un nivel "más o menos"
- Estoy de acuerdo con ese punto de vista. Si tienes algún material recomendable sobre "thinking with portals", me gustaría que lo compartieras
- Si hubiera algún ejemplo de pensar con portales, estaría bueno que lo compartieras de forma simple y fácil de entender
Sobre la idea 22, me gustaría que existiera un motor que analizara mi historial de navegación, detectara qué tipo de blogs o artículos leo durante más tiempo y cada noche encontrara contenido recomendado que todavía no haya visto
ChatGPT Pulse existe de forma similar. Este servicio usa tu historial de ChatGPT en lugar del historial del navegador, pero para quienes usan mucho ChatGPT puede ser una recomendación más confiable
https://openai.com/index/introducing-chatgpt-pulse/
- En la práctica, se podría decir que casi todos los feeds algorítmicos de redes sociales ya cumplen ese rol
Creo que la mayoría de las ideas propuestas en este texto se parecen más a pedir que al LLM base solo le hagan una UI/UX un poco mejor
Siento que en esta forma de pensar hay un error categorial fundamental
Como ejemplo, está la función de "¿cómo habría evaluado Hemingway mi texto?", pero en realidad la respuesta la genera esa IA; no es una evaluación real de Hemingway
Si se lo preguntas a 100 modelos, obtendrás 100 respuestas distintas, y la forma de pensar o la personalidad real de Hemingway no puede reconstruirse por completo a partir de unos cientos de miles de palabras de su obra.
Al final, la cuestión es si "esto realmente puede sonar de forma plausible como algo que diría esa persona"
Queremos oír la evaluación de una figura famosa porque se trata de la perspectiva de una persona real y viva. La imitación de la IA es como intentar comer una foto de un sándwich en lugar de un sándwich real
Me inquieta un poco que mucha gente no trace una línea más clara frente a esta ilusión
- Coincido al 100%
  Pero al leer este comentario pensé en el holodeck de Star Trek TNG. Ahí recrean personajes famosos como Einstein o Freud, y como espectador, incluso a los 15 años, no pensaba "esto son solo respuestas aleatorias escupidas por una computadora"
  De hecho, hay episodios donde se equivocan al recrear a una persona real solo con registros (https://www.imdb.com/title/tt0708682/), y más adelante se muestra cuán diferente es realmente (https://www.imdb.com/title/tt0708720/)
  En resumen,
  1. Sentí que esos episodios realmente estaban adelantados a su época
  2. No me generaba ninguna incomodidad esa recreación falsa de personajes históricos, así que yo mismo me pregunto por qué en el contexto de los LLM sí me resulta más sensible. Quizá porque desde el inicio todos sabemos que es 100% falso, o quizá por alguna otra razón...
    Este artículo me dejó pensando en varias cosas
- Puedo explicar de forma simple por qué realmente no hace falta un AI Hemingway. De hecho, ya hace como 10 años aparecieron buenas guías de escritura como hemingwayapp https://hemingwayapp.com/
  Con reglas simples corrige la gramática y te anima a usar expresiones más sencillas. De hecho, como no reescribe automáticamente, incluso puede ser mejor para aprender por cuenta propia
- Al ver muchas ideas como "una app de edición fotográfica ultraminimalista como Banana, cientos de plantillas sin prompts...", al final se nota el deseo humano de vivir cada vez con más pereza. Cosas como "qué habría pensado Hemingway" me generan una sensación parecida
- La esencia está en si "esto es una respuesta plausible al estilo de esa persona, al punto de poder engañar a un humano", y en realidad eso por sí mismo ya es útil
  Si el humano es consciente del engaño, a eso lo llamamos make-believe, o suspensión de la incredulidad
  Pasamos por este mismo proceso cada vez que interpretamos a alguien o intentamos pensar desde otra perspectiva. Lo mismo cuando tratamos de aprender de registros de personas reales o de personajes de ficción
  Creo que es al revés eso de "quiero escuchar la evaluación de Steve Jobs/Hemingway porque es un ser humano real"
  En realidad, lo importante no es tanto el humano real con quien conversamos, sino la personalidad resumida del famoso o personaje tal como la imaginamos. Casi nadie está obsesionado con cómo era realmente esa persona
  El "Hemingway celebridad" mitificado es en sí mismo más atractivo. Incluso es más útil e interesante que el real
  Por eso, como en el caso de Star Trek TNG, creo que esas simulaciones virtuales de personas en realidad funcionan bien justo para lo que buscan hacer
- Feynman decía que "el primer principio de la ciencia es no engañarte a ti mismo", y creo que eso también aplica a los resultados de los LLM
Es realmente interesante
Todos ya vimos muchos demos de esta lista o tecnologías similares, y ya hay muchas startups que durante años han quemado cientos de millones de dólares para construir productos
Y aun así casi no se ven productos realmente útiles, y las cosas con las que uno se topa en el día a día no funcionan tan bien como en los demos
Me pregunto qué demonios está pasando.
O sea, si los productos realmente existen pero casi nadie los usa, o si usar modelos suficientemente buenos sale demasiado caro, o si hacer un demo impresionante es mucho más fácil que construir un producto real... tengo curiosidad por todas esas posibilidades
- El costo de llegar a los usuarios objetivo correctos es demasiado alto
  Cuando hablé con una agencia de publicidad para apps fintech, me dijeron que hay que gastar algo así como 20 mil dólares al mes durante 3 meses para entender cómo funciona, y solo después de eso baja el CAC y puedes conseguir a los usuarios objetivo
  En cuanto apagas la publicidad, la gente vuelve a dejar de conocer el producto y se corta la llegada de nuevos usuarios. Te quedas sin forma de dar a conocer siquiera que existe
Muchas de estas ideas requieren conocer los gustos, patrones, comunicación, agenda y datos de salud del usuario
Apple realmente podría tener mucha ventaja en este terreno.
Como el teléfono y el reloj son los que más información personal conocen, Apple podría combinar de forma inteligente distintos contextos con un LLM bajo la premisa de proteger la privacidad
Hice clic en el enlace y me decepcionó descubrir que no era una herramienta real, sino más bien una colección de ideas de apps sin mucha relación entre sí
"Un dispositivo estilo Sony Walkman para que los niños puedan hacer preguntas por voz a un LLM"
No coincide al 100%, pero https://www.aliexpress.com/item/1005009196849357.html se parece bastante.
No es offline, pero es apenas un poco más grande que una pelota de ping-pong
Hice que mis nietos (de 5 y 3 años) aprendieran a usarlo en 2 minutos, y después bombardearon con montones de preguntas como "cuéntame la historia del unicornio Bob" o "¿un perro y un mono pueden ser amigos?", y para todo dio respuestas plausibles en pocos segundos
Creo que para Navidad veremos este tipo de producto integrado en juguetes, y apenas salga pienso comprarlo