Ask HN: ¿Cuándo fue el momento en que viste GenAI y pensaste “ah, estamos en problemas”?
(news.ycombinator.com)- Un hilo donde la gente comparte experiencias concretas de uso real en las que primero descartó DALL-E y ChatGPT como trucos pasajeros, pero luego quedó impactada al descubrir los límites de sus capacidades
- El caso más popular fue el de la ingeniería inversa de firmware en hardware antiguo o descontinuado, con experiencias reviviendo sintetizadores, pianos y Firesticks usando Claude/GHIDRA
- Más allá de programar, aparecen muchos casos en ámbitos no profesionales donde se usaron LLM para resolver problemas cotidianos como reparación de electrodomésticos, inspección inmobiliaria, litigios legales y diagnóstico HVAC
- Algunos también relatan momentos negativos de "oh shit", como deterioro en la calidad del código, alucinaciones, confianza ciega sin verificación y preocupación por la desaparición de empleos
- Los momentos de impacto varían según la época: lanzamiento de ChatGPT (2022), GPT-2/GPT-3, llamadas a herramientas (
tool calling), agentes y otros puntos de inflexión distintos para cada persona
Ingeniería inversa de firmware y hardware
- Para reemplazar software discontinuado de un sintetizador Alesis QS8.1 de los 90, alguien analizó con GHIDRA comandos sysex y un protocolo de codificación de ondas no documentado, y completó un demo funcional en una sola noche
- Después de que un piano Kawai CA49 quedara inutilizado por un firmware erróneo, Claude decompiló un APK de Android, encontró una clave de cifrado hardcodeada, descifró el firmware y lo recuperó en una hora con un script de flasheo por Bluetooth
- Se analizó con GHIDRA el cifrado Blowfish del DVD The Complete New Yorker, se mapearon credenciales y se reimplementó con un script en Python, convirtiendo todos los archivos a PDF normales
- En un Amazon Firestick de primera generación, sin usar un exploit público de root, alguien tomó el código fuente del kernel y aplicó un parche en memoria del kernel en vivo usando una "primitiva de escritura-cero en kernel FBUF/VCHIQ", logrando root permanente y debloat
- Con solo un binario propietario compilado en C++ de un proveedor y una captura de red breve, se hizo ingeniería inversa de un protocolo propietario con el desensamblador NSA Ghidra, describiéndolo como "sentirse degradado a QA no técnico"
-
Opiniones relacionadas
- Está desapareciendo el foso de datos (
data moat) que antes se formaba en SaaS por lo difícil que era integrar y migrar - Usando Claude Code, alguien hizo ingeniería inversa desde APIs internas del MCP de un SaaS oculto tras un plan enterprise, y en poco tiempo creó un MCP con más funciones que el oficial
- Claude depende menos que un humano de los nombres de variables, así que hace falta menos trabajo de renombrado y
typedef
- Está desapareciendo el foso de datos (
Resolución de problemas cotidianos y no especializados
- Durante un feriado de 2025, alguien le pidió a Gemini que diagnosticara por video un furnace averiado; logró hacerlo arrancar girando manualmente el ventilador de extracción, aunque en los comentarios advirtieron del riesgo de monóxido de carbono por anular el seguro del ventilador
- El autor aclaró que solo ayudó al arranque por un problema de rodamientos y que no fue una anulación, además de que el monitor de monóxido no se activó
- Cuando falló el enfriamiento del AC, ChatGPT diagnosticó por fotos que había que reemplazar un capacitor de $25, y la persona lo reparó por su cuenta por una cuarta parte del costo de una visita técnica
- Para un secador a gas que no calentaba, Gemini identificó en una foto la ubicación del fusible térmico (
thermal fuse) e incluso dio un enlace al repuesto; se resolvió con un fusible de $5 y limpieza del ducto de ventilación - En la compra de una propiedad, alguien le dio a un modelo fotos de Zillow y números de serie de electrodomésticos para redactar un informe de inspección, y logró detectar inundación en zona baja, circuitos de receptáculos mezclados y revestimiento deformado que un inspector pagado de $750 no vio
- Aun así, también hubo escepticismo sobre si se puede determinar solo con fotos si pertenecen al mismo circuito
- Con el nombre del modelo borrado de una bomba para estanque de koi, se identificó el modelo usando una foto y medidas de longitud (11 pulgadas = 4500, 9 pulgadas = 2500), lo que permitió reemplazarla por $109 en vez de pagar un presupuesto de $700
- En una demanda por fraude bancario, alguien cruzó verificaciones entre ChatGPT, Grok, Claude y Gemini y llevó una contrademanda (
counter-suit) 100% con IA, aunque también le recomendaron consultar a un abogado y le advirtieron que los chats no son privilegiados y pueden ser citados
Cambio en flujos de trabajo de programación y desarrollo
- Después de que una actualización de firmware de una impresora Brother cambiara una página CSV a HTML, desde un directorio con un solo HTML estático y un "hello world" en Go, con una sola ejecución de
/initse generó automáticamente un exporter de Prometheus en Go, infiriendo incluso la IP por defecto y el parsing de métricas - Una app web en Oracle Apex con 70 mil líneas de PL/SQL se comprimió en 700 líneas de requisitos de negocio en Markdown en 15 a 20 minutos
- En una ONG pequeña, Claude reescribió mientras su usuario dormía una app sobrearquitectada con NextJS, React y microservicios a 80% Django con renderizado del lado del servidor, reduciendo costos de servidor y complejidad
- ChatGPT Code Interpreter (2023.3) cargó un CSV en Pandas, generó gráficos y lo exportó a SQLite; se recuerda como la "primera experiencia antes de que existiera el nombre de agentes de código"
-
Experiencias negativas y escépticas al programar
- Un revisor automático de PR con IA alucinó afirmando que una PR que solo borraba cosas "agregó un nuevo RPC" y aseguró contenido que no existía
- Un colega fue excluido del proyecto por producir miles de líneas de
slop, como cambiarassert status == 200por== 500solo para hacer pasar tests - Hay escepticismo de que, si la especificación es ambigua, el código se vuelve verboso o el diseño flojo, por lo que la mejora de productividad no es tan grande desde la perspectiva de calidad y escalabilidad reales
- Se observó que de Opus 4.6 a 4.7 y 4.8 mejoran habilidades pequeñas, pero empeora la capacidad de "saber qué hay que hacer"
Ámbitos no relacionados con código, creación y cognición
- Al mostrarle una foto de una planta a Claude, reconoció la especie, diagnosticó el problema y explicó cómo hacer esquejes; impactó que "la computadora no estuviera hablando de computadoras sino diagnosticando una planta"
- Suno compuso una canción sobre el perro de la familia con un estribillo estilo K-pop, y eso llevó a pensar que la creatividad era lo que diferenciaba a humanos y máquinas
- Al subir un dibujo propio, un boceto anatómico, el modelo señaló problemas como "hombros redondeados, perspectiva incorrecta y falta de representación del deltoides", y además marcó coordenadas con un script de Python para etiquetarlas
- En un experimento científico infantil sobre electromagnetismo, una videollamada con Gemini detectó un recubrimiento aislante no retirado en una conexión de batería con más precisión que a simple vista, resolviendo el problema
- En un trabajo satírico con emojis para presidentes de EE. UU., sugirió un emoji de cereza para Zachary Taylor por la anécdota de su muerte tras comer en exceso, y llamó la atención su cualidad colaborativa, como "trabajar en un taller juntos"
Puntos de inflexión negativos o centrados en preocupaciones
- Alguien se alarmó al ver que un colega enviaba una PR enorme llena de
slop, diciendo que no necesitaba revisión y desconfiando de ingenieros humanos mientras pegaba logs de chat de Claude; temía que "trabajar con psicosis por IA" fuera el resto de su carrera- Desde esta mirada, los LLM amplifican las capacidades —tanto positivas como negativas— y aumentarán la conducta antisocial
- Ante una implementación de proxy HTTP que sonaba convincente y reforzaba el propio juicio, pero era completamente insegura porque no entendía el RFC, alguien reaccionó con un "estamos jodidos"
- En un hackathon de empresa, causó shock ver a un equipo tratando como hechos y queriendo convertir en producto salidas de un LLM sin verificarlas: "de verdad creen que este generador de texto razona"
- Se critica que la exageración de CEOs sobre una "sustitución del trabajo de oficina en 12 a 18 meses" infló demasiado las expectativas, chocando con una realidad llena de alucinaciones y malas indicaciones en la que no se puede confiar
- También generó rechazo la actitud de imponer centros de datos por vía judicial pese a la oposición de habitantes de pueblos cercanos
- Como ejemplo reproducible de la no determinación de los LLM, se mostró que ante una pregunta como "cuántas veces aparece la letra d en los días de la semana", daban respuestas inconsistentes como 6 en Firefox y 7 en Chrome, sin consistencia ni consigo mismos
Diversidad de puntos de inflexión según la época
- En 2016, el cambio de Google Translate a redes neuronales volvió por primera vez práctico traducir entre japonés e inglés, pero se seguía pensando que todavía no podía traducir significado real; luego, en 2022, ChatGPT impactó por captar antecedentes pronominales y contexto de palabras polisémicas
- Algunos señalan el anuncio de GPT-3 como un "salto cualitativo", y consideran que el chat y las llamadas a herramientas después fueron más una evolución de ingeniería que un avance científico
- Otros ven GPT-2 y los GAN en 2019 como el momento en que se pasó de "obviamente falso" a "a veces real", y creen que desde entonces la mayoría de los cambios han sido graduales
- Hay quien sintió con el lanzamiento de ChatGPT (2022.11.30) el "fin de la era del programador tradicional" y al día siguiente probó su primer loop de programación agéntica
- También aparecen momentos distintos de revelación como la medalla de oro IMO 2025, la capacidad de generar oraciones nuevas y el uso de llamadas a herramientas, todos vividos como instantes en que "la inteligencia realmente fue modelada"
3 comentarios
Creo que es natural que hagan bien cosas nuevas y que sus funciones mejoren, pero cada vez que les pido algo sencillo y veo que el costo cobrado es enorme, pienso: esto sí está grave.
Definitivamente hay partes sorprendentes del lado de hardware/firmware.
No había app para Mac del hardware que recibí por Kickstarter, pero cuando le di el binario de la versión de Windows y le pedí que lo analizara,
Codex terminó creando DLL falsas con la API de Windows relacionada con USB, metió código de hooking, capturó todos los mensajes que iban y venían, y con eso me hizo una app para Mac casi igual.
Lo único que le indiqué fue: "analiza la versión de Windows y hazme una para Mac".
Opiniones de Hacker News
jzemeocala: Compré muy barato un Alesis QS8.1, un piano digital/sintetizador avanzado de los 90, pero todo el software relacionado está tan viejo que me cansé de usar WINE cada vez.
Así que quise crear un reemplazo moderno y multiplataforma que combinara funciones de varios programas, y aunque pensé que sería muy difícil porque casi toda la comunicación era por comandos SysEx, Claude me guio para analizar el software original con GHIDRA; esa misma noche ya tenía un demo funcionando y ahora le estoy agregando funciones nuevas.
Como la OTA no funcionó, extrajo y descifró el firmware del piano, e incluso escribió un script de flasheo para programar el piano por Bluetooth desde mi laptop, así que el piano revivió en menos de una hora.
Con un poco de conocimiento, se volvió trivial analizar cualquier protocolo y romper software en unas horas o incluso menos; no se ve tanto porque hay muchas partes interesadas en la industria que no quieren que esto se difunda públicamente, pero el impacto es grande.
No solo en hardware viejo, también en hardware nuevo está creciendo la exploración de parches, reemplazos y desarrollo de firmware nuevo gracias a los LLM/la IA generativa.
[0] https://mforney.org/blog/2026-05-28-patching-my-guitar-amps-... [1] https://schwung.dev
SubiculumCode: Fue desde el principio.
Era un juego de calabozos donde describía una sala y yo elegía una acción, y al inicio pensé que el calabozo estaba construido sobre una base de datos compleja.
Pero cuando dije que quería salir, me llevó a una posada, luego coqueteé con la mesera de la taberna, y poco después la escena siguió hasta verme contemplando el atardecer en una pradera; ahí pensé: “ah, estamos en problemas”.
La máquina parecía simular comprensión e inteligencia respondiendo al lenguaje con lenguaje, y sentí como si un extraterrestre que acababa de conocer supiera mi idioma por primera vez en mi vida; sentí que el mundo ya no volvería a ser como antes.
monuszero: Hace unos años metí una función de planificación de movimiento para robots en la base de código en un sprint de un mes, pero el resultado siempre me dejaba insatisfecho.
Como éramos un equipo pequeño, hicimos vendoring de OMPL y manejamos caché y roadmaps, pero aunque sabíamos que parte de los algoritmos que usábamos se podían paralelizar con SIMD o kernels de GPU, no estaba claro si valía la pena pelearse con CUDA o Metal/Accelerate.
Una tarde, mientras cocinaba, le dejé en los docs a Opus 4.6 la revisión bibliográfica del planner que necesitaba y le pedí que implementara desde cero un planner de roadmap nativamente acelerado; para cuando empezó a hervir el agua de la pasta, ya estaba lista una implementación que reducía planes de varios segundos del código de OMPL a unos pocos cientos de ms.
Entonces me cayó el veinte de que el valor económico del tiempo de preparar la cena ya podía compararse con un trabajo de programación honesto de dos semanas, y que cosas donde invertir tiempo era un riesgo o un lujo ahora se volvían opciones dignas de considerar.
Para equipos pequeños que saben lo que quieren y cómo configurar al agente para que tenga éxito, es un verdadero game changer, y los jugadores dominantes de siempre deberían tener cuidado.
andrewthornton: En las fiestas de 2025 se me descompuso la calefacción, y como la cita de reparación era dos días después, la casa se puso heladísima.
Subí al ático, grabé varios videos de la calefacción intentando encender y se los di a Gemini, que diagnosticó el problema de inmediato y me dijo que hiciera girar el pequeño ventilador de extracción durante el intento de encendido; así arrancó enseguida.
Tuve que repetirlo varias veces hasta que llegó el técnico de HVAC, pero al menos aguantamos.
Un inquilino de una casa en renta dijo que el aire acondicionado no enfriaba, así que llamé a la empresa de HVAC de siempre y me atendió su nuevo asistente de voz con IA; la experiencia fue horrible, dijeron que la oficina me devolvería la llamada y nunca se comunicaron.
Al final fui yo mismo, tomé una foto del panel del compresor de la unidad exterior y la usé con ChatGPT para diagnosticarlo; después de intercambiar puntos a revisar y códigos de diagnóstico, hasta me guió en una reparación sencilla: cambiar un capacitor de 25 dólares.
Solo la visita para diagnosticar la causa me habría costado casi cuatro veces eso, así que por la IA generativa perdí la confianza en la empresa de HVAC y gracias a otra IA generativa terminé reparándolo yo mismo en un día.
Abrí el panel trasero y subí una foto, y me indicó la ubicación del fusible con algo como “el rectángulo blanco arriba de los cables azul y rojo”; luego me guio para probarlo y, cuando le di el número de modelo de la secadora, también encontró enlaces a la pieza necesaria.
Por último recomendó limpiar la ventilación porque era muy probable que el fusible se hubiera fundido por falta de salida de calor; limpié a fondo el ducto de escape y cambié el fusible de 5 dólares, y funcionó perfecto.
Si la documentación de IKEA no fuera tan pobre, no lo necesitaría, pero se siente parecido a la ventaja que obtiene un programador principiante.
Un profesional quizá se burlaría de mi trabajo, pero son caros y difíciles de tratar, y de todos modos yo sí estoy terminando el trabajo.
En cambio, no uso IA para trabajo de desarrollo, porque me preocupa que mis habilidades se deterioren o que no llegue a aprender bien cosas nuevas.
shreddude: Claude recientemente descompiló el firmware de una camper van, documentó la interfaz CAN y luego programó un módulo ESP32 que se comunica con sistemas integrados como energía, HVAC, iluminación y tanques
Ese tipo de integración de sistemas embebidos está fuera de mi área, pero uso Claude todos los días tanto en mi trabajo como Solution Architect como en proyectos personales, y estoy avanzando proyectos a los que ni siquiera habría podido acercarme por mi cuenta, así que me cuesta entender a los escépticos de la IA
Si usas IA generativa para cosas que antes no podías hacer, es una herramienta asombrosa, pero si la usas para cosas que ya haces bien, no cambia el juego; para un experto, como mucho da un pequeño impulso
El trabajo de mucha gente consiste en hacer aquello en lo que ya son expertos
Eso sí, creo que la clave es que ya entiendas bastante bien qué es lo que estás viendo
¿Cuál es el problema de un billón de dólares que resuelve la IA?
loudmax: Fue a inicios de 2023, cuando bajé por torrent los pesos filtrados de 7 GB de Meta y corrí alpaca.cpp en mi desktop
Le pregunté sobre el Imperio romano y respondió en inglés; en general se equivocaba, pero no peor que las conjeturas de un estudiante universitario promedio en EE. UU., y con mucha más seguridad
Lo importante no era si la respuesta era confiable, sino el hecho de que no eran los llamativos servidores de un enorme datacenter de Google, sino el CPU de mi desktop respondiendo preguntas en inglés
Poder conversar en inglés con un CPU se sentía más parecido a hablar con un perro
En 3 años ha mejorado 100 veces
jp57: Fue un momento muy simple, el año pasado más o menos, cuando estaba averiguando qué necesitaba para remolcar el auto de mi hija a través del continente con una camioneta
Al principio le hacía a ChatGPT preguntas pequeñas, una por una, como si fuera Google, pero pronto le pregunté algo como “quiero remolcar el auto A con la camioneta B desde C hasta D, ¿cuáles son mis opciones?” y me escribió un informe con tabla comparativa entre tráiler y dolly, cálculo de peso de remolque, costos y detalles
Ahí sentí: “esto es diferente, y apenas está comenzando”
Le di fotos del anuncio de Zillow, números de serie de electrodomésticos, el panel eléctrico y zonas adicionales que tomé yo mismo durante el recorrido, y le pedí que redactara un informe como inspector de vivienda; de hecho lo hizo mejor y encontró problemas que se le escaparon al inspector que cobró 750 dólares
Por flojera, varias veces les pregunté a Claude y ChatGPT datos simples y definitivos, como cifras de torque de una dirt bike, y muchas veces respondieron con total seguridad algo completamente incorrecto
Incluso metiendo el PDF al contexto con generación aumentada por recuperación (RAG), me da desconfianza, así que nunca confío en un LLM para datos numéricos exactos
yauneyz: Le hice escribir una historia corta en la que Vader y Palpatine descubren el proceso de Gram-Schmidt
No era una obra maestra, pero dio con el tono y además entendía qué era Gram-Schmidt, y en ese momento eso me pareció absurdamente fascinante
AussieWog93: Literalmente anoche le di a Claude Code un prompt tal cual: Kodi se cae al ejecutarse en Chromecast 4k, así que conéctate por adb, depura el punto exacto del crash y propón una solución
Sin intervención humana, encontró la causa del fallo, descargó el código fuente de Kodi, parchó un bug que existía desde 2016, luego recompiló, firmó y lo subió al Chromecast, preservando toda la configuración
También le hice crear el PR; todavía no es público y pienso probarlo unas semanas más
Puede ser posible, pero me intriga qué tecnología y qué cadena de herramientas usó para que funcionara así
Me pregunto si esto tomó más de unos minutos y si hace falta la versión paga de Claude Code
evdubs: Probé si un proveedor de servicios LLM podía reescribir documentos legales en un formato consistente y sin alucinaciones para detectar contenido faltante, y sí pudo
Luego quise ver si también era posible con un LLM local, y Gemma-4 lo manejó bien con una tarjeta de video de 8 GB y un contexto grande de 128k; ese mismo modelo también hizo bastante bien OCR y traducción
Ahí me di cuenta de que los LLM son excelentes para encargarse de cosas donde yo ya sé lo que quiero, sé cómo hacerlo, la habilidad que ganaría haciéndolo no vale mucho y, si lo hiciera yo mismo, probablemente lo haría más o menos
Ahora lo veo con el lente de “¿puedo dejarle al LLM algo que de todos modos no me importaría mucho hacer yo?”
En ese tipo de cosas son muchísimo más rápidos que una persona y menos vulnerables al tedio, al menos por ahora
Mi hijo está respondiendo a la demanda original con Claude y Gemini, y ahora también está llevando la contrademanda 100% con IA
Lo mete en varias IA para que se revisen entre sí y para sacar más ideas; pasó de ChatGPT a Grok, luego a Claude, y ahora Gemini le está dando los resultados más sólidos
Una situación de “trae a Claude”
kstrauser: En el trabajo tenemos un gran presupuesto de tokens, y un colega encontró un exploit remoto de aspecto aterrador en un proyecto conocido mientras hacía pruebas de vulnerabilidades y me pidió una segunda opinión
Levanté el proyecto en local y ejecuté el POC, pero no pasó nada, y descubrí que hacía falta una configuración que reducía las protecciones de seguridad predeterminadas
Entonces le pedí a la IA que corrigiera el POC para que funcionara también con la configuración por defecto, y minutos después lo parchó en una versión ya lista para ser usada como arma; la instancia local que acababa de descargar, compilar y levantar con la configuración predeterminada se cayó de inmediato
Mirando el cursor parpadeando en la consola, me dio un sudor frío como si tuviera una bomba de información nuclear en las manos, y me la pasé dando vueltas toda la noche, durmiendo como 30 minutos
Pero a cambio el equipo obtuvo una dirección ética clara: debemos hacer este trabajo porque podemos, y compartir los resultados con los autores correspondientes
Quiero vivir en un mundo donde los buenos arreglen los problemas antes de que los malos los encuentren, así que decidí dedicarme a ayudar a construir ese mundo
No veo ninguna combinación de palabras anterior que parezca coincidir con la sigla
ddxv: La mayor parte del tiempo, al usar código generado por LLM, la sensación es de “¡oh, qué genial!”, pero unas semanas después, cuando me doy cuenta de que ese código “genial” que el modelo entregó diciendo que pasaba las pruebas tenía un bug sutil y que yo no lo leí con suficiente cuidado, ahí es cuando pienso “¿eh?”
El mayor riesgo es volverse flojo, encargarle de una vez cambios grandes en varios archivos y hacer YOLO sin entender completamente qué hizo
En frontend por lo general pasa, pero en tareas de manipulación de datos, si no lo entiendes, probablemente no es lo que querías, y unas semanas después terminas volviendo para desentrañar qué cambió
Es parecido a la vida antes de los LLM, cuando copiábamos y pegábamos de StackOverflow, pero ahora el copiar y pegar es mucho más rápido y maneja bien el boilerplate, así que uno puede concentrarse en los casos límite
UncleOxidant: Hace poco, con Claude, hice para una demo un clasificador MNIST de red neuronal de picos que corre en un FPGA
Claude enlazó todo, desde el concepto hasta PyTorch, entrenamiento, implementación en Verilog y síntesis para FPGA, y también le hice crear una app donde dibujas un número con el mouse en la PC y luego presionas un botón para clasificarlo
Había que enviar los datos al FPGA por SPI desde USB, pero mi adaptador SPI todavía venía en camino, así que le pedí que hiciera que el código Verilog corriera en el simulador Verilator y se comunicara por un SPI virtual, y me fui a almorzar
Cuando volví, la app para dibujar números estaba abierta en pantalla; dibujé un “2” y lo clasificó como 2, mientras en otra ventana el simulador Verilator mostraba la transferencia de datos
Me dio escalofríos
HlessClaudesman: Estaba escuchando un podcast en un café y oí que cierto autor de ciencia ficción escribe más de 40 libros al año; pensé que o tenía un equipo de escritores fantasma, o muchísima cocaína, o IA
En los primeros tiempos de ChatGPT descargué una app e hice que pasara por todas las etapas de escribir una novela: esquema, resumen de personajes, resumen de la trama, borrador de capítulos y capítulos terminados; para cuando estaba pensando en pedir mi segundo café, ya tenía listo un manuscrito antes de edición
Era una novela espantosa, pero tenía destellos que se podían cosechar y pulir, y eso probó mi hipótesis de que la IA podía producir ficción en masa
Si además hubiera montones de cocaína, sentí que con IA hasta se podrían sacar 40 libros por semana
mindcrime: No recuerdo un momento concreto, pero desde la primera vez que interactué con ChatGPT me pareció bastante impresionante
No estoy para nada listo para llamarlo AGI, pero sí era algo nuevo, y resultaba intuitivamente claro que “la IA de hoy será la peor que jamás volveremos a tener” y que era difícil predecir la velocidad del cambio
Cuanto más las uso, más convencido estoy al 100% de que es válido decir que, en cierto sentido, son inteligentes
Todavía no son AGI ni inteligencia a nivel humano, pero lo veo más como la “jagged intelligence” de Demis Hassabis: muy inteligentes en algunas áreas y bastante menos en otras
Como creo que puede haber inteligencias que no funcionen como la humana, los argumentos del tipo “no es inteligencia real” casi no tienen peso para mí
Sobre esto, llevo tiempo dejando guardado un borrador de blog titulado “The Marquee Sign Says 'Artificial' Intelligence”, pero no pienso hacer que una IA lo escriba por mí
Uso IA para investigación, esquemas y lluvia de ideas, pero mantengo la línea de que lo que salga con mi nombre debe tener mi voz real
ben_w: He tenido varios momentos así
La primera demo de InstructGPT fue impactante porque recordaba lo malas que eran las técnicas más avanzadas de procesamiento de lenguaje natural de antes, y no esperaba pasar de la calidad de continuación de texto de GPT-3.x a que siguiera instrucciones
También lo fueron This Person Does Not Exist en 2019, la transferencia de estilo y técnicas similares en 2016 (https://github.com/awentzonline/image-analogies) y lo que hoy llamaríamos deepfakes (https://www.youtube.com/watch?v=_S1lyQbbJM4), así como la actualización OTA de conducción autónoma de Tesla en 2015 (https://www.popsci.com/tesla-cars-become-autonomous-overnigh...)
En 2013, el “man” - “woman” ~= “king” - “queen” de word2vec también me hizo pensar “¿eh?”, sabiendo el nivel previo del procesamiento de lenguaje natural, y más aún al pensar en la automatización de propaganda o la vigilancia mediante la comprensión de jergas como Polari
También recuerdo el video demo de Word Lens de 2010 (https://www.youtube.com/watch?v=h2OfQdYrHRs)
alexfoo: Después de que alguien actualizó el firmware de una impresora Brother DCP-L3550CDW, desapareció la página CSV que usaba el exporter de Prometheus de antes y solo quedó una página HTML con la información enterrada en varios
div.Iba a escribir yo mismo un exporter parseando el HTML, pero probé Claude y metí en una VM sandbox un archivo HTML estático de la página de estado de la impresora y un archivo mínimo de Go que solo tenía
fmt.Printf("OK\n").El directorio se llamaba
brother-exportery no le di ninguna otra instrucción, tarea ni lenguaje, pero con solo/initClaude dedujo que tenía que escribir un exporter de Prometheus en Go.En 10 minutos generó sin fallas código que obtenía el HTML desde la impresora en la IP predeterminada 192.168.1.1, lo parseaba y exponía métricas para que Prometheus las recolectara.
Si yo lo hubiera hecho me habría tomado horas, pero lo más impactante fue cuánto logró inferir correctamente con tan poca información desde el principio.
tern: Al principio fue cuando Opus 3.x me armó un sistema de productividad con Obsidian MCP, y luego cuando descubrí prompts del tipo “construye un modelo matemático del problema y deriva la solución a partir de él”.
El verdadero “¿eh?” fue cuando, tras especificar durante mucho tiempo un compilador/runtime para DSP en tiempo real con muchas ideas nuevas, de verdad funcionó.
Más o menos la secuencia fue: me ayuda a entenderme → me ayuda a conectar buenas ideas → genera ideas nuevas si recibe la entrada adecuada → crea herramientas útiles en mi máquina → mediante pasadas iterativas sintetiza buenas ideas en ideas mejores → construye un sistema grande que supera por mucho mis capacidades habituales.
La frontera actual es sintetizar bases de código grandes en sistemas mejores mediante pasadas iterativas, y la clave es seguir si el proceso converge y se capitaliza o si se queda girando en círculos o diverge.
En marzo de 2024, al investigar e implementar un problema de investigación difícil de procesamiento de lenguaje natural, sentí que podía aproximarse bastante bien solo con prompts y la API de completions.
Para mediados de 2025, Llama 3 ya había analizado una base de código bastante grande en la que me estaba incorporando y sintetizado resultados al nivel de diagramas que yo mismo había creado como herramienta determinante.
En diciembre de 2025, Opus 4.5 generó módulos multiclase y tests casi perfectos a nivel sintáctico, y me di cuenta de que los errores se debían a que mis prompts estaban subespecificados.
Ahora casi no escribo código a mano, porque sale lo bastante bien y además vienen gratis los extras como tests, documentación y scripts de build.
notthetup: Tenía unas grabaciones de audio de conciertos únicas que se habían dañado al mover archivos durante un respaldo.
Parecía que los datos seguían ahí, pero ningún software podía reproducirlos; los dejé guardados cinco años y luego intenté recuperarlos con herramientas de IA.
Tras 20 minutos con Copilot y mucho revisar hex dumps, al principio salió una solución a medias que solo reproducía los primeros segundos del archivo, pero al final logré recuperar todos los archivos.
nwhitehead: Una historia de mi esposa: hoy diagnosticó con Claude un bug que bloqueaba el avance en un juego de Steam que de verdad quería jugar.
Tomó 18 minutos, pero desempaquetó el paquete de Godot, encontró el bug, propuso una corrección e incluso indicó un método alternativo dentro del juego.
Yo no tuve que hacer nada; Claude usó
stringspara averiguar la estructura del archivo.pcky luego escribió código Python con magia específica de Godot para extraer cierto chunk.simonw: Fue por marzo de 2023, cuando vi ChatGPT Code Interpreter.
Subí un CSV de incidentes policiales de San Francisco y lo leyó con Pandas, mostró gráficos y luego exportó los datos como un archivo de base de datos SQLite para que pudiera descargarlo.
Desde la perspectiva de alguien que hace software para periodistas de datos, el simple efecto secundario de poder ejecutar Python en una carpeta con archivos subidos ya parecía suficiente para hacer todo lo que yo quería que hiciera el software.
Viéndolo en retrospectiva, ese fue mi primer encuentro con un agente de codificación, aunque en ese momento ni siquiera existía ese nombre para la categoría.
mlmonkey: Un amigo consultor encontró un nicho con Netsuite y Oracle; como venía de contabilidad, ganaba mucho dinero configurando instancias de clientes y además jugaba bastante golf.
Justo después de que ChatGPT se volviera masivo, cuando yo hablaba emocionado sobre el potencial de la IA, trató de bajarme el ánimo diciendo “no va a poder hacer mi trabajo”, así que se fue a su casa y lo probó en su laptop.
Le pidió que ingresara las especificaciones de configuración de Netsuite que normalmente recibe de un cliente, junto con varias opciones y configuraciones, y luego solicitó los comandos de setup; ChatGPT empezó a enumerar todos los comandos a ejecutar y las opciones a configurar.
Mi amigo quedó desanimado diciendo “estos son exactamente los comandos que yo ejecuto”, aunque después consiguió como clientes estables unas cuantas empresas privadas de dueños que conocía, lo suficiente para seguir manteniendo su afición al golf.
Aunque los clientes pudieran correr ConsultBot 2.0 por su cuenta, saben que está en manos confiables, como siempre.
djfergus: Tenía un Amazon Firestick de primera generación que llevaba años en un cajón; se había actualizado al software más reciente y ya no tenía exploits root públicos.
Pasé un día entero haciendo que Claude y Codex investigaran por turnos; después de bajar el código fuente del kernel e intentar exploits, consiguieron acceso root con “FBUF/VCHIQ kernel zero-write primitive to patch live kernel memory”.
Pude hacer persistente el root, quitar las apps de Amazon y bajar de versión el firmware, y me entusiasmó pensar en un futuro donde se puedan reutilizar más dispositivos viejos y nuevos.
PopePompus: Estaba recreando como app de Android con Claude Code una vieja app de astronomía que había escrito para el Nokia N900, de la época anterior al App Store del iPhone.
La app original tenía varias páginas de visualización, como posiciones planetarias, y yo le estaba pidiendo que reprodujera cada página solo a partir de descripciones de pantalla, sin mencionar en absoluto el código original ni siquiera su existencia.
Después de recrear varias páginas, Claude añadió una página extra que yo no había pedido; esa página sí existía en la app original de Nokia, pero todavía no le había dicho que la agregara a la app de Android.
El código de la app de Nokia seguía en GitHub, y parecía que Claude somehow había conectado la tarea que yo le pedí con mi código de Nokia en GitHub, e implementó exactamente la página faltante, de una forma que me dejó con la mandíbula en el piso.
vitorbaptistaa: Era CTO de una ONG pequeña de 10 personas y en ese momento solo tenía un desarrollador junior, mientras daban soporte a dos apps hechas por consultores
Era una arquitectura desastrosa: para un sitio con 50 usuarios por semana tenía NextJS, React y 4 microservicios pegados
Preparé un devcontainer con la base de código antigua y un repositorio vacío, le pedí a Claude que lo reescribiera como una app de renderizado del lado del servidor en Django a la antigua y me fui a dormir; por la mañana, el 80% ya estaba hecho
Tras unos días más de prompts y revisión, logramos la equivalencia funcional, e hicimos lo mismo con la otra app
Ahora ambas están desplegadas, con menos costo de servidores y menos complejidad, son varios órdenes de magnitud más rápidas, y para una organización pequeña la IA es sorprendentemente útil para hacer cosas que normalmente, como pasa con la deuda técnica, no habríamos podido resolver sin agentes de IA
dang: Uno de los momentos grandes fue verla analizar archivos de log en cuestión de segundos
A mí me habría tomado horas, en realidad días, y por eso era el tipo de trabajo que ni siquiera habría hecho
También me ayudó a superar la barrera de entrada de optimizaciones que había pospuesto durante años por no tener tiempo para aprenderlas, y en especial a rastrear bugs de concurrencia como race conditions
Incluso encontró información que no pude encontrar con Google(https://news.ycombinator.com/item?id=42653136), y el punto en común es que no eran cosas imposibles, sino tareas que no ocurrían porque el tiempo y el esfuerzo eran demasiado altos, y ahora sí ocurren
Cuando le señalé la extensión problemática de ADO, descargó el VSIX y decompiló el binario de .NET para verificarlo, y con base en esa información propuso una solución alternativa en la que yo era muy escéptico, pero sí funcionó
Técnicamente yo también habría podido hacerlo, pero la recompensa era incierta y me habría tomado demasiado tiempo, así que probablemente no lo habría hecho
Ayer lo vi arriba de mi GitHub, le expliqué el problema y Claude encontró el bug al instante; después de unas cuantas interacciones propuso una corrección con la que quedé satisfecho
Ahora parece que por fin podré hacer la versión final, y se siente bien cerrar algo que llevaba tantísimo tiempo pendiente
hgoel: Hace poco le pedí ayuda a Claude para aprender dibujo, especialmente anatomía
Subí unos bocetos y le pedí retroalimentación; para mi sorpresa fue muy útil y describió con precisión cosas que yo sentía raras pero que nadie me había señalado
Por curiosidad, le pedí que etiquetara los problemas sobre el boceto, y escribió un script de Python con coordenadas para poner las etiquetas él mismo
Como todavía tenía la idea de que vLLM no servía mucho para tareas visuales, me sorprendió bastante recibir consejos de dibujo realmente útiles
¿Era retroalimentación anatómica, por ejemplo “el brazo no se une ahí”, o más bien técnicas de dibujo como consejos de sombreado?
takee: Estaba haciendo con mi hijo de 10 años un experimento de electromagnetismo para la feria de ciencias de la escuela, y surgió un problema que no lograba depurar por mi cuenta
Abrí una videollamada en vivo con Gemini y le pedí ayuda para analizar la causa; explicó claramente los posibles problemas y al final logramos que el dispositivo funcionara como esperábamos
El problema era que no se había retirado bien el aislante en la parte del cable enrollado al tornillo que iba conectada a la batería, y Gemini detectó detalles que yo no podía ver a simple vista
Mi hijo y dos de sus amigos quedaron asombrados no solo por el experimento en sí, sino porque una conversación de voz y video en tiempo real con la IA les pareció casi mágica
lodovic: Me impactó cuando pegué una captura de pantalla de un hilo de revisión de PR y solo dije “había comentarios de revisión, corrígelo”, y lo resolvió perfectamente, hizo varios commits pequeños y luego hizo push upstream
Después de eso seguí probando hasta dónde entendía mi intención, dándole tareas imposibles, proyectos enormes y arquitecturas complejas
Hace poco escribió desde cero en una semana, trabajando unas horas al día, un OS completo con MPI, TCP/IP y GUI, y hasta corre Doom
Programar como profesión se acabó, pero la diferencia en resultados es tan grande cuando uno se acerca a esto con una mentalidad profesional, que sigo pensando que la disciplina de la ingeniería de software todavía puede aportar un valor enorme
jmkni: No fue programando sino leyendo logs
Estaba buscando un bug de pesadilla que solo ocurría en producción, y Claude Code podía conectarse a Google Cloud y leer los logs en tiempo real
Reproduje el bug en la UI y enseguida detectó el problema en los logs, y como además tenía todo el contexto del codebase, señaló incluso la línea exacta de código que causaba el problema
Definitivamente fue un momento de “¿eh?”
marcus_holmes: Le tomé una foto a una planta que se estaba marchitando y se la mostré a Claude; me dijo cómo revivirla y cómo propagarla por esquejes
Los casos de programación se entienden porque es una computadora hablando sobre computadoras, pero mostrarle a una computadora una foto de una planta y que reconozca la planta, la diagnostique y sepa qué hacer se sintió como ciencia ficción, y fue realmente sorprendente
bonoboTP: El momento más fuerte fue justo después del lanzamiento de ChatGPT en 2022, especialmente con ejemplos donde hacía un juego de rol como terminal de Linux y, tras describir que “se incendió el centro de datos”, al “ejecutar”
nvidia-smiaparecía la temperatura de la GPU elevada.También se podía “explorar” el directorio home o incluso el home de personas famosas, y si entendía así de bien una terminal, estaba seguro de que el uso de herramientas y los agentes estaban a la vuelta de la esquina.
Opus 4.5 me hizo sentir que eso por fin ya llegó, aunque en 2022 en realidad pensaba que iba a llegar más rápido, en 2023~2024.
En imagen, con nano banana sentí que las imágenes de IA ya eran realmente viables, y quedó claro que problemas temporales como las manos, las extremidades o “no puede hacer un astronauta montando un caballo” iban a desaparecer.
La producción de largometrajes también ya entró en el rango de lo posible, con agentes generando y coordinando guion, personajes y tomas; independientemente de si la historia vale la pena, eso sí será una “película”.
Después hubo tareas más impresionantes, pero nada volvió a provocarme esa misma sensación de asombro puro.
jb_briant: Estoy haciendo un juego 3D, pero no me gustaba un mundo plano y quería usar un planeta.
La superficie no se expande, así que para la jugabilidad es finita, pero al mismo tiempo se siente infinita porque nunca chocas con los límites del mundo; eso me parecía elegante.
Las coordenadas cartesianas no le quedaban bien al jugador, así que necesitaba un sistema de cuadrícula de latitud/longitud/altitud, y podía pasarme días buscando en StackOverflow y depurando implementaciones llenas de fallas.
En 2024, la versión web de ChatGPT me hizo casi todos los helpers prácticamente de una sola vez, y me impresionó porque realmente había muchísimas trampas.
Juego arcade retro inspirado en Rally-X que corre en el navegador: https://linsomniac.github.io/rally-xy/
También hice un juego shooter de laberintos multijugador en red estilo nsnipes; aunque es basado en navegador, para el multijugador en red sí se necesita un servidor: https://github.com/linsomniac/isnipes
vishvananda: Fue a inicios de este año, cuando retomé proyectos viejos que estaban detenidos y se los encargué a agentes.
En cuestión de días hice un clon de una implementación de AlphaZero que había construido en el equipo de Oracle (https://medium.com/oracledevs/lessons-from-implementing-alph...), porté mi emulador casero de NES de JavaScript a Rust (https://github.com/vishvananda/popeye), e implementé todas las lecciones del C++ Grandmasters Challenge, lo que terminó llevando incluso a un compilador completo de C++ (https://medium.com/@vishvananda/i-spent-2-billion-tokens-wri...).
En particular, portar el emulador de NES tomó menos de 30 minutos y funcionó al primer intento.
Lo que activó el cambio fue hacer que reconstruyera cosas que antes yo mismo había sacado adelante con mucho esfuerzo; como conozco esa dificultad, me impactó muchísimo más que otros proyectos.
a_bonobo: En mi trabajo anterior limpié registros no verificados de avistamientos de animales, y además había una base de datos separada con probabilidades de aparición de animales basada en mapas de distribución por especie.
No soy estadístico, pero dado un avistamiento, la probabilidad base de aparición de esa especie en la zona y algunas suposiciones sobre el ruido del avistamiento, calcular la probabilidad de que realmente incluyera esa especie parecía encajar perfectamente con el teorema de Bayes.
Claude me hizo tres preguntas y luego escribió una hermosa implementación en Python que consultaba el mapa y escupía una tabla de probabilidades ajustadas.
Me dio una sensación muy poderosa de que ahora puedo hacer este tipo de cosas “por mi cuenta”, sin tener que esperar a encontrar a la persona adecuada o aprender antes el conocimiento correcto.
dannyobrien: Obtuve acceso temprano a la API de OpenAI antes de ChatGPT, y fue por ahí de 2019, cuando en el trabajo preparábamos un juego tipo JackBox por livestream para un evento benéfico.
Antes había trabajado como escritor de la versión británica del juego original You Don't Know Jack, donde sacábamos muchas líneas graciosas de una sola frase sobre un tema y solo algunas se usaban en la grabación.
Como experimento, le metí a la API de OpenAI una de esas frases de configuración, y aunque el 90% era aburrido o incoherente, una de cada 10 no estaba mal o incluso era bastante buena.
Puede que a otras personas no les pareciera impresionante, pero como yo había vivido un entorno de sala de escritores donde todo el mundo pasaba horas haciendo exactamente eso, me di cuenta de que podía ser el complemento perfecto como herramienta de apoyo creativo.
También era bastante bueno como jugador de JackBox.
xtracto: podría recibir críticas por esto, pero con ayuda de un LLM escribió un pequeño programa que captura video en pantalla de un juego FPS online de Xbox Live en el navegador y, con una pequeña red neuronal entrenada, detecta figuras humanas y las muestra en otra pantalla
La idea es poner un overlay verde sobre los enemigos en partidas PVP para que se vean mejor, y todo quedó en unas 100 líneas de código, incluyendo el entrenamiento/ajuste fino de una pequeña red neuronal YOLO
Para quien no sabe, puede oler a trampa, pero en esencia es práctica de visión por computadora
Las herramientas tipo DMA dentro del mundo del modding de juegos también ganan dinero como servicios por suscripción, así que resultan impresionantes y extrañamente secretas a la vez, y también es interesante qué tan bien funcionan esas herramientas y el hardware mux
Si además se combinan con hardware como DGA, con memoria integrada e interconexiones más rápidas, será una época muy interesante para quienes conocen de ingeniería inversa, análisis de malware y forense
tejohnso: no hubo un momento de pánico como tal, pero en el último año cambió mi forma de programar
Antes, al empezar un proyecto, pensaba por mi cuenta en la estructura, cómo interactúan las piezas grandes, la implementación de los detalles, y las alternativas y sus consecuencias
Ahora, en vez de pensar solo, avanzo conversando con un LLM, reuniendo información rápido desde varias fuentes, pidiéndole enlaces a material canónico y preguntándole por los trade-offs entre alternativas que no había considerado para llegar a un análisis más detallado
Durante el desarrollo también mantengo a este nuevo agente compañero dentro del contexto y lo uso para debatir, proponer y resolver problemas
No se puede confiar completamente en él, pero para mis fines se volvió una herramienta de flujo de trabajo lo bastante confiable, y fue muy rápida la transición de juguete interesante a herramienta totalmente integrada
tobyhinloopen: personal no técnico del cliente hizo una app con vibe coding, y me pidieron que la revisara y la desplegara
El resultado estuvo bastante bien y no tenía problemas graves
Al mismo tiempo, metí en Claude todo el PDF de feedback del cliente, capturas de pantalla y demás, y durante 7 horas estuvo reproduciendo y corrigiendo cosas casi sin supervisión, creando varios MR
La mayoría de las correcciones fueron buenas; algunas eran técnicamente correctas pero no eran lo que quería el cliente, así que se lo dije y Claude lo corrigió
Por eso armé una startup alrededor de esa idea
rerdavies: estaba trabajando en un compilador Spice que convierte diagramas de circuitos de pedales clásicos de guitarra en código ejecutable en tiempo real
Le di a Claude los números de página y de ecuación de The Spice Manual 2nd ed. y le pedí la implementación, aunque la verdad no esperaba que funcionara
Pero no solo implementó esas ecuaciones, sino también el cálculo lagrangiano de una función que aparecía 30 líneas más abajo, lo cual requería derivadas parciales simbólicas de una función no trivial y determinar qué variable correspondía a qué cosa en la matriz resultante
En el original solo decía “Lagrangian of” y no daba las ecuaciones diferenciales parciales, pero aun así lo logró, e incluso agregó comentarios con la página fuente y los números de ecuación de esa ecuación lagrangiana
Podría simplemente pedírselo a Claude, pero me da curiosidad si planeas compartirlo