Cómo desarrollar usando IA gratis o a bajo costo
(wuu73.org)- Usa una estrategia híbrida combinando varios modelos de IA web gratuitos para separar la resolución de problemas de la generación de código y aprovechar las fortalezas de cada modelo
- Con AI Code Prep GUI, selecciona y organiza solo el código necesario para evitar la degradación de rendimiento causada por contexto innecesario y darle a la IA solo el contexto clave
- Para planificación y depuración, usa modelos gratuitos/de alto rendimiento (Gemini 2.5 Pro, o3, o4-mini, Claude 4, etc.); para ejecución y escritura de código, usa GPT-4.1 y Claude 3.5
- Minimiza costos obteniendo tokens gratis o baratos mediante OpenAI data sharing, GitHub Copilot, Poe.com, OpenRouter, etc.
- Mejora la eficiencia del trabajo combinando distintas herramientas de agentes y CLI como Claude Code, Qwen Code, Gemini CLI, Roo Code y Trae IDE según la situación
Mi configuración del navegador: el buffet gratis de IA
- Mantengo abiertas en varias pestañas las versiones gratuitas de distintos modelos de IA potentes en el navegador
- La idea es no depender de un solo modelo, sino obtener respuestas desde varias perspectivas. Estas son algunas de las combinaciones de modelos gratuitos que uso con más frecuencia.
- GLM 4.5: se puede usar gratis en la web y, en mi experiencia, rinde al nivel de Claude 4 o incluso mejor. Siempre dejo abiertas 2 o 3 pestañas
- Kimi K2: un modelo similar a la familia Claude u Opus, disponible gratis en la web. Normalmente dejo abiertas 1 o 2 pestañas; antes de que apareciera GLM 4.5, me resolvía bugs complicados varias veces al día
- Qwen3 Coder y modelos nuevos: lo uso para probar distintos modelos especializados en programación
- OpenAI Playground: permite usar gratis varios modelos como GPT-4.5 y o3. Si en la configuración de datos de la cuenta permites que “OpenAI use tus datos para entrenar modelos”, te dan tokens gratis
- Google Gemini AI Studio: permite usar los modelos Gemini 2.5 Pro/Flash gratis y casi sin límite. Normalmente dejo abiertas de 1 a 3 pestañas
- Google Gemini 2.5 Pro: es un servicio aparte de AI Studio, con mejores funciones de generación de imágenes e investigación profunda. Lo uso en paralelo con AI Studio
- Poe.com: ofrece créditos diarios gratis para modelos premium como Claude 4 y o4-mini
- OpenRouter: permite combinar modelos gratuitos y de pago. Dejo distintos modelos configurados en pestañas separadas
- ChatGPT: incluso la versión gratuita sigue siendo útil, así que mantengo al menos una pestaña abierta
- Perplexity AI: destaca en preguntas orientadas a investigación
- Deepseek: ofrece gratis los modelos v3 y r1. Ojo con el límite de contexto
- Grok.com: ofrece uso general, investigación profunda y edición de imágenes gratis e ilimitados. Su función de investigación profunda, en particular, es útil porque se parece a la de Perplexity
- Phind: intenta acompañar sus respuestas con diagramas o flowcharts
- lmarena.ai: ofrece gratis Claude Opus 4 y Sonnet 4. Poder usar Opus 4 gratis tiene bastante valor
Claude.ai también es gratis, pero como sus límites de uso aparecen con frecuencia y pueden resultar incómodos, uso otros enfoques como la extensión Cody o Copilot.
Precaución al usar Grok
Grok puede ser útil cuando los sistemas de seguridad de otros modelos estorban, porque ofrece cómputo gratuito y generación de imágenes sin censura. Sin embargo, hay reportes de que sus operadores podrían tener la intención de promover ideas vinculadas al nazismo o desinformación. En particular, se ha afirmado que recibió instrucciones para dar información falsa sobre hechos históricos como genocidios en África. Estas distorsiones aparecen principalmente en la plataforma X, pero se recomienda limitar su uso a tareas seguras como programación, o usarlo teniendo presentes sus posibles sesgos.
Un flujo de trabajo más inteligente y barato: contexto enfocado
- Al usar interfaces web de chat con IA (AI Studio, ChatGPT, OpenRouter, etc.), muchas veces ofrecen mejor resolución de problemas o mejores propuestas de solución que un IDE o un framework de agentes (Cline, Trae, Copilot, etc.)
- Si haces todo con herramientas como Cursor, Cline o Roo Code, terminas enviando a la IA grandes cantidades de texto que no están directamente relacionadas con el problema, como instrucciones para usar servidores MCP o procedimientos de edición de archivos, lo que la confunde y reduce su rendimiento
- Por eso, incluso usando el modelo más caro, no se logra superar ese “efecto de lentitud” causado por información innecesaria
- Por eso, el enfoque es generar manualmente el contexto exacto necesario para resolver el problema, pegarlo en un chat web con IA y hacer preguntas o pedir revisión de código
- Cuando ya aparece una solución, ese contenido se convierte en un prompt para agentes como Cline y se les deja solo la edición de archivos
- Así se puede usar GPT-4.1 (disponible sin límite) para resolver problemas y planificar a bajo costo, sin necesidad de gastar créditos de Claude
- Para problemas difíciles se usa Claude, y para la ejecución se combinan chats web con IA, mejorando la eficiencia
-
Cómo ayuda AI Code Prep (estructura de prompt de ejemplo)
Prompt de ejemplo:
Can you help me figure out why my program does x instead of y?- AI Code Prep GUI escanea recursivamente la carpeta del proyecto, recorriendo también subcarpetas y archivos, y organiza el código y la pregunta en un formato fácil de leer para la IA
- Ejemplo del contexto generado:
Can you help me figure out why my program does x instead of y? fileName.js: <code> ... file contents ... </code> nextFile.py: <code> import example ... more contents ... </code> Can you help me figure out why my program does x instead of y?- Repite la pregunta dos veces (arriba/abajo/ambos, a elección) para ayudar a que la IA mantenga el foco
- En Windows, dentro de la carpeta del proyecto, haz clic derecho con el mouse → ejecuta “AI Code Prep GUI” → selecciona automáticamente los archivos de código, mientras excluye de forma automática directorios innecesarios como
node_modules,.git, etc. - Aunque la selección no sea perfecta, se puede ajustar fácilmente con casillas de verificación
- Si el proyecto es grande y supera el límite de contexto de la IA, puedes elegir solo los archivos realmente necesarios
-
¿Por qué es importante este enfoque?
- Muchos agentes de código como Cline, GitHub Copilot, Cursor y Windsurf envían demasiado contexto o demasiado poco, lo que los vuelve ineficientes
- Si seleccionas los archivos manualmente, puedes darle a la IA solo la información necesaria, sin datos irrelevantes
- Como tiene interfaz GUI, ofrece mejor protección del código privado y comodidad que otras herramientas de generación de contexto que exigen CLI o enlaces públicos de GitHub
- Para las funciones más recientes, consulta wuu73.org/aicp
Estrategia de modelos: elegir el cerebro correcto para el trabajo
- Muchos modelos de IA potentes se ofrecen gratis a través de interfaces web (Gemini in AI Studio, Grok, Deepseek, etc.), así que conviene aprovecharlos primero.
- Poe.com ofrece créditos diarios gratuitos para modelos de primer nivel como Claude y la nueva serie o4.
- Gemini 2.5 Pro (disponible en AI Studio) destaca muchísimo para depuración, planificación y trabajo general, y actualmente se considera el modelo más versátil.
- Para problemas difíciles, prueba o4-mini (disponible en OpenRouter o Poe).
- Al usarlo por API, cuesta mucho menos que modelos tope de gama anteriores (Claude 3.5/3.7/4).
- Ha habido casos en los que resolvió de inmediato bugs que eran difíciles de solucionar.
- Claude 3.7 o 4 se puede usar mediante Poe, API (OpenRouter), GitHub Copilot Chat, etc.
- Incluye algo de uso gratuito, pero si lo usas con frecuencia, el costo puede ser alto.
- 3.7/4 ofrece una salida creativa y explosiva (estilo “Hunter S. Thompson”), pero para programar de verdad puede ser más eficiente dejarle el trabajo a Claude 3.5, que es más sereno.
-
Cómo aprovechar los tokens gratuitos de OpenAI Playground
- Si activas la configuración de compartición de datos de tu cuenta de OpenAI, puedes usar una gran cantidad de tokens gratis cada día.
- En OpenAI Playground → ícono de configuración arriba a la derecha → menú izquierdo Data Controls → Sharing; si activas "Share inputs and outputs with OpenAI", obtienes los siguientes beneficios:
- Hasta 250 mil tokens al día: gpt-5, gpt-4.1, gpt-4o, o1, o3
- Hasta 2.5 millones de tokens al día: gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini, codex-mini-latest
- Con esta configuración, puedes usar en gran volumen y gratis modelos de primer nivel como o3 y GPT-4.5.
- En OpenAI Playground, puedes ejecutar o3 y o4-mini lado a lado para compararlos y entender las fortalezas y usos de cada modelo.
-
Estrategia recomendada de uso por modelo
- Gemini 2.5 Pro: máxima prioridad para depuración, planificación y trabajo general de programación.
- o4-mini: excelente para resolver bugs complicados y muy eficiente en costo.
- Claude 4 / 3.7: ideal para resolver problemas urgentes y difíciles, aunque con limitaciones de acceso y costo.
- Claude 3.5: adecuado para refinar resultados creativos de 3.7/4 o para escribir código real.
- o3, GPT-4.5, Qwen3 Coder 480b, GLM 4.5: sobresalen mucho al resolver problemas complejos y pueden usarse en gran volumen si aprovechas la configuración de tokens gratuitos.
El enfoque híbrido: planificación premium + ejecución económica
- Tras probar varios modelos, se desarrolló una estrategia híbrida que maximiza tanto la calidad como la eficiencia en costos.
- La idea clave es que cada modelo tiene fortalezas distintas en etapas específicas del proceso de desarrollo.
Teoría del “Smart Juice”: por qué la IA se vuelve tonta
La “energía de inteligencia” que un modelo puede recibir es limitada.
Si le envías prompts concisos y enfocados, casi el 100% de esa energía se usa para resolver el problema.
Pero si le mandas entradas innecesariamente complejas (largas explicaciones sobre cómo usar herramientas, contexto irrelevante para el problema, varias páginas de código, etc.), una parte importante se consume procesando eso, y queda menos “inteligencia” disponible para resolver el problema real.Ejemplo: agentes integrados al IDE como Cursor o Cline envían muchísimas instrucciones y contexto antes de la pregunta, así que el modelo pierde capacidad de concentración.
Por eso, reducir el contexto innecesario y enviar solo lo esencial para resolver el problema es la mejor forma de obtener resultados óptimos.
-
Flujo de trabajo al iniciar un proyecto nuevo
- 1. Plan & Brainstorm
- Diseña el enfoque, arma un plan paso a paso e identifica las librerías necesarias con modelos web inteligentes y gratuitos (Gemini 2.5, o4-mini, Claude 3.7/4, o3, etc.).
- 2. Generate Agent Prompt
- Pídele a uno de los modelos anteriores:
"Write a detailed-enough prompt for [Cline](https://cline.bot/), my AI coding agent, to complete the following tasks: [descripción de la tarea]" - Luego pule una vez más el prompt generado con una IA gratuita buena para reescritura, como ChatGPT.
- Pídele a uno de los modelos anteriores:
- 3. Execute with Cline
- Pega el prompt refinado en Cline y ejecútalo con GPT 4.1 o Claude 3.5 (o Claude 4 si la tarea es compleja).
- La familia GPT 4.1 está bien entrenada para seguir instrucciones.
- 4. Fallback
- Si GPT 4.1 falla, cambia a Claude 3.5 mediante API.
- Deepseek v3 o R1 también es muy fuerte para seguir instrucciones.
- 1. Plan & Brainstorm
-
Estrategia clave
- Usa modelos caros e inteligentes (o Gemini 2.5 Pro, si puedes usarlo gratis) para la etapa de estrategia y diseño.
- Valida el plan pegándolo en 2 o 3 modelos gratuitos distintos (Deepseek R1, Claude en Poe, etc.):
"Is this good? Can you improve it or find flaws?" - Para la etapa de programación y ejecución, usa modelos estables y eficientes (GPT 4.1, Claude 3.5) en Cline.
-
Consejos de uso por modelo
- o4-mini
- Es fuerte en estrategia de implementación de alto nivel, como interpretar lógica de código compleja y elegir frameworks o librerías.
- Lluvia de ideas
- Si no se puede resolver
- Si un modelo gratuito o barato no logra resolverlo, haz escalamiento a un modelo avanzado de pago por API.
- o4-mini
Agentes y configuraciones alternativas
- Trae.ai (Bytedance, creadora de TikTok)
- IDE compatible con VS Code, ofrece uso gratuito de IA: incluye Claude 4, Claude 3.7, Claude 3.5 y GPT 4.1.
- El rendimiento del agente integrado es inferior al de Cline (siendo sinceros, Cline es el más fuerte).
- Como parece ser un clon de VS Code, da la impresión de que se puede instalar la extensión de Cline.
- Pero la velocidad es lenta por la sobrecarga de los servidores → su utilidad real como opción gratuita es baja.
- Aun así, se menciona porque permite acceder a modelos gratis.
-
2 configuraciones recomendadas
- 1. VS Code + Cline + Copilot
- Suscripción de Copilot de $10 al mes → permite usar modelos potentes por API a bajo costo desde Cline.
- Con el nivel gratuito también se pueden usar algunas funciones básicas.
- 2. Trae.ai + Cline
- Vale la pena probar si se puede combinar el acceso gratuito a modelos de Trae con el uso de una API key en Cline.
Tip: a veces el agente base de Copilot resuelve problemas que Cline no maneja bien, y a veces pasa al revés.
Cline puede enviar prompts excesivamente largos y perder rendimiento → hay casos donde Copilot tiene ventaja. - 1. VS Code + Cline + Copilot
-
Roo Code: un clon de Cline
- Roo Code es casi igual a Cline, pero ofrece algunas funciones distintas.
- Dependiendo del proyecto o del estilo de programación, Roo Code puede ser mejor opción.
- Cline en sí es gratis, pero las llamadas a la API sí generan costo.
- La forma más económica: configurar VS Code LM API + suscripción de Copilot de $10 al mes → uso casi ilimitado de modelos potentes.
-
Nuevas herramientas CLI: Claude Code, Qwen Code, Gemini CLI
- Últimamente ha crecido mucho el interés por las herramientas de programación basadas en CLI.
- Claude Code: soporta subagentes (subagents) → realiza una sola tarea y no usa herramientas adicionales.
- Puede reproducir el flujo de trabajo enfocado de “smart juice” explicado en esta guía.
- Elimina instrucciones de agente innecesarias (bloat) y mantiene la eficiencia.
- Qwen Code y Gemini CLI también tienen ventajas propias.
- Hay una guía de configuración en z.ai para usar Claude Code con GLM 4.5.
- Como cada herramienta CLI tiene fortalezas distintas, se recomienda experimentar apoyándose en guías y tips de la comunidad.
TL;DR: Guía de inicio rápido
- Modelos y roles
- Planificación e ideas
Se recomienda usar GLM 4.5, Kimi K2, la serie más reciente de Qwen3 Coder & 2507, Gemini 2.5 Pro (AI Studio), o4-mini (OpenRouter), Claude 3.7/4 (Poe), y aprovechar 250 mil tokens gratis por día en OpenAI Playground (o3, GPT-5) - Resolución de problemas y debugging
GPT-5 (tokens gratis en Playground), GLM-4.5 (rendimiento al nivel de Claude 4), Claude 4 (tokens diarios gratis en Poe) - Programación real
GPT-4.1 (Cline), y si falla usar Claude 3.5 como reemplazo, o bien Qwen3 Coder, Instruct, 2507, GLM 4.5 o Kimi K2
- Planificación e ideas
- Herramientas clave
- VS Code
- AI Code Prep GUI – escanea y selecciona solo los archivos necesarios en local, optimizando el contexto para la IA
- Cline (agente para VS Code) – ejecución de código paso a paso
- Chats web gratuitos – Poe.com, ChatGPT, Grok, Deepseek, Perplexity, OpenAI Playground, AI Studio(Gemini 2.5 Pro), OpenRouter, duck.ai
- Flujo de trabajo rápido
- Agrupar los archivos relevantes del proyecto con AI Code Prep GUI
- Pegar ese contexto en el modelo de chat web que prefieras para planificar y depurar
- Pedirle a un modelo
"escribe un prompt detallado para Cline para esta tarea"y luego refinarlo más en ChatGPT o similar - Pegar el prompt terminado en Cline configurado con GPT-4.1 para generar o modificar código
→ si falla, cambiar a Claude 3.5
- Trucos para ahorrar costos
- Activar “data sharing” en OpenAI Playground → 250 mil tokens gratis al día (GPT-4.5, o3) + 2.5 millones de tokens gratis al día (o4-mini, o3-mini)
- Suscripción mensual de GitHub Copilot por $10 → permite usar de forma limitada modelos Claude desde Cline
- Pago por uso en OpenRouter → permite usar barato modelos recientes como o4-mini y Claude 3.7
Algunas reflexiones
- La IA es un amplificador de productividad increíble, pero no es una varita mágica.
- La verdadera magia ocurre cuando su curiosidad, persistencia y disposición a experimentar se combinan con estas herramientas tan potentes.
- No se frustren por bugs o problemas — cada desafío es una oportunidad para aprender algo nuevo.
- Mezclen modelos, prueben ideas audaces y no tengan miedo de romper cosas y volver a construirlas.
- Los mejores desarrolladores no son los que nunca se traban, sino los que siguen avanzando incluso cuando se traban, usando todas las herramientas y técnicas a su alcance.
- Abracen el caos, disfruten el proceso y dejen que su creatividad les marque el camino.
Últimas actualizaciones de modelos (Ago 2025)
💰 Cuidando el presupuesto: sacar el máximo valor
-
GPT 4.5
- Estado: Descontinuado
-
o3
- Capacidad: rendimiento comparable a Claude 4, sobresaliente para resolver problemas difíciles, nivel genio
- Tip de uso: se puede analizar toda la base de código cargándola con AI Code Prep GUI
- Tokens gratis: 250k tokens/día al activar data sharing en Data Controls/Sharing settings
-
o4-mini
- Capacidad: un poco por debajo de o3, pero con un rendimiento excelente; como si fuera el hermano menor de o3
- Tokens gratis: 2.5M tokens/día al activar data sharing
-
Gemini 2.5 Pro
- Uso: gratis en AI Studio
- Especialidad: debugging complejo, diseño de arquitectura y planificación
-
Deepseek R1 0528
- Capacidad: modelo muy inteligente con razonamiento mejorado
- Uso: disponible gratis en la interfaz web de Deepseek
🚀 Premium: resolver problemas YA
-
Claude 4 Sonnet
- Capacidad: si se le da suficiente contexto, resuelve la mayoría de los problemas de una sola vez
- Especialidad: el mejor rendimiento general en escritura, resolución de problemas y más
- Uso: cuando realmente necesitas resolverlo perfectamente desde el primer intento
-
Claude 4 Opus
- Precio: $75 / 1M tokens
- Rendimiento: se dice que supera a Sonnet, con un nivel tipo “salsa mágica”
- Uso: cuando necesitas la solución definitiva a un problema
Modelos sólidos para trabajo constante
Los siguientes modelos siguen bien las instrucciones y realizan tareas de forma estable:
-
GPT 4.1
- Diseñado como un modelo inteligente de alto nivel para planificación y resolución de problemas, y luego usado para modificar código real
- La salida obtenida en cualquier lugar se puede pegar tal cual en Cline y ejecutar
-
Claude Sonnet 3.5
- Fuerte en programación y edición
- Un poco más lento que 4.1, pero muy estable
-
Deepseek v3
- Adecuado para escritura de código, modificaciones y trabajo con agentes
- Excelente relación precio-rendimiento
-
OpenRouter Free Models
- En OpenRouter, configura el filtro de precio en
$0para explorar modelos gratuitos - Vale la pena experimentar cuando aparezcan nuevos modelos
- En OpenRouter, configura el filtro de precio en
Claude 4 gratis: lmarena.ai y más
Claude Opus 4 and Sonnet 4
- En lmarena.ai ofrecen gratis Claude Opus 4, Sonnet 4 y otros
- Tip: guarda, recuerda y aprovecha cualquier oportunidad de uso gratuito de modelos de la línea Anthropic
- Uso: cuando todo falle, o cuando necesites completar un trabajo perfectamente de inmediato, elige Claude 4 Sonnet u Opus
NUEVO!! Nuevos modelos chinos geniales + GPT 5
-
GLM 4.5
- Rendimiento: similar a Claude 4 Opus o Sonnet
- Características: ejecuta casi a la perfección reglas de agentes y uso de herramientas
- Uso: muy bueno para corregir bugs muy difíciles y manejar tareas complejas que requieren mucho contexto
-
Qwen3 Coder 480B
- Evaluación: modelo potente, barato y muy preferido
- Uso: tareas de programación en entornos de alto rendimiento y bajo costo
-
Qwen3 Instruct & Thinking 2507
- Rendimiento: estabilidad y potencia similares a Qwen3 Coder
- Ventajas: confiable y rentable
-
Kimi K2 (Moonshot)
- Características: parece tener una naturaleza entrenada con datos sintéticos basados en Anthropic o similares a Claude
- Evaluación: rendimiento sobresaliente, modelo usado con frecuencia
-
GPT 5
- Limitaciones: muestra menos fortalezas en el uso de herramientas personalizadas (MCP, Cline, etc.)
- Forma recomendada de uso:
1. Usar GPT 5, GLM 4.5 u otros modelos top para planificar y resolver problemas
2. Luego escribir prompts para que un modelo agente más simple haga la edición real y use las herramientas - Comparación:
- GPT 4.1 sigue ofreciendo una excelente relación costo-beneficio
- Los nuevos modelos chinos destacan en el uso de herramientas personalizadas/Cline
- Conclusión: todavía no se han probado lo suficiente, pero cada modelo tiene áreas donde destaca, y por ahora los modelos chinos son muy atractivos en precio y estabilidad
Flujo de trabajo actual para programar (2025)
-
Para proyectos nuevos:
- 1. Fase de planificación:
- Anota todos los detalles del proyecto (lenguaje, librerías, servidor, etc.) en un bloc de notas
- 2. Consulta con múltiples modelos:
- Pega el mismo contenido en varios modelos para obtener “múltiples opiniones”:
- Gemini 2.5 Pro (gratis)
- GPT 4.1
- o4-mini
- Claude 4 (aprovechando los créditos diarios gratis de Poe)
- Pega el mismo contenido en varios modelos para obtener “múltiples opiniones”:
- 3. Refinamiento:
- Ajusta los detalles finos mediante conversaciones iterativas con el modelo
- 4. Generación de tareas:
- Pídele al modelo que escriba una lista de tareas paso a paso para el agente de programación Cline AI
- 5. Ejecución:
- Ejecuta la tarea en Cline (o Roo Code) configurando GPT 4.1 en modo
act
- Ejecuta la tarea en Cline (o Roo Code) configurando GPT 4.1 en modo
- 1. Fase de planificación:
-
Para resolver problemas:
- Análisis de codebases complejos: usar GPT 4.5 + AI Code Prep
- Pedirle a GPT 4.5: “escribe un prompt para que Cline complete esta tarea”
- Elegir el modelo según la complejidad del problema
- Usar varios modelos para buscar soluciones desde distintos ángulos
-
Lista de tareas & Test Driven Development (próximamente)
Test Driven Development & listas de tareas:- Pídele a la IA que escriba una lista detallada de tareas para ejecutar con Cline, Roo Code o el agente Trae
- Se puede indicar a Cline o Roo Code que registren el avance en un archivo Markdown y marquen las tareas al completarlas
- Esto permite seguir el progreso fácilmente y evitar omisiones
- Actualmente se puede experimentar haciendo que el modelo genere una checklist en Markdown y que Cline o Roo Code actualicen ese archivo
-
Hacks para ahorrar dinero
- GPT 4.5 & o3: si activas el uso compartido de datos de entrenamiento del modelo, obtienes 250 mil tokens gratis al día
- Modelos baratos: puedes usar 2.5 millones de tokens diarios en o4-mini y 4.1-mini/nano
- GitHub Copilot: por $10 al mes puedes usar los nuevos modelos Claude (con límite de velocidad)
- Trae IDE: actualmente permite usar Claude 4 y GPT 4.1 gratis (sin suscripción y aparentemente sin límites)
- Poe.com: ofrece créditos diarios gratis para todos los modelos
- Interfaces web: usa interfaces de chat web gratuitas para planificación y consultoría
-
Próximamente: datos en vivo de Reddit e insights
Scraping de datos en vivo de Reddit e insights diarios:- Planean hacer scraping en tiempo real de datos de Reddit para ofrecer casos de uso de modelos de IA actualizados cada día
- Incluirá análisis detallado de uso, visualización de datos y nuevos insights sobre flujos de trabajo reales de programación y tendencias
1 comentarios
Opiniones en Hacker News
Por si alguien se confundió: el artículo tiene 2 o 3 páginas más, y se puede acceder a ellas con el ícono de flecha de abajo.
Soy el autor del artículo, y perdón por el problema con la tipografía. El contenido ya está algo desactualizado, pero como todo en IA cambia tan rápido, planeo actualizarlo incluyendo modelos más recientes. Últimamente están saliendo modelos nuevos a cada rato, y personalmente mi favorito reciente es GLM-4.5. Kimi K2 también está bien, y Qwen3-Coder 480b o 2507 instruct también son bastante buenos. Estos modelos funcionan muy bien en entornos agentic o con herramientas para agentes. También hice mi propia app auxiliar de contexto (https://wuu73.org/aicp), y se puede acceder desde ese enlace. Me resulta muy útil para ir y venir entre las muchas pestañas de chat de IA y el IDE que uso normalmente (casi siempre gratis, y además obtengo los mejores resultados). Intenté eliminar al máximo todas las molestias e incomodidades al usar interfaces web de chat. Es gratis y la retroalimentación ha sido muy positiva; también agradezco las críticas. Hace muchísimo más cómodo moverse entre el IDE <----> las pestañas de chat web. Originalmente lo hice para ahorrarme tiempo, y como la UI está hecha con PySide6, funciona mucho más liviano que una webview. Se puede agregar al instante texto de uso frecuente con botones de presets, y además recuerda por proyecto el tamaño de la ventana y el estado del contexto, como los archivos usados. La próxima vez que lo abras, queda exactamente en ese estado. Escanea automáticamente los archivos de código e infiere cuáles pueden ser útiles. También puedes poner texto arriba y abajo del código en la caja del prompt (y eso suele mejorar la salida). Un botón que uso mucho personalmente está configurado así: "redacta un prompt para Cline (agente de programación), envuelve todo el prompt en una sola etiqueta de código para facilitar copiar/pegar, divide toda la tarea en partes pequeñas y proporciona explicaciones detalladas y razones para que Cline pueda seguirlas, y agrega bloques search and replace en lenguaje simple para indicar dónde editar". La forma en que suelo resolver problemas o encontrar bugs es: en VS Code normalmente escribo
aicpen la terminal para abrir la app, hago fine-tuning de archivos, escribo la explicación o los cambios que quiero, pulso el botón de Cline yGenerate Context!, y luego lo pego en GLM-4.5. Si es un problema difícil, lo pruebo también con 2 o 3 modelos como o3, o4-mini, GPT-5 o Gemini 2.5 Pro. Elijo la respuesta más razonable y la pego en Cline (VS Code, GPT 4.1 unlimited/free version). 4.1 no es increíblemente inteligente, pero ejecuta instrucciones con precisión. Incluso corrige por sí solo errores pequeños típicos de modelos grandes. Los modelos grandes escriben muy bien las explicaciones detalladas y la lista de tareas, y 4.1 las ejecuta en agent mode. Así puedes programar con una IA muy inteligente de forma ilimitada y gratis. Si le conectas MCP (tools, etc.) al modelo, el rendimiento incluso empeora, y si usas APIs como Claude 4 solo terminas gastando mucho dinero.La velocidad de desplazamiento del sitio web es lenta (sub1-fps en Firefox Android), y el call-out relacionado con grok no se puede desplazar. Arriba también aparece un botón verde sospechosamente grande que dice CSS loaded.
El diagrama de [https://wuu73.org/aicp] es útil, pero al hacer clic no se muestra en resolución completa y se ve borroso. En Firefox y Chrome pasa igual. En el repo de GitHub se ve nítido, así que probablemente sea un problema del lado de la librería de renderizado JS.
Leí el artículo con gusto y gracias por actualizarlo. Me interesaría mucho si pudieras profundizar más en las diferencias de experiencia al usar Roo Code y Cline. Hasta ahora yo solo he usado Roo Code; me parece interesante, pero los resultados han sido algo inconsistentes.
Me pregunto si has probado Microsoft copilot. Básicamente es un modelo de OpenAI gratis.
Dices que se puede programar gratis, pero en la configuración de datos de OpenAI solo es gratis si permites que tus datos se usen para entrenar el modelo. O sea, realmente no es "gratis".
Mi experiencia también coincide con lo que dice el artículo. Las funciones agentic realmente solo funcionan bien con modelos grandes (y con "funcionan" me refiero, por ejemplo, a que OpenAI Codex necesitó 200 solicitudes para cambiar 3 líneas usando o4-mini). Para cambios simples, al contrario, los modelos pequeños son mucho más rápidos, así que son mejores. Por eso me estoy enfocando no en el modelo "mejor", sino en "el más tonto que aún se pueda usar". Si llevas esto todavía más lejos y abandonas el enfoque agentic, incluso con modelos muy pequeños puedes hacer trabajo muy preciso. Si les dices exactamente lo que quieres, te devuelven el diff de inmediato. Andar hurgando en el sistema de archivos me resulta ineficiente a mi escala. Puedo meter casi toda la base de código en el contexto, así que simplemente lanzo
src/completo al prompt. En proyectos de otras personas hay mucho boilerplate, así que estoy experimentando con búsqueda de código usando modelos ultra baratos como gpt-oss-20b; para ese tipo de uso, modelos aún más pequeños también sirven. Patent pending.Pienso igual. Haiku basta para manejar el flujo de conversación, y para tareas más complejas recurro a modelos grandes como Gemini 2.5 Pro o GPT-5. Últimamente estoy probando usar Codex desde Gemini CLI con MCP(
${codex mcp}), y funciona muy bien. Gemini CLI se basa sobre todo en Flash, pero alcanza para definir el problema y reevaluar respuestas. Lo mismo aplica al usar Gemini 2.5 Pro vía Claude Code MCP. Usar Claude Code como MCP en sí no me funciona muy bien. La idea básica de este enfoque, claro, viene de Aider: usar al mismo tiempo un modelo principal, uno auxiliar y uno editor.Aider, como herramienta de programación no agentic, logra un buen equilibrio entre eficiencia y efectividad. Como genera un mapeo del repo con tree-sitter, hace mucha menos falta andar recorriendo el sistema de archivos. No tiene MCP, pero sí comandos de shell, así que puedo usar utilidades que ya conozco bien. Si lo combinas con proveedores como Cerebras, la velocidad de procesamiento del prompt es instantánea. Puedes seguir interviniendo sin esperar múltiples llamadas a herramientas. En proyectos pequeños, es de lo mejor.
Yo también pienso cada vez más parecido. Quiero herramientas rápidas y confiables. Para mí es importante entrar en flow state, pero esperar a las herramientas de programación agentic me corta completamente ese flujo. Por eso me interesan más los modelos pequeños, o proveedores como Cerebras. Si reduces el alcance del problema, también aumenta la confiabilidad. Personalmente, me gustaría escuchar más sobre las herramientas "surgical" que usas. Gracias a esto también pude ordenar varias ideas en una entrada reciente de mi blog sobre este tema.
En Codex CLI ya no se pueden cambiar a modelos por debajo de GPT-5 (si no tienes API key), porque dicen que no lo recomiendan. Si lo ejecutas con la opción
thinking=high, rinde mucho mejor que o4-mini, y o4-mini en realidad se siente como gpt-5-thinking-mini. En codex eso no se puede configurar, y gpt-5-thinking-high está a un nivel parecido a o1 u o3-pro."(funciona más o menos)"... comentaste que OpenAI Codex hizo 200 solicitudes para cambiar 3 líneas de código con o4-mini; como referencia, en mi experiencia real varias veces he pasado días enteros en tareas de 3 líneas.
Creo que hay huge potential en un stack completamente local, sin necesidad de nube como Cursor. Por ejemplo: • Cursor CLI para trabajo agentic/dev (https://x.com/cursor_ai/status/1953559384531050724) • una capa de memoria local compatible con CLI: LEANN (índice 97% más pequeño, costo de nube 0, privacidad total, https://github.com/yichuan-w/LEANN) o Milvus (aunque este a veces termina usándose en modo nube/token) • como ejemplo de motor de inferencia, está Ollama, que es excelente para correr modelos OSS GPT en local Con algo así puedes crear un entorno personal dev+AI completamente offline, privado y muy rápido. El proyecto LEANN fue diseñado justo para ese tipo de uso: tiny footprint, búsqueda semántica en todo el entorno local, compatibilidad inmediata con Claude Code/Cursor, y la generación se puede resolver con ollama. No cuesta ni un centavo y no requiere ninguna API. Claro, configurarlo exige algo de esfuerzo. Pero ojalá alguien lo vuelva fácil de usar y completamente open source.
Si estás buscando APIs gratis, en Google Gemini puedes usar Gemini gratis, especialmente gemini-2.5-pro con thinking activado. El límite es bastante alto; lo estoy probando para benchmarks y todavía no lo he alcanzado. Los modelos de pesos abiertos como DeepSeek R1 y GPT-OSS también tienen acceso por API gratis ofrecido por varios proveedores de inferencia o fabricantes de hardware.
El límite gratuito de Gemini 2.5 pro es de 100 solicitudes por día
https://ai.google.dev/gemini-api/docs/rate-limits
Como referencia, si esto es para algo no sensible puede estar bien, pero Google usa estas interacciones para entrenamiento (excepto en el plan de pago).
Me sorprendió que el artículo tuviera mucha más información nueva de la que esperaba. Normalmente no profundizo tanto en las opciones, pero esta vez sentí que valió la pena leer incluso el artículo completo. Y también gracias a todos por los comentarios de HN; hay mucha información práctica.
Quiero recomendarle al OP que revise Continue.dev, ollama/lmstudio y cómo correr modelos en local. Algunos modelos son realmente fuertes para autocompletado, y otros como gpt-oss también son buenos para razonamiento o uso de herramientas. Para mí ese es my goto copilot.
¡Yo igual! Uso Continue en VSCode, y los modelos grandes de Qwen o gpt-oss-120b funcionan bastante bien en modo agentic.
Siento que Zed es un nivel más arriba que continue.dev. Ahí incluso puedes usar el modelo que quieras.
Tal como dice el post, el problema de los agentes de programación es que en cada solicitud envían sus propios datos + casi toda la base de código, así que sale caro. En cambio, en chats de IA el costo es prácticamente despreciable. Yo uso únicamente OpenRouter, porque me da acceso a casi todos los modelos. Sonnet era mi favorito, pero después de probar Gemini 2.5 Pro, casi siempre me parece mejor (la desventaja es que es lento). Para preguntas simples o cuando no recuerdo sintaxis, Gemini Flash es perfectísimo por lo rápido que va.
A algunos les sorprenderá que la gente entregue así sus datos por una free tier, pero sinceramente los recursos necesarios para correr un buen LLM en casa son tan altos que prefiero ceder mi código y usarlo gratis. Total, ese código de todas formas terminará siendo open source.
De verdad estoy de acuerdo con la afirmación de que "cuando usas IA en chats web (o sea, interfaces web como ChatGPT u Openrouter), casi siempre da mejores resultados para resolver problemas o proponer soluciones que un IDE o un framework de agentes". Aunque copiar código desde el IDE y pegarlo en un chat web parezca medio incómodo, en mi experiencia da resultados mucho mejores que Github copilot o cursor.