Vibe coding, automatización y MCP
(stdy.blog)Vibe coding = subcontratarle a la IA
En esencia, el vibe coding consiste en subcontratarle a la IA el desarrollo de un programa.
Si recuerdas la experiencia de subcontratar desarrollo, los buenos clientes suelen hacer bien estas cosas:
- Definir el trabajo para resolver su problema
- Comunicarse de forma que el desarrollador pueda entenderlo bien
- Proporcionar los recursos necesarios para crear bien el programa
- Revisar si el programa creado realmente realiza el trabajo como se pretendía
- En este proceso, aprender del desarrollador lo que no saben para poco a poco poder hacerlo por sí mismos
Si lo trasladamos a la perspectiva de quien hace vibe coding:
- Definir el PRD y el flujo de usuario
- Usar buenos prompts e instrucciones (como Cursor Rules)
- Detectar las partes que se desvían de la intención y ejecutar pruebas automatizadas
- Aprender en el proceso intercambiando ida y vuelta con la IA
Entonces, ¿qué pasa con el punto 3? Esto puede pensarse desde dos aspectos del programa:
- Primero, un programa tiene que ejecutarse en algún lugar. → decidir el entorno de ejecución y despliegue
- Segundo, un programa es un conjunto de código que “procesa entradas y produce salidas”. → proporcionar datos y APIs
Un programa tiene que ejecutarse
- En el desarrollo subcontratado, la responsabilidad del desarrollador normalmente llega hasta implementar el código, y la responsabilidad de despliegue y operación recae en quien lo encarga.
- En cambio, el desarrollador sí proporciona una guía para que el cliente pueda ejecutar ese programa.
- Como cliente que subcontrata, si le indicas a la IA el entorno en el que debe ejecutar y desplegar el código, lo hace bastante bien.
- Esto es todavía más cierto si se trata de código que corre sobre un navegador web.
- Antes, incluso un script muy simple como “eliminar con expresiones regulares parte de la sintaxis de un documento Markdown” no era fácil de ejecutar o desplegar para alguien que no fuera desarrollador.
- Ahora, con Claude Artifacts o Gemini Canvas, puedes crear y ejecutar en un instante tu propio programita. Si además quieres que otras personas lo usen, puedes crearlo y desplegarlo en Lovable, todo gratis y en cuestión de segundos.
- Que se llame vibe coding no significa que necesariamente tengas que crear una “app”. Si es un programa que resuelve tu problema y reduce tareas repetitivas, da igual si es una app, un script, GPTs o un prompt.
Las APIs que hacen más útil a un programa
- Pero los programas pequeños tienen límites.
- El removedor de Markdown no tiene conectado ni DB, ni API, ni LLM.
- Por eso, el usuario tiene que introducir manualmente el texto y también copiar manualmente el texto generado para pegarlo en otro lado.
- ¿Y si el objetivo del usuario fuera “tomar un texto escrito en Notion, depurarlo y publicarlo en redes sociales”?
- Entrada: introducir solo el enlace de la página de Notion
- Proceso: tomar el texto, pasarlo a un LLM para resumirlo de manera adecuada para redes sociales y luego quitar la sintaxis Markdown
- Salida: revisar el texto, aprobarlo y que se publique automáticamente en mi cuenta de redes sociales
- A cambio de renunciar a un tiempo de respuesta rápido y a la versatilidad, probablemente se habría reducido mucho el tiempo y la energía que el usuario dedica a esa tarea. Es decir, para un objetivo específico se vuelve más “útil”.
- Al final, la utilidad de un programa depende de cuánto reduce el trabajo que el usuario tiene que hacer directamente en términos de entrada/proceso/salida.
- automatizando la entrada
- haciendo más complejo el procesamiento
- o automatizando la salida
- En un programa común, mediante APIs (es decir, conectándose con otros programas) se puede automatizar la entrada y la salida, además de realizar un procesamiento más avanzado.
- Entrada: obtener permisos de Notion y llamar a la API de Notion para traer el contenido de la página
- Proceso: enviar el contenido de la página de Notion a una API de LLM junto con un system prompt y recibir una respuesta adecuada para redes sociales
- Salida: obtener permisos de Threads y llamar a la API de la red social para publicar el texto
- Sin embargo, construir algo así no es nada fácil incluso para desarrolladores con experiencia. Sobre todo porque la autorización suele ser complicada.
- ¿Se puede hacer esto más fácil?
Herramientas de automatización y MCP que se encargan de integraciones API complicadas
- Si usas herramientas de automatización como Zapier o Make, no necesitas integrar directamente las APIs.
- Ejemplo: cuando se agrega un nuevo ítem a una base de datos de Notion -> ejecutar ChatGPT -> subirlo a Instagram en un Zap
- Normalmente, para llamar a la API de publicación de Instagram tendrías que crear una app específica y hasta pasar por un proceso de revisión.
- En Zapier o Make ya tienen creada la app para subir a Instagram, y además ya está implementado todo el flujo para obtener permisos e intercambiar datos. No necesitas preocuparte por el problema engorroso de los permisos.
- Pero para algunas personas, incluso construir este tipo de flujo de “esto y luego aquello” puede resultar difícil y tedioso. Lo que permite que ese tipo de personas hagan todo desde un chatbot LLM son cosas como MCP/A2A.
- Así como un programa común puede ir más allá de una lógica simple gracias a las APIs, un programa como un chatbot LLM también puede conectarse con otros programas mediante MCP para hacer más que una simple salida de texto/imagen/voz.
- Eso significa que en Claude sería posible pedirle: “toma mi página de Notion, resúmela y luego súbela a Instagram”.
- Claro, para hacer esto necesitas conectar los servidores MCP adecuados (Notion, Instagram) al cliente MCP (Claude).
- La función principal de un servidor MCP es llamar a APIs en lugar del usuario mediante tools; Notion ya tiene un servidor MCP oficial, pero Instagram no.
- Entonces, ¿cómo llamaría Claude a la API de Instagram?
- Aquí vuelve a entrar Zapier. A través del servidor MCP que ofrecen Zapier o Make, sí es posible subir a Instagram.
- Es decir, si conectas a un chatbot LLM una herramienta de automatización por MCP (que ya trae muchísimas integraciones), se vuelve extremadamente potente.
El potencial y los límites de MCP
- Viéndolo así, quizá podrías preguntarte para qué usar MCP en primer lugar.
- Porque casi todo lo que hoy se puede hacer con chatbot + MCP también puede hacerse con herramientas de automatización.
- Sin embargo, el autor siente que el potencial de MCP es enorme por tres razones:
- Una interfaz conveniente (¿no será que un asistente tipo chatbot que se encarga de todo es el programa definitivo?)
- La intervención del usuario en tareas sensibles es más cómoda
- No solo puede automatizar tareas que deben realizarse en mi PC local, como el control del sistema de archivos o del navegador, sino que también puede proporcionar más información como recursos y plantillas de prompts
- Al usar MCP también hay varias cosas que cuidar.
- Cuanto más le delegues a MCP, más debes preocuparte por la seguridad. Por eso, un servidor MCP remoto oficial es más seguro que uno local.
- Si le das demasiadas tools de MCP al LLM, puede que no ejecute la herramienta que tú querías, y como todas las definiciones de tools pasan como tokens de entrada, también aumentan el costo y el tiempo de la llamada al LLM.
- La aleatoriedad propia de los LLM también debe vigilarse siempre en servicios comerciales.
- Al final, conectar APIs a mi programa, diseñar flujos de automatización o adjuntar MCP a un chatbot LLM son, en el fondo, la misma idea: “haz mi trabajo por mí”.
- No hace falta estresarse porque palabras clave como Make o MCP se hayan puesto de moda. Basta con crear, de la manera que te resulte más cómoda y entendiendo las ventajas y desventajas de cada enfoque, un programa que haga tu trabajo por ti.
Resumen
- El vibe coding consiste en subcontratarle a la IA el desarrollo de programas.
- Si realmente puede encargarse bien de mi trabajo, entonces tanto una web app como un snippet de código o un prompt pueden ser programas útiles.
- Para que un programa sea más útil, necesita conectarse a APIs para automatizar la entrada y la salida y realizar un procesamiento más avanzado.
- Las herramientas de automatización resuelven por ti la complejidad de conectar APIs.
- Un programa como un chatbot LLM también puede volverse más útil mediante conexión por MCP. En especial, es muy potente conectar los servidores MCP que ofrecen las herramientas de automatización.
- No hace falta usar solo una de API, automatización o MCP; mezclarlas puede hacerlo más simple y potente (ej.: conectar solo el MCP de Notion a Claude y configurar en Zapier un flujo de Notion a Instagram para automatizar la publicación).
- Teniendo en cuenta ventajas y desventajas, construyamos (junto con la IA) un programa que resuelva nuestros problemas de la manera que mejor nos encaje.
4 comentarios
Con algo como vibe coding no se puede llamar tercerización. En la tercerización se revisa por proyecto, pero los agentes de IA para programar de ahora necesitan revisión en unidades de tarea más pequeñas que eso.
Si fuera tercerización, yo debería poder encargar el trabajo y dedicarme a otra cosa… pero por ahora todavía hay que estar muy pendiente. Como un desarrollador junior inteligente pero torpe…
Pienso que pronto… aunque quizá no llegue a ser tercerización, sí podría trabajar como un pequeño equipo de desarrollo… dar instrucciones, revisar seguido, corregir… Pero todavía no parece estar en ese nivel.
Tal vez sea porque a mí me falta vibe…
https://tech.kakao.com/posts/700 Vi esta publicación y sentí que era un buen caso de Vibe Coding; me parece que el contexto es similar. Yo también coincido con lo que escribiste.
¡Gracias! Me hizo leer un texto interesante.
Entonces, ¿qué pasa con el 3? -> Es sobre el soporte de recursos.
Arriba lo numeré como 1, 2, 4 y 5, pero en Markdown se cambió automáticamente a 1234.