15 puntos por GN⁺ 2025-11-07 | Aún no hay comentarios. | Compartir por WhatsApp
  • Visualiza y explica las tendencias más recientes en las áreas de técnicas/herramientas/plataformas/lenguajes y frameworks de desarrollo en cuatro etapas: Adopt (recomendado para adopción), Trial (uso de prueba), Assess (evaluación) y Hold (precaución)
  • 4 temas principales: orquestación de infraestructura para IA, auge de los agentes basados en MCP, flujos de trabajo de codificación con IA y aparición de antipatrones de IA

Introducción de orquestación de infraestructura en IA

  • Las cargas de trabajo de IA están obligando a las organizaciones a contar con orquestación de grandes flotas de GPU para entrenamiento e inferencia
    • A medida que aumentan los modelos grandes que superan el límite de capacidad HBM (80 GB) de una sola GPU, el entrenamiento distribuido y la inferencia multi-GPU se vuelven indispensables
    • Los equipos de plataforma construyen pipelines complejos de múltiples etapas y ajustan continuamente el rendimiento y la latencia
    • Realizan telemetría remota de la flota con Nvidia DCGM Exporter y colocan trabajos en ubicaciones con el mayor ancho de banda de interconexión mediante topology-aware scheduling
  • Kubernetes sigue siendo la base clave para gestionar cargas de trabajo de IA a gran escala, pero también están ganando atención plataformas alternativas como microVM (Firecracker) y Uncloud
    • Siguen evolucionando estrategias de ubicación que consideran la comunicación rápida entre enlaces de GPU, como la gestión de colas y cuotas con Kueue, topology-aware scheduling y gang scheduling
    • Ubicación de trabajos multi-GPU dentro de "islas" continuas de centro de datos (racks o pods) con enlaces rápidos entre GPU como NVLink/NVSwitch y RDMA
  • Las recientes mejoras de API con reconocimiento de multi-GPU y NUMA en Kubernetes fortalecen estas capacidades, aumentando el ancho de banda entre dispositivos, reduciendo la tail latency y mejorando la tasa efectiva de utilización
    • Con el aumento de la demanda de flujos de trabajo de codificación con IA y el auge de agentes mejorados con MCP, se espera una rápida innovación en la infraestructura de IA
    • La orquestación con reconocimiento de GPU se está convirtiendo en un requisito básico y la topología ahora está surgiendo como una consideración de primer nivel para la planificación

Auge de los agentes basados en MCP

  • El auge simultáneo de MCP y los agentes, junto con la expansión del ecosistema de protocolos y herramientas construido en torno a ellos, es uno de los temas clave de este Radar
    • MCP se está consolidando como el protocolo de integración definitivo para habilitar agentes y permitir una operación eficiente y semiautónoma
  • Casi todos los grandes proveedores están añadiendo soporte para MCP, y los flujos de trabajo centrados en agentes están creciendo rápidamente
  • Se observa innovación continua en los flujos de trabajo de agentes, y la ingeniería de contexto está emergiendo como clave para optimizar el comportamiento del modelo y la eficiencia en el uso de recursos
    • Nuevos protocolos como A2A (Agent-to-Agent) y AG-UI reducen la complejidad de crear aplicaciones colaborativas con múltiples agentes
    • Tecnologías como AGENTS.md, Anchoring coding agents y Context7 MCP server están siendo adoptadas en flujos de trabajo reales de desarrollo
  • Por la naturaleza del ecosistema de IA, en cada Radar aparecen nuevas innovaciones de forma explosiva
    — la vez pasada fue RAG, y esta vez son los flujos de trabajo de agentes y la creciente constelación de herramientas, técnicas y plataformas que los respaldan
    • Y también están apareciendo algunos antipatrones de IA dignos de atención

Flujos de trabajo de codificación con IA

  • La IA está transformando la manera de construir y mantener software, y es el tema dominante en las discusiones recientes
    • Desde el uso de IA para comprender bases de código heredadas hasta GenAI para ingeniería forward, se está integrando estratégicamente en toda la cadena de valor del software
    • Se está aprendiendo a suministrar conocimiento de forma más efectiva a los agentes de codificación
  • Los equipos están experimentando con nuevas prácticas, como definir instrucciones personalizadas mediante archivos AGENTS.md e integrarse con servidores MCP como Context7 para traer documentación actualizada de dependencias
    • Crece la percepción de que la IA no solo debe potenciar a contribuyentes individuales, sino también amplificar a todo el equipo
    • Están surgiendo instrucciones compartidas curadas y comandos personalizados para asegurar una difusión equitativa del conocimiento
  • El entorno de herramientas está evolucionando con dinamismo:
    • Los diseñadores usan UX Pilot y AI Design Reviewer, y los desarrolladores crean prototipos rápidamente con self-service UI prototyping mediante v0 y Bolt
    • Continúa el debate sobre el alcance del desarrollo basado en especificaciones, el nivel de granularidad y si puede servir como una única fuente de verdad para la entrega incremental
    • Pese al entusiasmo, la complacencia frente al código generado por IA sigue siendo una preocupación común, lo que recuerda que la IA puede acelerar la ingeniería, pero el juicio humano sigue siendo indispensable

Aparición de nuevos antipatrones de IA

  • A medida que se acelera la adopción de IA en toda la industria, también están saliendo a la superficie antipatrones emergentes junto con prácticas efectivas
    • Aunque se reconoce la utilidad clara de conceptos como el self-service disposable UI prototyping con GenAI, también se identifica su potencial para llevar a las organizaciones al antipatrón de Shadow IT acelerado por IA
    • A medida que MCP (Model Context Protocol) gana atención, muchos equipos están cayendo en el antipatrón de conversión ingenua de API a MCP
  • La efectividad de las soluciones de Text-to-SQL no está cumpliendo las expectativas iniciales, y la complacencia frente al código generado por IA sigue siendo una preocupación vigente
    • Incluso dentro de prácticas emergentes como el desarrollo basado en especificaciones, existe el riesgo de recaer en antipatrones tradicionales de ingeniería de software
      — en particular, la especificación excesiva por adelantado y el sesgo hacia lanzamientos big bang
  • GenAI está avanzando a una velocidad y escala sin precedentes, por lo que se espera que surjan rápidamente nuevos antipatrones
    • Los equipos deben mantenerse alerta ante patrones que al principio parecen efectivos, pero con el tiempo degradan el desempeño, retrasan la retroalimentación, perjudican la adaptabilidad o vuelven difusa la responsabilidad

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

1. Continuous compliance

  • Práctica que garantiza que los procesos y tecnologías de desarrollo de software cumplan continuamente con normas regulatorias y estándares de seguridad mediante automatización
  • Integra herramientas de policy-as-code como Open Policy Agent y genera SBOM dentro del pipeline de CD para detectar y resolver problemas de cumplimiento desde etapas tempranas conforme a las guías de SLSA
  • Al codificar reglas y buenas prácticas, se pueden imponer estándares de forma consistente en todo el equipo sin generar cuellos de botella
  • Con el aumento del riesgo de complacencia frente al código generado por IA, integrar el cumplimiento dentro del proceso de desarrollo es más importante que nunca

2. Curated shared instructions for software teams

  • Para los equipos que usan activamente IA en la entrega de software, se está pasando del prompting individual a instrucciones curadas
  • La forma más intuitiva de implementarlo es hacer commit directamente en el repositorio del proyecto de archivos de instrucciones como AGENTS.md
  • La mayoría de las herramientas de codificación con IA, como Cursor, Windsurf y Claude Code, admiten compartir instrucciones mediante comandos slash personalizados o flujos de trabajo
  • En cuanto se mejoran los prompts, todo el equipo se beneficia de inmediato, garantizando acceso consistente a las mejores instrucciones de IA

3. Pre-commit hooks

  • Los Git hooks existen desde hace mucho tiempo, pero siguen sin aprovecharse lo suficiente
  • Con el auge de la asistencia de IA y la codificación con agentes, aumenta el riesgo de hacer commit por accidente de secretos o código problemático
  • Aunque hay muchos mecanismos de verificación de código como continuous integration, los hooks de pre-commit son una barrera de seguridad simple y efectiva que más equipos deberían adoptar
  • Lo mejor es mantenerlos mínimos y enfocados, concentrándose en riesgos que se detectan con mayor eficacia en esta etapa del flujo de trabajo, como el escaneo de secretos

4. Uso de GenAI para entender codebases legacy

  • El uso de GenAI para entender codebases legacy acelera significativamente la comprensión de sistemas complejos a gran escala
  • Herramientas como Cursor, Claude Code, Copilot, Windsurf, Aider, Cody, Swimm, Unblocked, PocketFlow-Tutorial-Codebase-Knowledge ayudan a hacer visibles las reglas de negocio, resumir la lógica e identificar dependencias
  • Cuando se usan junto con frameworks abiertos y prompting directo a LLM, reducen de forma drástica el tiempo necesario para comprender codebases legacy
  • El esfuerzo de configuración de enfoques avanzados como GraphRAG varía, especialmente según el tamaño y la complejidad del codebase analizado, pero su impacto en la productividad es consistente y considerable

Trial

5. AGENTS.md

  • Un formato común para proporcionar instrucciones a agentes de codificación con IA que trabajan en un proyecto
  • Es, en esencia, un archivo README para agentes, y no tiene campos obligatorios ni formato más allá de Markdown
  • Depende de la capacidad de los agentes de codificación basados en LLM para interpretar instrucciones escritas y legibles por humanos
  • Es común incluir consejos para usar herramientas del entorno de codificación, instrucciones de pruebas y prácticas preferidas para la gestión de commits

6. IA para migraciones de código

  • Las migraciones de código adoptan muchas formas, desde reescrituras de lenguaje hasta actualizaciones de dependencias o frameworks, y a menudo requieren meses de trabajo manual
  • Equipos de actualización de versiones de .NET framework están experimentando con IA para acortar el proceso
  • En el pasado se usaron herramientas deterministas de refactorización basadas en reglas como OpenRewrite; usar solo IA puede ser costoso y hacer que la conversación se desvíe con facilidad
  • En lugar de delegar toda la actualización, el proceso se descompone en pasos más pequeños y verificables, como análisis de errores de compilación, generación de diffs de migración y validación iterativa de pruebas
  • Casos de la industria como la migración a gran escala de Google de int32 a int64 también reflejan una tendencia similar

7. Delta Lake liquid clustering

  • Una técnica para tablas de Delta Lake que funciona como alternativa a partitioning y Z-ordering
  • Históricamente, optimizar el rendimiento de lectura de tablas Delta requería definir claves de partición y de Z-order al crear la tabla, con base en los patrones de consulta esperados
  • liquid clustering usa un algoritmo basado en árboles para agrupar datos según claves especificadas
  • Puede cambiarse de forma gradual sin reescribir todos los datos, lo que ofrece mayor flexibilidad para soportar distintos patrones de consulta
  • Databricks Runtime for Delta Lake admite liquid clustering automático analizando cargas históricas de consulta, identificando columnas óptimas y agrupando los datos en consecuencia

8. Prototipado de UI self-serve con GenAI

  • Herramientas como Claude Code, Figma Make, Miro AI, v0 permiten que product managers creen directamente prototipos interactivos y aptos para pruebas con usuarios a partir de prompts de texto
  • En lugar de crear wireframes manualmente, los equipos pueden generar en minutos artefactos funcionales de HTML, CSS y JS
  • Estos prototipos "desechables" intercambian pulido por aprendizaje rápido, por lo que son ideales para validación temprana durante design sprints
  • Una mayor fidelidad puede llevar a un enfoque equivocado en los detalles o a expectativas poco realistas sobre el esfuerzo de producción, por lo que es esencial un framing claro y una buena gestión de expectativas

9. Salida estructurada de LLMs

  • Una práctica que restringe a los LLM para que generen respuestas en formatos predefinidos como JSON o clases específicas de programación
  • Convierte el texto generalmente impredecible de los LLM en contratos de datos legibles por máquina y deterministas, algo esencial para construir aplicaciones confiables de nivel de producción
  • Los enfoques varían desde formateo simple basado en prompts y structured outputs nativos del modelo hasta métodos más robustos de decodificación restringida con herramientas como Outlines e Instructor
  • Se ha usado con éxito para extraer datos complejos y no estructurados de diversos tipos de documentos y convertirlos en JSON estructurado para lógica de negocio downstream

10. TCR (Test && Commit || Revert)

  • Un flujo de trabajo de programación derivado del desarrollo guiado por pruebas que promueve pasos muy pequeños y continuos mediante una regla simple
  • Si las pruebas pasan después de cada cambio, los cambios se confirman; si fallan, los cambios se revierten
  • Es fácil de implementar porque solo requiere definir scripts que automaticen este ciclo dentro del codebase
  • Presentado por primera vez en el artículo formal de Kent Beck, TCR refuerza prácticas positivas de codificación como YAGNI y KISS

Assess

11. Pruebas de UI impulsadas por IA

  • En un Radar anterior, las pruebas de UI basadas en IA se enfocaban principalmente en pruebas exploratorias, y se señaló que la no determinación de los LLM podía causar inestabilidad
  • Con el auge de MCP, frameworks principales de pruebas de UI como Playwright y Selenium han incorporado sus propios servidores MCP (playwright-mcp, mcp-selenium)
  • Al ofrecer automatización confiable del navegador mediante tecnologías nativas, permiten que asistentes de codificación generen pruebas de UI confiables en Playwright o Selenium
  • Hay entusiasmo por desarrollos como Playwright Agents en la versión más reciente de Playwright, y se espera la aparición de orientación más práctica y experiencia de campo

12. Anchoring coding agents to a reference application

  • En el pasado se marcó el patrón de tailored service templates, que ayuda a las organizaciones que adoptan microservicios a iniciar nuevos servicios e integrarlos sin fricción con la infraestructura existente
  • Con el tiempo, a medida que aparecen nuevas dependencias, frameworks y patrones de arquitectura, tiende a aumentar la deriva de código entre estas plantillas y los servicios existentes
  • En la era de los agentes de codificación, se experimenta con anchoring coding agents to a reference application para mantener buenas prácticas y consistencia arquitectónica
  • Un servidor de Model Context Protocol (MCP) expone tanto el código de plantilla de referencia como los diff de commits, para que los agentes puedan detectar la deriva y proponer correcciones

13. Context engineering

  • Diseño y optimización sistemáticos de la información proporcionada al LLM durante la inferencia para generar de forma confiable la salida deseada
  • Incluye estructurar, seleccionar y ordenar elementos de contexto como prompts, datos recuperados, memoria, instrucciones y señales del entorno
  • A diferencia de prompt engineering, que se enfoca solo en la redacción del prompt, context engineering considera la composición completa del contexto
  • Hoy, los ingenieros usan varias técnicas individuales que pueden agruparse en tres áreas: Context setup, Context management for long-horizon tasks, Dynamic information retrieval

14. GenAI for forward engineering

  • Técnica emergente para modernizar sistemas legacy mediante descripciones del codebase legacy generadas por IA
  • Introduce una etapa explícita enfocada en lo que hace el código legacy (la especificación), mientras oculta de forma intencional cómo está implementado actualmente
  • Está relacionada con spec-driven development, pero aplicada específicamente a la modernización de legacy
  • Siguiendo el ciclo reverse-engineering → design/solutioning → forward-engineering, tanto humanos como agentes de IA pueden razonar a un nivel más alto antes de comprometerse con la implementación

15. GraphQL as data access pattern for LLMs

  • Enfoque emergente para crear una capa uniforme y amigable para modelos de acceso a datos que mejora context engineering
  • Permite exponer datos estructurados y consultables sin dar al modelo acceso directo a la base de datos
  • A diferencia de las APIs REST, que requieren nuevos endpoints o filtros para cada caso de uso, GraphQL permite al modelo recuperar solo los datos que necesita
  • Un esquema GraphQL bien definido proporciona metadatos que el LLM puede usar para razonar sobre las entidades y relaciones disponibles

16. Knowledge flows over knowledge stocks

  • Reciben con frecuencia la pregunta de "cómo mejorar la forma de compartir información entre equipos"
  • El concepto de knowledge flows and knowledge stocks, una perspectiva tomada del pensamiento sistémico, resulta valioso
  • Fomenta ver el conocimiento organizacional como un sistema: los stocks representan el conocimiento acumulado y los flows cómo ese conocimiento se mueve y evoluciona dentro de la organización
  • Aumentar el flujo de conocimiento externo hacia la organización tiende a impulsar la innovación, y establecer communities of practice es una forma comprobada de mejorar esos flujos

17. LLM as a judge

  • Usar un LLM como juez para evaluar la salida de otros sistemas (normalmente generadores basados en LLM) ha llamado la atención por su potencial para ofrecer evaluaciones escalables y automatizadas en IA generativa
  • Este blip se mueve de Trial a Assess para reflejar complejidades y riesgos recientemente reconocidos
  • La evaluación es vulnerable a position bias, verbosity bias y baja robustez, y un problema aún más serio es scaling contamination
  • Para responder a estas fallas, se exploran técnicas mejoradas como LLMs as a jury (usar varios modelos para llegar a consenso) o razonamiento chain-of-thought durante la evaluación

18. On-device information retrieval

  • Técnica que permite que la búsqueda, la conciencia de contexto y la retrieval-augmented generation (RAG) se ejecuten por completo en el dispositivo del usuario (móvil, desktop o edge)
  • Prioriza la privacidad y la eficiencia computacional combinando bases de datos locales ligeras con modelos optimizados para inferencia on-device
  • Una implementación prometedora combina sqlite-vec (una extensión de SQLite que habilita búsqueda vectorial dentro de una base de datos embebida) con EmbeddingGemma (un modelo de embeddings de 300 millones de parámetros basado en la arquitectura Gemma 3)
  • Se recomienda evaluarla para aplicaciones local-first y otros casos de uso donde la soberanía de los datos, la baja latencia y la privacidad son importantes

19. SAIF

  • SAIF (Secure AI Framework) es un framework desarrollado por Google para ofrecer una guía práctica para gestionar riesgos de seguridad en IA
  • Aborda de manera sistemática amenazas comunes como data poisoning y prompt injection mediante mapas de riesgo claros, análisis de componentes y estrategias prácticas de mitigación
  • Su enfoque en los riesgos cambiantes de construir sistemas de agentes es especialmente oportuno y valioso
  • Ofrece un playbook conciso y accionable que puede usarse para reforzar las buenas prácticas de seguridad en el uso de LLM y en aplicaciones impulsadas por IA

20. Service mesh without sidecar

  • Dado que persisten el costo y la complejidad operativa de los service mesh basados en sidecar, entusiasma la aparición de opciones sin sidecar como Istio ambient mode
  • Ambient mode introduce una arquitectura en capas que separa responsabilidades entre dos componentes principales: un proxy L4 por nodo (ztunnel) y un proxy L7 por namespace (Waypoint proxy)
  • ztunnel garantiza que el tráfico L3 y L4 se transporte de forma eficiente y segura, obtiene certificados para todas las identidades del nodo y maneja la redirección de tráfico con workloads compatibles con ambient
  • Waypoints proxy es un componente opcional de ambient mode que habilita funciones más ricas de Istio, como gestión de tráfico, seguridad y visibilidad

21. Small language models

  • A lo largo de varios volúmenes de Technology Radar, han observado el avance constante de los small language models (SLMs)
  • Con el aumento del interés en construir soluciones con agentes, también crece la evidencia de que los SLM pueden impulsar de forma eficiente la IA basada en agentes
  • La mayoría de los flujos de trabajo actuales con agentes se enfocan en tareas limitadas y repetitivas que no requieren razonamiento avanzado, por lo que encajan bien con los SLM
  • El desarrollo continuo de SLM como Phi-3, SmolLM2 y DeepSeek ofrece capacidades suficientes para estas tareas

22. Spec-driven development

  • Un enfoque emergente para flujos de trabajo de programación asistida por IA, cuya definición sigue evolucionando
  • Generalmente se refiere a un flujo de trabajo que comienza con especificaciones funcionales estructuradas y luego las descompone en partes más pequeñas, soluciones y tareas a través de varias etapas
  • Kiro de Amazon guía a los usuarios por tres etapas del flujo de trabajo: requisitos, diseño y generación de tareas
  • spec-kit de GitHub sigue un proceso similar de tres etapas, pero agrega una orquestación más rica, prompts configurables y una "constitution" que define principios inmutables que siempre deben seguirse

23. Team of coding agents

  • Una técnica en la que el desarrollador orquesta varios agentes de programación con IA, cada uno con un rol específico como architect, back-end specialist o tester
  • Herramientas como Claude Code, Roo Code y Kilo Code admiten subagentes y múltiples modos de operación
  • Basado en el principio demostrado de que asignar roles y personas específicos a un LLM mejora la calidad de la salida, se logran mejores resultados coordinando varios agentes especializados en lugar de depender de un solo agente de propósito general
  • Marca un cambio hacia pipelines de desarrollo asistido por IA orquestados y de múltiples etapas

24. Topology-aware scheduling

  • Las GPU y las LPU ya no son dispositivos independientes, sino redes de aceleradores estrechamente acopladas cuyo rendimiento depende de la ubicación y la topología
  • En sistemas a escala de rack como NVL72 de NVIDIA, 72 GPU comparten más de 13 TB de VRAM y funcionan como un solo acelerador, pero cuando la carga de trabajo cruza islas de switches, las operaciones colectivas se convierten en cuellos de botella
  • La arquitectura de Groq, con scheduling en software en tiempo de compilación, asume movimiento de datos determinista, y un scheduling aleatorio rompe esas suposiciones y su previsibilidad
  • Los schedulers ingenuos que ignoran la topología suelen distribuir cargas de trabajo multi-GPU de forma arbitraria, lo que empeora el tiempo por etapa y la eficiencia

25. Toxic flow analysis for AI

  • El chiste conocido de que la S de MCP significa "security" oculta un problema muy real
  • Cuando los agentes se comunican entre sí mediante llamadas a herramientas o APIs, pueden encontrarse rápidamente con lo que se conoce como lethal trifecta: acceso a datos personales, exposición a contenido no confiable y capacidad de comunicación externa
  • Un agente que tiene las tres es muy vulnerable, y como los LLM tienden a seguir las instrucciones de la entrada, el contenido de fuentes no confiables que incluya instrucciones para filtrar datos puede llevar fácilmente a una fuga de información
  • toxic flow analysis inspecciona el grafo de flujo de los sistemas de agentes para identificar rutas de datos potencialmente inseguras para una investigación adicional

Hold

26. AI-accelerated shadow IT

  • La IA reduce la barrera para que personas no programadoras construyan e integren software por su cuenta, en lugar de esperar al departamento de TI
  • Aunque les entusiasma el potencial que esto libera, están atentos a las primeras señales de AI-accelerated shadow IT
  • Las plataformas no-code de automatización de flujos de trabajo ahora admiten integración con APIs de IA, como OpenAI o Anthropic, lo que genera la tentación de usar la IA como cinta adhesiva para conectar integraciones que antes no eran posibles
  • Al mismo tiempo, los asistentes de programación con IA se están volviendo más agentivos, permitiendo que personas no programadoras con capacitación básica construyan aplicaciones utilitarias internas

27. Capacity-driven development

  • La clave del éxito de las prácticas modernas de desarrollo de software es mantener el enfoque en el flujo de trabajo
  • Los equipos stream-aligned se concentran en un único flujo valioso, como un recorrido de usuario o un producto, para entregar valor end-to-end de manera eficiente
  • Sin embargo, observan una tendencia preocupante hacia capacity-driven development, en la que equipos alineados de esta forma asumen funcionalidades de otros productos o flujos cuando tienen capacidad disponible
  • A corto plazo puede parecer eficiente, pero es una optimización local adecuada sobre todo para manejar picos de demanda, y cuando se normaliza aumenta la carga cognitiva y la deuda técnica

28. Complacency with AI-generated code

  • A medida que los asistentes y agentes de programación con IA ganan atención, aumentan los datos y estudios que resaltan la preocupación por complacency with AI-generated code
  • Hay suficiente evidencia de que estas herramientas pueden acelerar el desarrollo, pero los estudios muestran que la calidad del código puede deteriorarse con el tiempo
  • En la investigación de 2024 de GitClear, el código duplicado y el code churn aumentaron más de lo esperado, mientras que la actividad de refactorización en el historial de commits disminuyó
  • La investigación de Microsoft sobre trabajadores del conocimiento muestra que la confianza impulsada por IA a menudo aparece a costa del pensamiento crítico

29. Naive API-to-MCP conversion

  • Las organizaciones están ansiosas por convertir de forma fluida y directa sus APIs internas a Model Context Protocol (MCP) para que los agentes de IA interactúen con los sistemas existentes
  • Hay un número creciente de herramientas como MCP link y FastAPI-MCP que buscan facilitar esa conversión
  • Están en contra de esta naive API-to-MCP conversion, ya que las APIs normalmente están diseñadas para desarrolladores humanos y consisten en operaciones atómicas de granularidad fina que, cuando la IA intenta encadenarlas, pueden generar uso excesivo de tokens, contaminación de contexto y menor rendimiento del agente
  • Estas APIs suelen exponer datos sensibles o permitir acciones destructivas, especialmente en el caso de APIs internas

30. Equipos de ingeniería de datos independientes

  • Organizar equipos de ingeniería de datos separados que desarrollan y son dueños de pipelines y productos de datos aparte del dominio de negocio al que sirven es un antipatrón que conduce a ineficiencias y resultados de negocio débiles
  • Esta estructura repite errores del pasado al separar capacidades de DevOps, pruebas o despliegue, lo que genera silos de conocimiento, cuellos de botella y desperdicio de esfuerzo
  • Sin una colaboración estrecha, los ingenieros de datos a menudo carecen del contexto de negocio y de dominio necesario para diseñar productos de datos significativos, lo que limita tanto la adopción como el valor
  • En su lugar, los equipos de plataforma de datos deben enfocarse en mantener infraestructura compartida, mientras que los equipos de negocio multifuncionales deben construir y ser dueños de sus propios data products según los principios de data mesh

31. Text to SQL

  • Text to SQL usa LLM para traducir lenguaje natural a SQL ejecutable, pero su confiabilidad a menudo no cumple con las expectativas
  • Este blip se movió a Hold para desalentar su uso en flujos de trabajo no supervisados; por ejemplo, cuando la salida está oculta o se convierten dinámicamente consultas generadas por usuarios de forma automatizada
  • En estos casos, los LLM suelen alucinar debido a una comprensión limitada del esquema o del dominio, con el riesgo de recuperar datos incorrectos o modificar datos de forma no intencional
  • Para agentic business intelligence, eviten el acceso directo a la base de datos y usen en su lugar una capa semántica de abstracción de datos administrada como Cube o dbt's semantic layer

[Platforms]

Adopt

32. Arm in the cloud

  • Las instancias de cómputo Arm en la nube se han vuelto cada vez más populares en los últimos años por su eficiencia en costos y energía frente a las instancias tradicionales basadas en x86
  • Los principales proveedores de nube, incluidos AWS, Azure y GCP, ahora ofrecen opciones Arm sólidas
  • Muchos equipos han migrado con éxito cargas de trabajo como microservicios, bases de datos open source e incluso computación de alto rendimiento a Arm con cambios mínimos de código y solo algunos ajustes en scripts de build
  • Herramientas modernas como las multi-arch Docker images simplifican el build y el despliegue tanto en entornos Arm como x86

Trial

33. Apache Paimon

  • Apache Paimon es un formato open source de data lake diseñado para hacer posible una lakehouse architecture
  • Se integra sin fricciones con motores de procesamiento como Flink y Spark, y soporta tanto trabajos de streaming como de batch
  • Una ventaja clave de la arquitectura de Paimon es la combinación de un formato estándar de data lake con la estructura LSM (log-structured merge tree)
  • Esta combinación resuelve desafíos tradicionales de los data lakes, como actualizaciones de alto rendimiento y lecturas de baja latencia

34. DataDog LLM Observability

  • Datadog LLM Observability ofrece trazabilidad, monitoreo y diagnóstico end-to-end para flujos de trabajo de modelos de lenguaje grandes y aplicaciones de agentes
  • Mapea cada prompt, llamada de herramienta y paso intermedio a spans y traces, rastrea latencia, uso de tokens, errores y métricas de calidad, y se integra con la amplia suite de APM y observabilidad de Datadog
  • Las organizaciones que ya usan Datadog y están familiarizadas con su estructura de costos pueden encontrar que sus capacidades de visibilidad para LLM son una forma intuitiva de obtener observabilidad sobre cargas de trabajo de IA, asumiendo que pueden instrumentarlas
  • Configurar y usar instrumentación de LLM requiere cuidado y una comprensión sólida de la carga de trabajo y la implementación, y se recomienda una colaboración estrecha entre ingenieros de datos y personal de operaciones durante el despliegue

35. Delta Sharing

  • Delta Sharing es un estándar abierto y protocolo para compartir datos de forma segura entre plataformas, desarrollado por Databricks y la Linux Foundation
  • Es independiente de la nube y permite que las organizaciones compartan datos en vivo entre proveedores de nube y ubicaciones on-premises sin copiar ni replicar los datos
  • Usa una REST API simple para emitir URL prefirmadas de corta duración que permiten a los destinatarios consultar grandes conjuntos de datos con herramientas como pandas, Spark o Power BI
  • Soporta compartir tablas de datos, vistas, modelos de IA y notebooks, y ofrece una gobernanza centralizada sólida y auditoría

36. Dovetail

  • La plataforma Dovetail aborda el desafío persistente de gestionar datos de investigación cualitativa distribuidos
  • Ofrece un repositorio centralizado para entrevistas con usuarios, transcripciones e insights, transformando datos en bruto en activos estructurados y analizables
  • Es especialmente útil en flujos de trabajo de product discovery, donde crea trazabilidad de evidencia que conecta directamente citas de clientes y temas sintetizados con hipótesis de producto y ROI esperado
  • Al hacerlo, Dovetail fortalece el papel de los datos cualitativos en la toma de decisiones de producto

37. Langdock

  • Langdock es una plataforma para que las organizaciones desarrollen y ejecuten agentes de IA generativa y flujos de trabajo para operaciones internas
  • Ofrece un entorno integrado con asistentes de chat internos, una capa de API para conectarse a múltiples LLM y herramientas para construir flujos de trabajo de agentes que se integran con sistemas como Slack, Confluence y Google Drive
  • La plataforma enfatiza la soberanía de datos al ofrecer opciones on-premises y de hosting en la UE con estándares de cumplimiento empresarial
  • Las organizaciones que implementen Langdock igual deben prestar mucha atención a la gobernanza de datos y usar técnicas como toxic flow analysis para prevenir la lethal trifecta

38. LangSmith

  • LangSmith es la plataforma alojada del equipo de LangChain para ofrecer visibilidad, trazabilidad y evaluación de aplicaciones LLM
  • Captura traces detallados de cadenas, herramientas y prompts para que los equipos puedan depurar y medir el comportamiento del modelo, seguir regresiones de rendimiento y gestionar conjuntos de datos de evaluación
  • LangSmith es una plataforma SaaS propietaria con soporte limitado para flujos de trabajo que no usan LangChain, por lo que resulta más atractiva para equipos que ya invirtieron en ese ecosistema
  • Su soporte integrado para evaluación de prompts y experimentación es especialmente más pulido que alternativas open source como Langfuse

39. Model Context Protocol (MCP)

  • Model Context Protocol (MCP) es un estándar abierto que define cómo las aplicaciones y agentes de LLM se integran con fuentes de datos y herramientas externas
  • MCP se diferencia del protocolo Agent2Agent (A2A), que gestiona la comunicación entre agentes con foco en el acceso al contexto y a las herramientas
  • Desde el último blip, la adopción de MCP se ha disparado, y empresas importantes como JetBrains (IntelliJ) y Apple se han sumado al ecosistema junto con frameworks emergentes como FastMCP
  • El estándar en vista previa MCP Registry ahora admite el descubrimiento de herramientas públicas y propietarias

40. n8n

  • n8n es una plataforma de automatización de flujos de trabajo con licencia fair-code, similar a Zapier o Make (antes Integromat), pero pensada para desarrolladores que quieren opciones autohospedadas, extensibles y controlables por código
  • Ofrece un enfoque visual y low-code para crear flujos de trabajo, en comparación con Apache Airflow, pero también admite código personalizado en JavaScript o Python
  • Su principal caso de uso es integrar múltiples servicios en flujos de trabajo automatizados, aunque también puede conectar LLM con fuentes de datos, memoria y herramientas configurables
  • Muchos equipos usan n8n para prototipar rápidamente flujos de trabajo de agentes activados por aplicaciones de chat o webhooks, y a menudo aprovechan las funciones de importación y exportación para generar flujos de trabajo con ayuda de IA

41. OpenThread

  • OpenThread es una implementación open source del protocolo de red Thread desarrollada por Google
  • Soporta todas las funciones principales de la especificación Thread, incluidas capas de red como IPv6, 6LoWPAN y LR-WPAN, además de capacidades de red mallada donde los dispositivos pueden operar como nodos y border routers
  • OpenThread funciona en una amplia variedad de plataformas de hardware gracias a una capa de abstracción flexible y hooks de integración que permiten a los proveedores integrar sus propias funciones de radio y criptografía
  • Este protocolo maduro se usa ampliamente en productos comerciales y, según nuestra experiencia, es confiable para construir diversas soluciones de IoT, desde dispositivos de bajo consumo alimentados por batería hasta redes malladas de sensores a gran escala

Assess

42. AG-UI Protocol

  • AG-UI es un protocolo abierto y una biblioteca diseñados para estandarizar interfaces de usuario enriquecidas y la comunicación entre agentes
  • Se enfoca en agentes orientados directamente al usuario y se generaliza a cualquier frontend y backend mediante integraciones de cliente y middleware
  • El protocolo define una forma consistente para que los agentes backend se comuniquen con aplicaciones frontend, haciendo posible la colaboración en tiempo real con estado persistente entre la IA y los usuarios humanos
  • Soporta múltiples protocolos de transporte, incluidos SSE y WebSockets, y ofrece tipos de eventos estandarizados que representan distintos estados de la ejecución de agentes

43. Agent-to-Agent (A2A) Protocol

  • Agent2Agent (A2A) es un protocolo que define un estándar para la comunicación e interacción entre agentes en flujos de trabajo complejos de múltiples agentes
  • Usa Agent Cards para describir elementos clave de la comunicación entre agentes, incluidas especificaciones para el descubrimiento y la transferencia de capacidades, así como esquemas de seguridad
  • A2A complementa a Model Context Protocol (MCP) al centrarse en la comunicación entre agentes sin exponer detalles internos como el estado, la memoria o el funcionamiento interno de los agentes
  • El protocolo promueve buenas prácticas como un enfoque async-first para tareas de larga duración, respuestas en streaming para actualizaciones progresivas y transporte seguro mediante HTTPS, autenticación y autorización

44. Amazon S3 Vectors

  • Amazon S3 Vectors amplía el almacenamiento de objetos de S3 con capacidades nativas para vectores, ofreciendo almacenamiento vectorial integrado y búsqueda por similitud
  • Se integra de forma fluida con el ecosistema de AWS, incluidos Amazon Bedrock y OpenSearch, y ofrece funciones adicionales como filtrado por metadatos y gobernanza mediante IAM
  • Aunque sigue en vista previa y tiene limitaciones, su propuesta de valor es atractiva: este enfoque de almacenamiento vectorial rentable y accesible puede habilitar diversas aplicaciones que involucran grandes volúmenes de datos y donde la baja latencia no es la principal preocupación

45. Ardoq

  • Ardoq es una plataforma de arquitectura empresarial (EA) que permite a las organizaciones construir, gestionar y escalar una base de conocimiento de arquitectura para planificar el futuro de forma más efectiva
  • A diferencia de la documentación estática tradicional, que tiende al drift y a los silos, el enfoque basado en datos de Ardoq crea un grafo de conocimiento dinámico que extrae información de sistemas existentes y se mantiene actualizado a medida que evoluciona el panorama
  • Una función especialmente útil es Ardoq Scenarios, que permite modelar y definir visualmente estados futuros hipotéticos usando un enfoque de branching y merging similar a Git
  • Las organizaciones que buscan una transformación arquitectónica deberían evaluar plataformas de EA dedicadas como Ardoq por su potencial para simplificar y acelerar este proceso

46. CloudNativePG

  • CloudNativePG es un Kubernetes Operator que simplifica el alojamiento y la gestión de clústeres PostgreSQL de alta disponibilidad en Kubernetes
  • Ejecutar servicios con estado como PostgreSQL en Kubernetes puede ser complejo, ya que requiere conocimiento profundo tanto de Kubernetes como de la replicación de PostgreSQL
  • CloudNativePG abstrae gran parte de esta complejidad al tratar todo el clúster PostgreSQL como un único recurso declarativo configurable
  • Ofrece una arquitectura primary/standby fluida usando replicación nativa por streaming y proporciona de inmediato funciones de alta disponibilidad, incluidas capacidades de self-healing, failover automático promoviendo la réplica más actualizada y recreación automática de réplicas fallidas

47. Coder

  • Coder es una plataforma para aprovisionar rápidamente entornos de desarrollo estandarizados, siguiendo la práctica antes descrita de development environments in the cloud
  • En comparación con herramientas similares como Gitpod (ahora renombrado como Ona) y GitHub Codespaces, Coder ofrece mayor control sobre la personalización de estaciones de trabajo mediante Terraform
  • Hospeda las estaciones de trabajo en la infraestructura propia de la organización, en su nube o centro de datos, en lugar de en los servidores del proveedor
  • Este enfoque ofrece mayor flexibilidad, incluida la capacidad de ejecutar agentes de codificación con IA y acceder a sistemas internos de la organización

48. Graft

  • Graft es un motor de almacenamiento transaccional que permite una sincronización de datos sólida, consistente y eficiente en entornos edge y distribuidos
  • Usa lazy replication para sincronizar datos solo cuando es necesario, partial replication para minimizar el consumo de ancho de banda y serializable snapshot isolation para garantizar la integridad de los datos
  • En Radar mencionamos Electric para casos de uso similares, pero Graft se distingue porque convierte el almacenamiento de objetos en un sistema transaccional que soporta actualizaciones consistentes a nivel de página sin imponer un formato de datos
  • Es adecuado para impulsar aplicaciones móviles local-first, gestionar sincronización compleja entre plataformas y servir como columna vertebral de réplicas stateless en sistemas serverless o embebidos

49. groundcover

  • groundcover es una plataforma de observabilidad cloud-native que integra logs, trazas, métricas y eventos de Kubernetes en un solo panel
  • Aprovecha eBPF para capturar datos de observabilidad granulares con instrumentación de cero código, sin insertar agentes ni SDKs en el código de la aplicación
  • Los sensores eBPF de groundcover se ejecutan en nodos dedicados de cada clúster monitoreado, por lo que operan de forma independiente de las aplicaciones que observan
  • Entre sus funciones principales se incluyen visibilidad profunda a nivel de kernel, bring-your-own-cloud (BYOC) architecture para privacidad de datos y un modelo de precios independiente del volumen de datos que mantiene los costos predecibles

50. Karmada

  • Karmada ("Kubernetes Armada") es una plataforma para orquestar cargas de trabajo en múltiples clústeres de Kubernetes, nubes y centros de datos
  • Muchos equipos hoy combinan herramientas GitOps como Flux o ArgoCD con scripts personalizados para desplegar en todos los clústeres, así que una solución específica para este fin es bienvenida
  • Karmada aprovecha APIs nativas de Kubernetes, por lo que no requiere cambios en aplicaciones ya construidas para entornos cloud-native
  • Ofrece funciones avanzadas de scheduling para gestión multicloud, alta disponibilidad, recuperación ante desastres y programación de tráfico

51. OpenFeature

  • A medida que un negocio escala, la gestión de feature flags suele volverse cada vez más compleja, y los equipos necesitan una capa de abstracción que vaya más allá del simple feature toggle
  • OpenFeature proporciona esa capa mediante una especificación de API independiente del proveedor e impulsada por la comunidad que estandariza cómo se definen y consumen los feature flags
  • Su CLI ofrece un amplio soporte para múltiples definiciones de esquema, desde configuraciones básicas con variables de entorno o configuración en memoria hasta plataformas maduras como ConfigCat o LaunchDarkly
  • Sin embargo, queda una advertencia importante: los equipos deben gestionar por separado y con disciplina las distintas categories of flags para evitar la proliferación de flags, la complejidad de la aplicación y una sobrecarga excesiva de pruebas

52. Oxide

  • Construir y operar infraestructura privada es complejo, y esa es una de las principales razones por las que la nube pública es la opción predeterminada para la mayoría de las organizaciones
  • Pero para quienes lo necesitan, Oxide ofrece una alternativa que ensambla e integra hardware y software desde cero
  • Ofrece racks preconstruidos que incluyen cómputo, red y almacenamiento, ejecutando software de sistema totalmente integrado
  • Los equipos pueden gestionar recursos a través de la API IaaS de Oxide usando Terraform y otras herramientas de automatización; a esto Oxide lo llama infraestructura elástica on-premises

53. Restate

  • Restate es una plataforma de ejecución persistente diseñada para resolver los complejos desafíos de sistemas distribuidos al construir aplicaciones con estado y tolerantes a fallas
  • Mediante execution journaling registra cada paso para garantizar tolerancia a fallas, recuperación confiable y comunicación exactamente una vez entre servicios
  • La principal ventaja arquitectónica de la plataforma es que separa la lógica de la aplicación en tres tipos de servicios persistentes: Basic Services para funciones sin estado, Virtual Objects para modelar entidades concurrentes con estado y Workflows para orquestar procesos complejos de múltiples etapas
  • Se está evaluando cuidadosamente Restate en un sistema de seguros a gran escala y hasta ahora el desempeño ha sido muy satisfactorio

54. SkyPilot

  • SkyPilot es una plataforma open source para ejecutar y escalar cargas de trabajo de IA on-premises o en la nube
  • Desarrollado por Sky Computing Lab de UC Berkeley, SkyPilot actúa como un broker inteligente que encuentra y aprovisiona automáticamente las GPUs disponibles y más baratas en las principales nubes y clústeres de Kubernetes, lo que a menudo reduce los costos de cómputo
  • Para los equipos de infraestructura, simplifica la ejecución de IA en Kubernetes al ofrecer facilidad de uso similar a Slurm, solidez cloud-native y funciones como acceso SSH directo a pods, gang scheduling y soporte multiclúster
  • Admite el escalado fluido de cargas de trabajo de entrenamiento o inferencia

55. StarRocks

  • StarRocks es una base de datos analítica que redefine la inteligencia de negocios en tiempo real al combinar la velocidad de los sistemas OLAP tradicionales con la flexibilidad de los data lakehouses modernos
  • Logra latencias de consulta de menos de un segundo a gran escala mediante un motor de ejecución optimizado con SIMD, almacenamiento columnar y un sofisticado optimizador basado en costos
  • Esta arquitectura de alto rendimiento permite a los usuarios ejecutar análisis complejos directamente sobre formatos de datos abiertos como Apache Iceberg, sin precálculos ni copias de datos
  • Hay muchas plataformas en este espacio, pero se considera a StarRocks un fuerte candidato como solución rentable para escenarios que exigen concurrencia extrema y frescura de datos consistentemente actualizada

56. Uncloud

  • Uncloud es una herramienta ligera de orquestación y clustering de contenedores que permite a los desarrolladores llevar aplicaciones de Docker Compose a producción
  • Ofrece una experiencia simple y similar a la nube, sin la sobrecarga operativa de Kubernetes
  • Logra escalado entre máquinas y despliegues sin tiempo de inactividad al configurar automáticamente una red mesh segura con WireGuard para la comunicación y usar el proxy inverso Caddy para HTTPS automático y balanceo de carga
  • La principal ventaja arquitectónica de Uncloud es su diseño totalmente distribuido, que elimina la necesidad de un plano de control central y garantiza que el trabajo del clúster siga funcionando incluso si una máquina individual queda fuera de línea

[Tools]

Adopt

57. ClickHouse

  • ClickHouse es una base de datos open source distribuida, columnar y de procesamiento analítico en línea (OLAP) para analítica en tiempo real
  • Ha madurado como un motor sumamente potente y escalable capaz de manejar análisis de datos a gran escala
  • Sus vistas materializadas incrementales, motor de consultas eficiente y fuerte compresión de datos lo hacen ideal para consultas interactivas
  • Su soporte integrado para funciones de agregación aproximada permite equilibrar precisión y rendimiento, lo que resulta especialmente útil para análisis de alta cardinalidad

58. NeMo Guardrails

  • NeMo Guardrails es el toolkit open source de NVIDIA para añadir fácilmente mecanismos programables de seguridad y control a aplicaciones conversacionales basadas en LLM
  • Define y aplica reglas de comportamiento para garantizar que las salidas sean seguras, pertinentes y cumplan con las normativas
  • Los desarrolladores usan Colang, un lenguaje específico para este propósito, para crear flujos conversacionales flexibles, gestionar conversaciones y aplicar rutas y procedimientos operativos predefinidos
  • NeMo Guardrails ofrece una API async-first para rendimiento y soporte de guardrails para seguridad de contenido, seguridad general y alineación de entradas y salidas

59. pnpm

  • Desde el Radar anterior, el equipo ha seguido recibiendo comentarios positivos sobre pnpm
  • pnpm es un administrador de paquetes de Node.js que ofrece mejoras significativas de rendimiento frente a las alternativas, tanto en velocidad como en eficiencia del espacio en disco
  • Admite optimización incremental a nivel de archivos que enlaza por hard link los paquetes duplicados de las carpetas node_modules de varios proyectos en una sola ubicación en disco y mejora aún más el rendimiento
  • pnpm se ha convertido en la opción predeterminada para la gestión de paquetes de Node.js porque ofrece un ciclo de retroalimentación mucho más rápido con problemas mínimos de compatibilidad

60. Pydantic

  • Pydantic es una biblioteca de Python que usa type hints estándar para definir modelos de datos y aplicar esquemas de datos en tiempo de ejecución
  • Originalmente, las anotaciones de tipos se agregaron a Python para el análisis estático, pero su creciente versatilidad ha llevado a usos más amplios, incluida la validación en tiempo de ejecución
  • Está construido sobre un núcleo rápido en Rust, lo que ofrece validación, parsing y serialización de datos eficientes
  • Se ha vuelto esencial en aplicaciones de LLM y normalmente se usa con la técnica de structured output from LLMs para manejar la naturaleza impredecible de los LLM

Trial

61. AI Design Reviewer

  • AI Design Reviewer es un plugin de Figma para realizar auditorías de diseño o evaluaciones heurísticas y recopilar feedback accionable sobre diseños existentes o nuevos
  • Las auditorías abarcan críticas de UX, inconsistencias de UI, brechas de accesibilidad, calidad de contenido y escenarios de casos límite
  • Además de identificar problemas, ofrece recomendaciones conscientes del dominio que ayudan a los equipos a construir un vocabulario de diseño compartido y el fundamento detrás de las decisiones de diseño
  • El equipo ha usado AI Design Reviewer para analizar diseños legacy, identificando experiencias positivas que vale la pena conservar y experiencias negativas que deben resolverse, para informar los objetivos de UX de un rediseño

62. Barman

  • Barman (Backup and Recovery Manager) es una herramienta open source para gestionar respaldos y recuperación ante desastres de servidores PostgreSQL
  • Simplifica la creación de respaldos físicos mediante varios métodos, los organiza con un catálogo integral y soporta todo el proceso de recuperación ante desastres al restaurar respaldos en servidores en vivo con capacidades de recuperación a un punto en el tiempo
  • Descubrieron que Barman es potente y fácil de usar, y quedaron profundamente impresionados por la velocidad de las operaciones de recuperación a un punto en el tiempo durante actividades de migración
  • También es competente con respaldos programados y tiene la capacidad de manejar configuraciones complejas y mixtas de programación y retención

63. Claude Code

  • Claude Code de Anthropic es una herramienta de codificación con IA agente que ofrece una interfaz en lenguaje natural y un modelo de ejecución por agentes para planificar e implementar flujos de trabajo complejos de múltiples pasos
  • Aunque fue lanzado hace menos de un año, ya ha sido ampliamente adoptado por desarrolladores dentro y fuera de Thoughtworks, por lo que fue ubicado en Trial
  • Se han lanzado agentes de codificación basados en consola como Codex CLI de OpenAI, Gemini CLI de Google y el open source OpenCode, y asistentes basados en IDE como Cursor, Windsurf y GitHub Copilot ahora incluyen modo agente
  • Han visto que los equipos lo usan no solo para escribir y modificar código, sino también como un agente de IA de propósito general para gestionar especificaciones, historias, configuración, infraestructura y documentación

64. Cleanlab

  • En el paradigma de IA centrada en los datos, mejorar la calidad del dataset suele ofrecer mayores mejoras de rendimiento que ajustar el modelo en sí
  • Cleanlab es una biblioteca open source de Python diseñada para abordar este problema, identificando automáticamente problemas de datos comunes como etiquetado incorrecto, outliers y duplicados en datasets de texto, imágenes, tablas y audio
  • Construido sobre los principios de confident learning, Cleanlab aprovecha las probabilidades de predicción del modelo para estimar ruido en las etiquetas y cuantificar la calidad de los datos
  • Este enfoque independiente del modelo permite a los desarrolladores diagnosticar y corregir errores del dataset y luego reentrenar el modelo para lograr mayor robustez y precisión

65. Context7

  • Context7 es un servidor MCP que aborda las inexactitudes del código generado por IA
  • Mientras los LLM dependen de datos de entrenamiento desactualizados, Context7 asegura la generación de código preciso, actualizado y específico por versión para las bibliotecas y frameworks usados en el proyecto
  • Extrae documentación reciente y ejemplos de código funcional directamente de los repositorios fuente de los frameworks y los inyecta en la ventana de contexto del LLM en el momento del prompting
  • En su experiencia, Context7 reduce significativamente las alucinaciones de código y la dependencia de datos de entrenamiento desactualizados

66. Data Contract CLI

  • Data Contract CLI es una herramienta open source de línea de comandos diseñada para trabajar con la especificación Data Contract
  • Permite crear y editar contratos de datos y, de forma crucial, validar datos contra esos contratos, algo esencial para garantizar la integridad y calidad de los productos de datos
  • El CLI ofrece amplio soporte para múltiples definiciones de esquema (Avro, SQL DDL, Open Data Contract Standard, entre otras) y puede comparar distintas versiones de contratos para detectar de inmediato cambios importantes
  • Descubrieron que es especialmente útil para operacionalizar la gobernanza de contratos entre productos de datos mediante integración con CI/CD, particularmente en entornos de data mesh

67. Databricks Assistant

  • Databricks Assistant es una herramienta conversacional impulsada por IA e integrada directamente en la plataforma Databricks que actúa como programador en pareja contextual para profesionales de datos
  • A diferencia de los asistentes de codificación de propósito general, tiene la ventaja de una comprensión nativa del entorno y el contexto de datos de Databricks, incluido el metadata de Unity Catalog
  • El Assistant va más allá de generar snippets de código: puede escribir consultas complejas de SQL y Python de múltiples pasos, diagnosticar errores y ofrecer explicaciones detalladas y específicas del workspace
  • Para organizaciones que ya han invertido en el ecosistema de Databricks, puede acelerar la productividad y reducir la barrera de entrada para tareas de datos complejas

68. Hoppscotch

  • Hoppscotch es una herramienta open source ligera para desarrollo, depuración, pruebas y compartición de APIs
  • Soporta varios protocolos, incluidos HTTP, GraphQL y WebSocket, y ofrece clientes multiplataforma para web, escritorio y entornos CLI
  • Aunque el espacio de herramientas para APIs está saturado de alternativas como Postman, Insomnia y Bruno, Hoppscotch destaca por su huella ligera y su diseño amigable con la privacidad
  • Omite analítica, usa almacenamiento local-first y soporta self-hosting, por lo que es una opción sólida para organizaciones que buscan una manera intuitiva de compartir scripts de API mientras mantienen una fuerte privacidad de datos

69. NVIDIA DCGM Exporter

  • NVIDIA DCGM Exporter es una herramienta open source que ayuda a los equipos a monitorear entrenamiento distribuido con GPU a gran escala
  • Convierte la telemetría propietaria de NVIDIA Data Center GPU Manager (DCGM) a un formato abierto compatible con sistemas de monitoreo estándar
  • Expone métricas críticas en tiempo real tanto de las GPU como de los servidores host, como utilización de GPU, temperatura, energía y conteos de errores ECC
  • Esta visibilidad es esencial para organizaciones que ajustan finamente LLM personalizados o ejecutan trabajos de entrenamiento intensivos en GPU de larga duración

70. RelationalAI

  • Cuando grandes volúmenes de datos diversos se incorporan a Snowflake, las relaciones únicas y las reglas implícitas dentro de esos datos pueden volverse ambiguas
  • RelationalAI, construido como una Snowflake Native App, permite a los equipos crear modelos sofisticados que capturan conceptos significativos, definen entidades clave del negocio e incorporan lógica compleja directamente sobre tablas de Snowflake
  • Mediante un potente Graph Reasoner, los usuarios pueden generar, analizar y visualizar grafos de conocimiento relacional basados en estos modelos
  • Para organizaciones que gestionan conjuntos de datos grandes y que cambian con rapidez, construir grafos de conocimiento puede ser esencial para el monitoreo proactivo y para generar insights más ricos y accionables

71. UX Pilot

  • UX Pilot es una herramienta de IA que apoya varias etapas del proceso de diseño UX, desde wireframing hasta diseño visual de alta fidelidad y revisión
  • Acepta entradas de texto o imagen y puede generar automáticamente pantallas, flujos y layouts
  • La función Autoflow genera transiciones de flujo de usuario y Deep Design produce resultados más ricos y detallados
  • UX Pilot también incluye un plugin de Figma para exportar los diseños generados y refinarlos dentro de herramientas de diseño estándar

72. v0

  • v0 ha evolucionado desde que fue presentado por última vez en el Radar
  • Ahora incluye un modo de diseño que facilita a los product managers crear y ajustar prototipos de UI de autoservicio
  • La versión más reciente introduce un modelo propio con una gran ventana de contexto y capacidades multimodales, lo que permite a v0 generar y mejorar UI tanto a partir de entradas de texto como visuales
  • Otra incorporación destacable es el modo agente, que permite al sistema descomponer tareas más complejas y elegir el modelo adecuado para cada una

Assess

73. Augment Code

  • Augment Code es un asistente de programación con IA que ofrece soporte con profundo reconocimiento de contexto en codebases grandes
  • Destaca por su avanzado context engineering, que permite actualizaciones rápidas del índice de código y búsquedas veloces incluso cuando el código cambia con frecuencia
  • Augment soporta modelos como Claude Sonnet 4 y 4.5, así como GPT-5, se integra con GitHub, Jira y Confluence, y ofrece soporte para Model Context Protocol (MCP) para interoperabilidad con herramientas externas
  • Proporciona guía paso a paso para cambios complejos en codebases, desde refactorización y actualización de dependencias hasta actualizaciones de esquema

74. Azure AI Document Intelligence

  • Azure AI Document Intelligence (antes Form Recognizer) extrae texto, tablas y pares clave-valor de documentos no estructurados para convertirlos en datos estructurados
  • Usa modelos de deep learning preentrenados para interpretar el layout y el significado, y permite entrenar modelos personalizados para formatos especiales mediante una interfaz no-code
  • Uno de los equipos reportó que ADI redujo significativamente la captura manual de datos, mejoró la precisión de los datos y aceleró la generación de reportes, lo que llevó a una toma de decisiones basada en datos más rápida
  • Al igual que Amazon Textract y Google Document AI, ofrece procesamiento de documentos de nivel empresarial con una sólida comprensión del layout

75. Docling

  • Docling es una biblioteca open source de Python y TypeScript para procesamiento avanzado de documentos de datos no estructurados
  • Resuelve el a menudo ignorado problema de la “última milla” de convertir documentos reales, como PDF y PowerPoint, a formatos limpios y legibles por máquina
  • A diferencia de los extractores tradicionales, Docling usa un enfoque basado en visión por computadora para interpretar el layout del documento y su estructura semántica, lo que hace que su salida sea especialmente valiosa para pipelines de retrieval-augmented generation (RAG)
  • Convierte documentos complejos a formatos estructurados como JSON o Markdown, dando soporte a técnicas como structured output from LLMs

76. E2B

  • E2B es una herramienta open source para ejecutar código generado por IA en sandboxes seguros y aislados en la nube
  • Los agentes pueden usar estos sandboxes, construidos sobre microVM de Firecracker, para ejecutar código de forma segura, analizar datos, realizar investigación u operar máquinas virtuales
  • Esto permite construir y desplegar agentes de IA de nivel empresarial con control total sobre el entorno de ejecución y con seguridad

77. Helix editor

  • Ha habido cierto resurgimiento de editores de texto simples que buscan reemplazar al favorito de línea de comandos, Vim
  • Helix es uno de los competidores en este espacio concurrido, junto con Neovim y el más reciente Kakoune
  • Describiéndose con algo de humor como un editor de texto posmoderno, Helix ofrece múltiples cursores, soporte para Tree-sitter y soporte integrado para Language Server Protocol (LSP), que fue lo que inicialmente llamó nuestra atención
  • Está en desarrollo activo con un sistema de plugins en progreso y, en general, se siente familiar para usuarios de Vim, pero añade algunas comodidades modernas como editor modal ligero

78. Kueue

  • Kueue es un controlador nativo de Kubernetes para colas de trabajos que gestionan cuotas y consumo de recursos
  • Proporciona una API para manejar workloads de Kubernetes con distintas prioridades y requisitos de recursos, y funciona como un administrador a nivel de job que decide cuándo admitir o remover trabajos
  • Diseñado para gestión eficiente de recursos, priorización de trabajos y scheduling avanzado, Kueue ayuda a optimizar la ejecución de workloads en entornos Kubernetes, especialmente para workloads de ML que usan herramientas como Kubeflow
  • En lugar de reemplazar cluster-autoscaler y kube-scheduler, trabaja junto a ellos y se enfoca en la admisión de trabajos basada en orden, cuota, prioridad y conciencia de topología

79. MCPScan.ai

  • MCPScan.ai es un escáner de seguridad para servidores de Model Context Protocol (MCP) que opera en dos modos: escaneo y proxy
  • En modo de escaneo, analiza configuraciones y descripciones de herramientas para detectar vulnerabilidades conocidas como prompt injection, tool poisoning y toxic flows
  • En modo proxy, MCPScan.ai actúa como puente entre el sistema de agentes y el servidor MCP, monitoreando continuamente el tráfico en tiempo de ejecución
  • Este modo también aplica reglas de seguridad y guardrails personalizados, incluida la validación de llamadas a herramientas, detección de PII y restricciones de flujo de datos

80. oRPC

  • oRPC (OpenAPI Remote Procedure Call) ofrece APIs con seguridad de tipos de extremo a extremo en TypeScript mientras cumple por completo con la especificación OpenAPI
  • Puede generar automáticamente una especificación OpenAPI completa para simplificar la integración y la documentación
  • Mientras alternativas como tRPC y ElysiaJS a menudo requieren adoptar nuevos frameworks para obtener seguridad de tipos, oRPC se integra sin fricción con frameworks existentes de Node.js, incluidos Express, Fastify, Hono, Next.js
  • Esta flexibilidad lo convierte en una excelente opción para equipos que buscan adoptar seguridad de tipos de extremo a extremo en APIs existentes sin una refactorización disruptiva

81. Power user for dbt

  • Power user for dbt es una extensión para Visual Studio Code que se integra directamente tanto con entornos de dbt como de dbt Cloud
  • Como dbt sigue siendo una de nuestras herramientas favoritas, cualquier mejora en usabilidad es una adición bienvenida para el ecosistema
  • Antes, los desarrolladores dependían de varias herramientas fuera del IDE para validar código SQL o inspeccionar el linaje de modelos
  • Con esta extensión, esas funciones ahora están integradas en VS Code, con autocompletado de código, resultados de consultas en tiempo real y linaje visual de modelos y columnas

82. Serena

  • Serena es un potente toolkit de programación que brinda a agentes de código como Claude Code capacidades similares a un IDE para búsqueda y edición semántica de código
  • Al trabajar a nivel de símbolos y comprender la estructura relacional del código, Serena mejora significativamente la eficiencia de tokens
  • En lugar de leer archivos completos o depender de reemplazos de cadenas imprecisos, los agentes de código pueden usar herramientas precisas de Serena como find_symbol, find_referencing_symbols e insert_after_symbol para localizar y editar código
  • En proyectos pequeños el impacto es menor, pero a medida que crece la base de código, esta eficiencia se vuelve muy valiosa

83. SweetPad

  • La extensión SweetPad permite a los desarrolladores usar VS Code o Cursor durante todo el ciclo de vida de desarrollo de aplicaciones Swift en plataformas de Apple
  • Integra herramientas esenciales como xcodebuild, xcode-build-server y swift-format, eliminando la necesidad de cambiar constantemente a Xcode
  • Los desarrolladores pueden administrar simuladores y desplegar en dispositivos, además de compilar, ejecutar y depurar aplicaciones Swift para iOS, macOS y watchOS directamente desde el IDE sin abrir Xcode

84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)

  • Tape/Z (Tools for Assembly Program Exploration for Z/OS) es un toolkit en evolución para analizar código HLASM (High-Level Assembler) de mainframe
  • Fue desarrollado por Thoughtworker y ofrece funciones como parsing, construcción de grafos de flujo de control, seguimiento de dependencias y visualización de diagramas de flujo
  • Durante mucho tiempo hemos señalado la escasez de herramientas abiertas y guiadas por la comunidad en el espacio mainframe, donde la mayoría de las opciones son propietarias o están ligadas a ecosistemas de proveedores
  • Tape/Z ayuda a cerrar esa brecha al ofrecer capacidades de análisis accesibles y scriptables

[Languages and Frameworks]

Adopt

85. Fastify

  • Seguimos teniendo una experiencia positiva con Fastify, un framework web rápido, poco opinado y de bajo overhead para Node.js
  • Proporciona todas las funciones esenciales de un framework web minimalista, incluido parsing, validación y serialización, junto con un sólido sistema de plugins y fuerte apoyo de la comunidad
  • Los equipos no vieron desventajas importantes al usar Fastify frente a alternativas como Express.js, y además obtuvieron mejoras de rendimiento medibles, por lo que es una opción atractiva para el desarrollo web minimalista en Node.js

86. LangGraph

  • LangGraph es un framework de orquestación para construir aplicaciones multiagente con estado usando LLM
  • Ofrece primitivas de bajo nivel como nodos y aristas, junto con funciones integradas que dan a los desarrolladores control detallado sobre flujos de trabajo de agentes, gestión de memoria y persistencia de estado
  • Esto significa que los desarrolladores pueden comenzar con grafos simples preconstruidos y escalar hacia arquitecturas de agentes complejas y en evolución
  • Con soporte para patrones de resiliencia como streaming, gestión avanzada de contexto, fallback de modelos y manejo de errores de herramientas, LangGraph permite construir aplicaciones de agentes robustas y listas para producción

87. vLLM

  • vLLM es un motor de inferencia para LLM de alto rendimiento y eficiencia de memoria que puede ejecutarse en la nube o on-premises
  • Es compatible con múltiples arquitecturas de modelos y modelos open source populares
  • Los equipos desplegaron workers dockerized de vLLM en plataformas GPU como NVIDIA DGX e Intel HPC para alojar modelos como Llama 3.1 (8B y 70B), Mistral 7B y Llama-SQL para asistencia de programación a desarrolladores, recuperación de conocimiento e interacción con bases de datos en lenguaje natural
  • vLLM es compatible con el estándar OpenAI SDK, lo que permite servir modelos de forma consistente

Trial

88. Crossplane

  • Desde su última aparición en el Radar, la adopción de Crossplane ha seguido creciendo, especialmente para extender clústeres de Kubernetes
  • En la práctica, descubrimos que Crossplane destaca en casos de uso específicos en lugar de ser una herramienta de infraestructura como código (IaC) de propósito general
  • La observación anterior sigue vigente: Crossplane funciona mejor como acompañante de cargas de trabajo desplegadas dentro de Kubernetes y no como reemplazo completo de herramientas como Terraform
  • Los equipos que hicieron "all-in" con Crossplane como solución principal de IaC a menudo enfrentaron dificultades, mientras que quienes lo usaron de forma pragmática, para casos de uso personalizados y dirigidos, vieron resultados sólidos

89. DeepEval

  • DeepEval es un framework de evaluación open source basado en Python para medir el rendimiento de LLM
  • Puede usarse para evaluar retrieval-augmented generation (RAG) y otras aplicaciones construidas con LlamaIndex o LangChain, así como para líneas base y benchmarks de modelos
  • DeepEval evalúa exactitud, relevancia y consistencia para ofrecer valoraciones más confiables en escenarios reales, más allá de métricas de coincidencia de palabras
  • Incluye métricas como detección de alucinaciones, relevancia de respuestas y optimización de hiperparámetros, y admite GEval para crear métricas personalizadas según cada caso de uso

90. FastMCP

  • Model Context Protocol (MCP) se está consolidando rápidamente como un estándar para proporcionar contexto y herramientas a las aplicaciones con LLM
  • Sin embargo, implementar servidores MCP por lo general incluye una cantidad considerable de código repetitivo para configuración, manejo del protocolo y gestión de errores
  • FastMCP es un framework de Python que simplifica este proceso al abstraer la complejidad del protocolo y permitir que los desarrolladores definan recursos y herramientas MCP mediante decoradores intuitivos de Python
  • Esta abstracción permite que los equipos se enfoquen en la lógica de negocio, lo que da lugar a implementaciones MCP más limpias y fáciles de mantener

91. LiteLLM

  • LiteLLM es un SDK que ofrece integración fluida con múltiples proveedores de LLM a través de un formato de API estandarizado de OpenAI
  • Soporta una amplia variedad de proveedores y modelos, y ofrece una interfaz unificada para completado de texto, embeddings y generación de imágenes
  • Al abstraer las diferencias entre las APIs de cada proveedor, LiteLLM simplifica la integración y enruta automáticamente las solicitudes al endpoint de modelo correcto
  • A través de su framework proxy, también incluye capacidades de nivel de producción como guardrails, caché, logging, limitación de tasa y balanceo de carga

92. MLForecast

  • MLForecast es un framework y biblioteca de Python para pronóstico de series temporales que aplica modelos de machine learning a conjuntos de datos a gran escala
  • Simplifica el proceso, normalmente complejo, de ingeniería de características automatizada, incluyendo lags, estadísticas móviles y funciones basadas en fechas
  • Es una de las pocas bibliotecas con soporte nativo para frameworks de cómputo distribuido como Spark y Dask, lo que garantiza escalabilidad
  • También soporta pronóstico probabilístico usando métodos como conformal prediction, proporcionando medidas cuantitativas de la incertidumbre en las predicciones

93. Nuxt

  • Nuxt es un meta framework opinado construido sobre Vue.js para crear aplicaciones web full-stack, y a menudo se le conoce como el “Next.js para Vue.js”
  • Al igual que su contraparte en React, Nuxt ofrece funciones favorables para SEO como prerenderizado, renderizado del lado del servidor (SSR) y gestión de metadatos
  • Nuxt cuenta con el respaldo de Vercel, la misma empresa detrás de Next.js, y con el apoyo de una comunidad sólida y un ecosistema de módulos oficiales y de terceros
  • Estos módulos simplifican la integración de funciones como procesamiento de imágenes, sitemap y Tailwind CSS

94. Phoenix

  • Siguen teniendo experiencias positivas con Phoenix, un framework web MVC del lado del servidor escrito en Elixir
  • Phoenix se basa en el aprendizaje de Ruby on Rails sobre desarrollo rápido de aplicaciones y experiencia del desarrollador, al tiempo que evoluciona con un paradigma de programación funcional
  • En este volumen destacan el lanzamiento de Phoenix LiveView 1.0
  • LiveView es una solución HTML-over-the-wire similar a HTMX o Hotwire, que permite a los desarrolladores crear experiencias de usuario ricas y en tiempo real con HTML completamente renderizado en el servidor

95. Presidio

  • Presidio es un SDK de protección de datos para identificar y anonimizar datos sensibles en texto estructurado y no estructurado
  • Usa reconocimiento de entidades nombradas, expresiones regulares y lógica basada en reglas para detectar información de identificación personal (PII), como números de tarjeta de crédito, nombres y ubicaciones
  • Presidio soporta reconocedores de entidades personalizados y pipelines de anonimización, para que las organizaciones puedan ajustarlo a sus propios requisitos de privacidad y cumplimiento
  • El equipo usa Presidio al integrarlo con LLM en entornos empresariales con controles estrictos sobre el intercambio de datos

96. Pydantic AI

  • Pydantic AI sigue demostrando ser un framework open source estable y bien respaldado para construir agentes de GenAI en producción
  • Construido sobre la base confiable de Pydantic, ofrece una sólida seguridad de tipos, visibilidad de primera clase mediante OpenTelemetry y herramientas integradas de evaluación
  • El lanzamiento de la versión 1.0, el 4 de septiembre de 2025, marca un hito importante en su madurez
  • Desde entonces se ha vuelto confiable y ampliamente adoptado por su simplicidad y mantenibilidad, sumándose a la fila de otros frameworks populares de agentes como LangChain y LangGraph

97. Tauri

  • Tauri es un framework para construir aplicaciones de escritorio de alto rendimiento usando una sola base de código de UI web
  • A diferencia de wrappers web tradicionales como Electron, Tauri está construido sobre Rust y aprovecha el webview nativo del sistema operativo para ofrecer binarios más pequeños y mayor seguridad
  • Evaluaron Tauri por primera vez hace algunos años y desde entonces se ha expandido más allá del escritorio con soporte para iOS y Android
  • La versión más reciente incorpora un modelo más flexible de permisos y alcances, reemplaza la lista anterior de permisos y cuenta con una capa mejorada de comunicación entre procesos (IPC) que soporta transferencia de datos en bruto y mejora el rendimiento

Assess

98. Agent Development Kit (ADK)

  • Agent Development Kit (ADK) es un framework para desarrollar y desplegar agentes de IA que aplica disciplinas modernas de ingeniería de software en lugar de depender únicamente del prompting
  • Introduce abstracciones familiares como clases, métodos, patrones de workflow y soporte de CLI
  • En comparación con frameworks como LangGraph o CrewAI, la fortaleza de ADK está en su integración profunda con la infraestructura de IA de Google, ofreciendo grounding listo para empresa, acceso a datos y monitoreo
  • Está diseñado para la interoperabilidad y soporta el A2A protocol para wrappers de herramientas y comunicación entre agentes

99. Agno

  • Agno es un framework para construir, ejecutar y administrar sistemas multiagente
  • Ofrece la flexibilidad de crear agentes completamente autónomos o workflows controlados basados en pasos, e incluye soporte integrado para human-in-the-loop, gestión de sesiones, memoria y conocimiento
  • Valoran mucho su enfoque en la eficiencia, con tiempos de arranque de agentes impresionantes y bajo consumo de memoria
  • Agno viene con su propio runtime, AgentOS, una aplicación FastAPI con un plano de control unificado para pruebas, monitoreo y administración simplificados de sistemas de agentes

100. assistant-ui

  • assistant-ui es una biblioteca open source de TypeScript y React para interfaces de chat con IA
  • Maneja las partes complejas de implementar una UI de chat, como streaming, gestión de estado y funciones de UX comunes para edición de mensajes y cambio entre ramas, mientras permite a los desarrolladores diseñar sus propios componentes usando primitivas de Radix
  • Soporta integración con runtimes populares, incluyendo Vercel AI SDK y LangGraph, y ofrece soluciones de runtime personalizables para casos de uso complejos
  • Han construido con éxito una interfaz de chat simple con assistant-ui y están satisfechos con el resultado

101. AutoRound

  • AutoRound de Intel es un algoritmo avanzado de cuantización para comprimir modelos de IA de gran tamaño, como LLM y vision language models (VLM), minimizando la pérdida de precisión
  • Usa optimización sign-gradient descent para reducir el tamaño del modelo a anchos de bit ultrabajos (2-4 bits) y aplica anchos de bit mixtos en todas las capas para lograr una eficiencia óptima
  • Este proceso de cuantización también es muy rápido: puede cuantizar un modelo de 7 mil millones de parámetros en unos minutos con una sola GPU
  • AutoRound se integra con motores de inferencia populares como vLLM y Transformers, lo que lo convierte en una opción atractiva para la cuantización de modelos

102. Browser Use

  • Browser Use es una librería open source de Python que permite a agentes basados en LLM operar navegadores web e interactuar con aplicaciones web
  • Puede navegar, ingresar datos y extraer texto, y también administrar múltiples pestañas para coordinar tareas entre aplicaciones
  • La librería es especialmente útil cuando los agentes de IA necesitan acceder, manipular o recuperar información desde contenido web
  • Soporta varios LLM y aprovecha Playwright para combinar comprensión visual con extracción de estructura HTML y así lograr interacciones web más ricas

103. DeepSpeed

  • DeepSpeed es una librería de Python que optimiza el deep learning distribuido tanto para entrenamiento como para inferencia
  • Para entrenamiento, integra técnicas como Zero Redundancy Optimizer (ZeRO) y paralelismo 3D para escalar modelos eficientemente en miles de GPU
  • Para inferencia, combina paralelismo de tensor, pipeline, expertos y ZeRO con kernels personalizados y optimizaciones de comunicación para minimizar la latencia
  • DeepSpeed impulsa algunos de los modelos de lenguaje más grandes del mundo, incluidos Megatron-Turing NLG (530B) y BLOOM (176B)

104. Drizzle

  • Drizzle es un ORM ligero para TypeScript
  • A diferencia de Prisma ORM, ofrece a los desarrolladores tanto una API simple similar a SQL como una interfaz de consultas de estilo ORM más tradicional
  • También soporta extraer el esquema desde bases de datos existentes, lo que permite enfoques tanto database-first como code-first
  • Drizzle fue diseñado pensando en entornos serverless, tiene un tamaño de bundle pequeño y soporte para prepared statements

105. Java post-quantum cryptography

  • Las computadoras cuánticas siguen avanzando rápidamente, y ofertas SaaS como AWS Braket ahora dan acceso a algoritmos cuánticos en múltiples arquitecturas
  • Desde marzo, Java 24 introdujo Java post-quantum cryptography, sumando soporte para algoritmos de criptografía poscuántica como ML-KEM y ML-DSA
  • .Net 10 también amplía ese soporte
  • La recomendación es simple: si construyes software en estos lenguajes, empieza desde ahora a adoptar algoritmos resistentes a la computación cuántica para preparar tus sistemas para el futuro

106. kagent

  • Kagent es un framework open source para ejecutar IA basada en agentes dentro de clústeres de Kubernetes
  • Permite que agentes basados en LLM planifiquen y ejecuten tareas operativas, como diagnosticar problemas, modificar configuraciones e interactuar con herramientas de observabilidad, mediante APIs nativas de Kubernetes e integración con Model Context Protocol (MCP)
  • El objetivo es llevar "AgentOps" a la infraestructura cloud native combinando gestión declarativa con razonamiento autónomo
  • Como proyecto Sandbox de la CNCF, Kagent debe adoptarse con cuidado, especialmente considerando los riesgos de otorgar capacidades de gestión operativa a un LLM, y técnicas como toxic flow analysis pueden ser especialmente valiosas para evaluar y mitigar esos riesgos

107. LangExtract

  • LangExtract es una librería de Python que usa LLM para extraer información estructurada de texto no estructurado según instrucciones personalizadas
  • Procesa materiales específicos de dominio, como notas clínicas e informes, para identificar y organizar detalles clave, manteniendo la trazabilidad de cada dato extraído hasta su fuente
  • Las entidades extraídas pueden exportarse a archivos .jsonl (un formato estándar para datos de modelos de lenguaje) y visualizarse mediante una interfaz HTML interactiva para revisar el contexto
  • El equipo evaluó LangExtract para extraer entidades y poblar grafos de conocimiento de dominio, y encontró que es eficaz para transformar documentos complejos en representaciones estructuradas y legibles por máquina

108. Langflow

  • Langflow es una plataforma open source de low-code para construir y visualizar flujos de trabajo con LLM
  • Construida sobre LangChain, permite a los desarrolladores encadenar prompts, herramientas, bases de datos vectoriales y componentes de memoria mediante una interfaz de arrastrar y soltar, al tiempo que soporta código Python personalizado para lógica avanzada
  • Es especialmente útil para prototipar aplicaciones de agentes sin escribir código completo de backend
  • Sin embargo, Langflow sigue siendo relativamente nueva y aún tiene algunas asperezas para uso en producción, además de que aquí también aplican las precauciones habituales sobre las plataformas low-code

109. LMCache

  • LMCache es una solución de caché clave-valor (KV) para acelerar infraestructura de serving de LLM
  • Actúa como una capa de caché especializada a lo largo de todo un pool de motores de inferencia de LLM, almacenando entradas de caché KV precalculadas para texto que probablemente se procese varias veces, como historiales de chat o colecciones de documentos
  • Al mantener estos valores en disco, descarga de la GPU los cálculos de prefill para reducir el time-to-first-token (TTFT) y bajar los costos de inferencia en cargas de trabajo exigentes, como pipelines RAG, aplicaciones de chat multi-turno y sistemas de agentes
  • Es posible integrar LMCache con servidores de inferencia importantes como vLLM o NVIDIA Dynamo, y vale la pena evaluar su impacto en la configuración

110. Mem0

  • Mem0 es una capa de memoria diseñada para agentes de IA
  • Los enfoques ingenuos suelen guardar todo el historial de chat en una base de datos y reutilizarlo en conversaciones futuras, lo que lleva a un uso excesivo de tokens
  • Mem0 reemplaza esto con una arquitectura más sofisticada que separa la memoria en recuperación de corto plazo y una capa inteligente de largo plazo que solo extrae y almacena hechos y relaciones destacados
  • La arquitectura combina un almacén vectorial para similitud semántica con un grafo de conocimiento para comprender datos temporales y relacionales

111. Open Security Control Assessment Language (OSCAL)

  • Open Security Controls Assessment Language (OSCAL) es un formato abierto e interpretable por máquinas para el intercambio de información, diseñado para aumentar la automatización en cumplimiento y gestión de riesgos, y ayudar a los equipos a alejarse de enfoques manuales basados en texto
  • Liderado por el Instituto Nacional de Estándares y Tecnología de EE. UU. (NIST), OSCAL ofrece representaciones estándar en XML, JSON y YAML para expresar controles de seguridad relacionados con marcos de la industria como SOC 2 y PCI, así como marcos gubernamentales como FedRAMP de EE. UU., Cybersecurity Control Catalogue de Singapur e Information Security Manual de Australia
  • Aunque OSCAL aún no ha sido ampliamente adoptado fuera del sector público y su ecosistema sigue madurando, entusiasma su potencial para simplificar las evaluaciones de seguridad, reducir la dependencia de hojas de cálculo y ejercicios de marcar casillas, y permitir el cumplimiento automatizado cuando se integra en plataformas de compliance-as-code y continuous compliance

112. OpenInference

  • OpenInference complementa OpenTelemetry con un conjunto de convenciones y plugins diseñados para observar aplicaciones de IA
  • Proporciona instrumentación estandarizada para frameworks y bibliotecas de aprendizaje automático, ayudando a los desarrolladores a rastrear llamadas a LLM junto con el contexto circundante, como búsquedas en almacenes vectoriales o llamadas a herramientas externas sobre API y motores de búsqueda
  • Los spans pueden exportarse a cualquier recolector compatible con OTEL, lo que garantiza alineación con los pipelines de telemetría existentes
  • Anteriormente destacamos Langfuse como una plataforma de visibilidad para LLM de uso general, y el OpenInference SDK puede registrar trazas en Langfuse y otras plataformas de visibilidad compatibles con OpenTelemetry

113. Valibot

  • Valibot es una biblioteca de validación de esquemas para TypeScript
  • Como otras bibliotecas populares de validación para TypeScript, como Zod y Ajv, ofrece inferencia de tipos, pero se diferencia por su diseño modular
  • Esta arquitectura permite que los bundlers realicen tree shaking y code splitting de forma efectiva, incluyendo solo las funciones de validación que realmente se usan
  • Valibot puede reducir el tamaño del bundle hasta en un 95% frente a Zod en escenarios óptimos, lo que la convierte en una opción atractiva para validación de esquemas en entornos donde el tamaño del bundle es importante, como validación del lado del cliente o funciones serverless

114. Vercel AI SDK

  • Vercel AI SDK es un toolkit open source full-stack para crear aplicaciones y agentes impulsados por IA en el ecosistema TypeScript
  • Consta de dos componentes principales: AI SDK Core estandariza las llamadas a LLM de forma independiente del modelo, con soporte para generación de texto, generación de objetos estructurados y llamadas a herramientas
  • AI SDK UI, de forma similar a assistant-ui, simplifica el desarrollo frontend en React, Vue, Next.js y Svelte con streaming, gestión de estado y actualizaciones de UI en tiempo real
  • Para equipos que ya trabajan dentro del ecosistema de TypeScript y Next.js, Vercel AI SDK ofrece una forma rápida y fluida de crear aplicaciones de IA con experiencias ricas del lado del cliente

Aún no hay comentarios.

Aún no hay comentarios.