Publicado Thoughtworks Technology Radar, Volumen 33

(thoughtworks.com)

15 puntos por GN⁺ 2025-11-07 | Aún no hay comentarios. | Compartir por WhatsApp

Visualiza y explica las tendencias más recientes en las áreas de técnicas/herramientas/plataformas/lenguajes y frameworks de desarrollo en cuatro etapas: Adopt (recomendado para adopción), Trial (uso de prueba), Assess (evaluación) y Hold (precaución)
4 temas principales: orquestación de infraestructura para IA, auge de los agentes basados en MCP, flujos de trabajo de codificación con IA y aparición de antipatrones de IA

Introducción de orquestación de infraestructura en IA

Las cargas de trabajo de IA están obligando a las organizaciones a contar con orquestación de grandes flotas de GPU para entrenamiento e inferencia
- A medida que aumentan los modelos grandes que superan el límite de capacidad HBM (80 GB) de una sola GPU, el entrenamiento distribuido y la inferencia multi-GPU se vuelven indispensables
- Los equipos de plataforma construyen pipelines complejos de múltiples etapas y ajustan continuamente el rendimiento y la latencia
- Realizan telemetría remota de la flota con Nvidia DCGM Exporter y colocan trabajos en ubicaciones con el mayor ancho de banda de interconexión mediante topology-aware scheduling
Kubernetes sigue siendo la base clave para gestionar cargas de trabajo de IA a gran escala, pero también están ganando atención plataformas alternativas como microVM (Firecracker) y Uncloud
- Siguen evolucionando estrategias de ubicación que consideran la comunicación rápida entre enlaces de GPU, como la gestión de colas y cuotas con Kueue, topology-aware scheduling y gang scheduling
- Ubicación de trabajos multi-GPU dentro de "islas" continuas de centro de datos (racks o pods) con enlaces rápidos entre GPU como NVLink/NVSwitch y RDMA
Las recientes mejoras de API con reconocimiento de multi-GPU y NUMA en Kubernetes fortalecen estas capacidades, aumentando el ancho de banda entre dispositivos, reduciendo la tail latency y mejorando la tasa efectiva de utilización
- Con el aumento de la demanda de flujos de trabajo de codificación con IA y el auge de agentes mejorados con MCP, se espera una rápida innovación en la infraestructura de IA
- La orquestación con reconocimiento de GPU se está convirtiendo en un requisito básico y la topología ahora está surgiendo como una consideración de primer nivel para la planificación

Auge de los agentes basados en MCP

El auge simultáneo de MCP y los agentes, junto con la expansión del ecosistema de protocolos y herramientas construido en torno a ellos, es uno de los temas clave de este Radar
- MCP se está consolidando como el protocolo de integración definitivo para habilitar agentes y permitir una operación eficiente y semiautónoma
Casi todos los grandes proveedores están añadiendo soporte para MCP, y los flujos de trabajo centrados en agentes están creciendo rápidamente
Se observa innovación continua en los flujos de trabajo de agentes, y la ingeniería de contexto está emergiendo como clave para optimizar el comportamiento del modelo y la eficiencia en el uso de recursos
- Nuevos protocolos como A2A (Agent-to-Agent) y AG-UI reducen la complejidad de crear aplicaciones colaborativas con múltiples agentes
- Tecnologías como AGENTS.md, Anchoring coding agents y Context7 MCP server están siendo adoptadas en flujos de trabajo reales de desarrollo
Por la naturaleza del ecosistema de IA, en cada Radar aparecen nuevas innovaciones de forma explosiva
— la vez pasada fue RAG, y esta vez son los flujos de trabajo de agentes y la creciente constelación de herramientas, técnicas y plataformas que los respaldan
- Y también están apareciendo algunos antipatrones de IA dignos de atención

Flujos de trabajo de codificación con IA

La IA está transformando la manera de construir y mantener software, y es el tema dominante en las discusiones recientes
- Desde el uso de IA para comprender bases de código heredadas hasta GenAI para ingeniería forward, se está integrando estratégicamente en toda la cadena de valor del software
- Se está aprendiendo a suministrar conocimiento de forma más efectiva a los agentes de codificación
Los equipos están experimentando con nuevas prácticas, como definir instrucciones personalizadas mediante archivos AGENTS.md e integrarse con servidores MCP como Context7 para traer documentación actualizada de dependencias
- Crece la percepción de que la IA no solo debe potenciar a contribuyentes individuales, sino también amplificar a todo el equipo
- Están surgiendo instrucciones compartidas curadas y comandos personalizados para asegurar una difusión equitativa del conocimiento
El entorno de herramientas está evolucionando con dinamismo:
- Los diseñadores usan UX Pilot y AI Design Reviewer, y los desarrolladores crean prototipos rápidamente con self-service UI prototyping mediante v0 y Bolt
- Continúa el debate sobre el alcance del desarrollo basado en especificaciones, el nivel de granularidad y si puede servir como una única fuente de verdad para la entrega incremental
- Pese al entusiasmo, la complacencia frente al código generado por IA sigue siendo una preocupación común, lo que recuerda que la IA puede acelerar la ingeniería, pero el juicio humano sigue siendo indispensable

Aparición de nuevos antipatrones de IA

A medida que se acelera la adopción de IA en toda la industria, también están saliendo a la superficie antipatrones emergentes junto con prácticas efectivas
- Aunque se reconoce la utilidad clara de conceptos como el self-service disposable UI prototyping con GenAI, también se identifica su potencial para llevar a las organizaciones al antipatrón de Shadow IT acelerado por IA
- A medida que MCP (Model Context Protocol) gana atención, muchos equipos están cayendo en el antipatrón de conversión ingenua de API a MCP
La efectividad de las soluciones de Text-to-SQL no está cumpliendo las expectativas iniciales, y la complacencia frente al código generado por IA sigue siendo una preocupación vigente
- Incluso dentro de prácticas emergentes como el desarrollo basado en especificaciones, existe el riesgo de recaer en antipatrones tradicionales de ingeniería de software
  — en particular, la especificación excesiva por adelantado y el sesgo hacia lanzamientos big bang
GenAI está avanzando a una velocidad y escala sin precedentes, por lo que se espera que surjan rápidamente nuevos antipatrones
- Los equipos deben mantenerse alerta ante patrones que al principio parecen efectivos, pero con el tiempo degradan el desempeño, retrasan la retroalimentación, perjudican la adaptabilidad o vuelven difusa la responsabilidad

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

1. Continuous compliance

Práctica que garantiza que los procesos y tecnologías de desarrollo de software cumplan continuamente con normas regulatorias y estándares de seguridad mediante automatización
Integra herramientas de policy-as-code como Open Policy Agent y genera SBOM dentro del pipeline de CD para detectar y resolver problemas de cumplimiento desde etapas tempranas conforme a las guías de SLSA
Al codificar reglas y buenas prácticas, se pueden imponer estándares de forma consistente en todo el equipo sin generar cuellos de botella
Con el aumento del riesgo de complacencia frente al código generado por IA, integrar el cumplimiento dentro del proceso de desarrollo es más importante que nunca

2. Curated shared instructions for software teams

Para los equipos que usan activamente IA en la entrega de software, se está pasando del prompting individual a instrucciones curadas
La forma más intuitiva de implementarlo es hacer commit directamente en el repositorio del proyecto de archivos de instrucciones como AGENTS.md
La mayoría de las herramientas de codificación con IA, como Cursor, Windsurf y Claude Code, admiten compartir instrucciones mediante comandos slash personalizados o flujos de trabajo
En cuanto se mejoran los prompts, todo el equipo se beneficia de inmediato, garantizando acceso consistente a las mejores instrucciones de IA

3. Pre-commit hooks

Los Git hooks existen desde hace mucho tiempo, pero siguen sin aprovecharse lo suficiente
Con el auge de la asistencia de IA y la codificación con agentes, aumenta el riesgo de hacer commit por accidente de secretos o código problemático
Aunque hay muchos mecanismos de verificación de código como continuous integration, los hooks de pre-commit son una barrera de seguridad simple y efectiva que más equipos deberían adoptar
Lo mejor es mantenerlos mínimos y enfocados, concentrándose en riesgos que se detectan con mayor eficacia en esta etapa del flujo de trabajo, como el escaneo de secretos

4. Uso de GenAI para entender codebases legacy

El uso de GenAI para entender codebases legacy acelera significativamente la comprensión de sistemas complejos a gran escala
Herramientas como Cursor, Claude Code, Copilot, Windsurf, Aider, Cody, Swimm, Unblocked, PocketFlow-Tutorial-Codebase-Knowledge ayudan a hacer visibles las reglas de negocio, resumir la lógica e identificar dependencias
Cuando se usan junto con frameworks abiertos y prompting directo a LLM, reducen de forma drástica el tiempo necesario para comprender codebases legacy
El esfuerzo de configuración de enfoques avanzados como GraphRAG varía, especialmente según el tamaño y la complejidad del codebase analizado, pero su impacto en la productividad es consistente y considerable

Trial

5. AGENTS.md

Un formato común para proporcionar instrucciones a agentes de codificación con IA que trabajan en un proyecto
Es, en esencia, un archivo README para agentes, y no tiene campos obligatorios ni formato más allá de Markdown
Depende de la capacidad de los agentes de codificación basados en LLM para interpretar instrucciones escritas y legibles por humanos
Es común incluir consejos para usar herramientas del entorno de codificación, instrucciones de pruebas y prácticas preferidas para la gestión de commits

6. IA para migraciones de código

Las migraciones de código adoptan muchas formas, desde reescrituras de lenguaje hasta actualizaciones de dependencias o frameworks, y a menudo requieren meses de trabajo manual
Equipos de actualización de versiones de .NET framework están experimentando con IA para acortar el proceso
En el pasado se usaron herramientas deterministas de refactorización basadas en reglas como OpenRewrite; usar solo IA puede ser costoso y hacer que la conversación se desvíe con facilidad
En lugar de delegar toda la actualización, el proceso se descompone en pasos más pequeños y verificables, como análisis de errores de compilación, generación de diffs de migración y validación iterativa de pruebas
Casos de la industria como la migración a gran escala de Google de int32 a int64 también reflejan una tendencia similar

7. Delta Lake liquid clustering

Una técnica para tablas de Delta Lake que funciona como alternativa a partitioning y Z-ordering
Históricamente, optimizar el rendimiento de lectura de tablas Delta requería definir claves de partición y de Z-order al crear la tabla, con base en los patrones de consulta esperados
liquid clustering usa un algoritmo basado en árboles para agrupar datos según claves especificadas
Puede cambiarse de forma gradual sin reescribir todos los datos, lo que ofrece mayor flexibilidad para soportar distintos patrones de consulta
Databricks Runtime for Delta Lake admite liquid clustering automático analizando cargas históricas de consulta, identificando columnas óptimas y agrupando los datos en consecuencia

8. Prototipado de UI self-serve con GenAI

Herramientas como Claude Code, Figma Make, Miro AI, v0 permiten que product managers creen directamente prototipos interactivos y aptos para pruebas con usuarios a partir de prompts de texto
En lugar de crear wireframes manualmente, los equipos pueden generar en minutos artefactos funcionales de HTML, CSS y JS
Estos prototipos "desechables" intercambian pulido por aprendizaje rápido, por lo que son ideales para validación temprana durante design sprints
Una mayor fidelidad puede llevar a un enfoque equivocado en los detalles o a expectativas poco realistas sobre el esfuerzo de producción, por lo que es esencial un framing claro y una buena gestión de expectativas

9. Salida estructurada de LLMs

Una práctica que restringe a los LLM para que generen respuestas en formatos predefinidos como JSON o clases específicas de programación
Convierte el texto generalmente impredecible de los LLM en contratos de datos legibles por máquina y deterministas, algo esencial para construir aplicaciones confiables de nivel de producción
Los enfoques varían desde formateo simple basado en prompts y structured outputs nativos del modelo hasta métodos más robustos de decodificación restringida con herramientas como Outlines e Instructor
Se ha usado con éxito para extraer datos complejos y no estructurados de diversos tipos de documentos y convertirlos en JSON estructurado para lógica de negocio downstream

10. TCR (Test && Commit || Revert)

Un flujo de trabajo de programación derivado del desarrollo guiado por pruebas que promueve pasos muy pequeños y continuos mediante una regla simple
Si las pruebas pasan después de cada cambio, los cambios se confirman; si fallan, los cambios se revierten
Es fácil de implementar porque solo requiere definir scripts que automaticen este ciclo dentro del codebase
Presentado por primera vez en el artículo formal de Kent Beck, TCR refuerza prácticas positivas de codificación como YAGNI y KISS

Assess

11. Pruebas de UI impulsadas por IA

En un Radar anterior, las pruebas de UI basadas en IA se enfocaban principalmente en pruebas exploratorias, y se señaló que la no determinación de los LLM podía causar inestabilidad
Con el auge de MCP, frameworks principales de pruebas de UI como Playwright y Selenium han incorporado sus propios servidores MCP (playwright-mcp, mcp-selenium)
Al ofrecer automatización confiable del navegador mediante tecnologías nativas, permiten que asistentes de codificación generen pruebas de UI confiables en Playwright o Selenium
Hay entusiasmo por desarrollos como Playwright Agents en la versión más reciente de Playwright, y se espera la aparición de orientación más práctica y experiencia de campo

12. Anchoring coding agents to a reference application

En el pasado se marcó el patrón de tailored service templates, que ayuda a las organizaciones que adoptan microservicios a iniciar nuevos servicios e integrarlos sin fricción con la infraestructura existente
Con el tiempo, a medida que aparecen nuevas dependencias, frameworks y patrones de arquitectura, tiende a aumentar la deriva de código entre estas plantillas y los servicios existentes
En la era de los agentes de codificación, se experimenta con anchoring coding agents to a reference application para mantener buenas prácticas y consistencia arquitectónica
Un servidor de Model Context Protocol (MCP) expone tanto el código de plantilla de referencia como los diff de commits, para que los agentes puedan detectar la deriva y proponer correcciones

13. Context engineering

Diseño y optimización sistemáticos de la información proporcionada al LLM durante la inferencia para generar de forma confiable la salida deseada
Incluye estructurar, seleccionar y ordenar elementos de contexto como prompts, datos recuperados, memoria, instrucciones y señales del entorno
A diferencia de prompt engineering, que se enfoca solo en la redacción del prompt, context engineering considera la composición completa del contexto
Hoy, los ingenieros usan varias técnicas individuales que pueden agruparse en tres áreas: Context setup, Context management for long-horizon tasks, Dynamic information retrieval

14. GenAI for forward engineering

Técnica emergente para modernizar sistemas legacy mediante descripciones del codebase legacy generadas por IA
Introduce una etapa explícita enfocada en lo que hace el código legacy (la especificación), mientras oculta de forma intencional cómo está implementado actualmente
Está relacionada con spec-driven development, pero aplicada específicamente a la modernización de legacy
Siguiendo el ciclo reverse-engineering → design/solutioning → forward-engineering, tanto humanos como agentes de IA pueden razonar a un nivel más alto antes de comprometerse con la implementación

15. GraphQL as data access pattern for LLMs

Enfoque emergente para crear una capa uniforme y amigable para modelos de acceso a datos que mejora context engineering
Permite exponer datos estructurados y consultables sin dar al modelo acceso directo a la base de datos
A diferencia de las APIs REST, que requieren nuevos endpoints o filtros para cada caso de uso, GraphQL permite al modelo recuperar solo los datos que necesita
Un esquema GraphQL bien definido proporciona metadatos que el LLM puede usar para razonar sobre las entidades y relaciones disponibles

16. Knowledge flows over knowledge stocks

Reciben con frecuencia la pregunta de "cómo mejorar la forma de compartir información entre equipos"
El concepto de knowledge flows and knowledge stocks, una perspectiva tomada del pensamiento sistémico, resulta valioso
Fomenta ver el conocimiento organizacional como un sistema: los stocks representan el conocimiento acumulado y los flows cómo ese conocimiento se mueve y evoluciona dentro de la organización
Aumentar el flujo de conocimiento externo hacia la organización tiende a impulsar la innovación, y establecer communities of practice es una forma comprobada de mejorar esos flujos

17. LLM as a judge

Usar un LLM como juez para evaluar la salida de otros sistemas (normalmente generadores basados en LLM) ha llamado la atención por su potencial para ofrecer evaluaciones escalables y automatizadas en IA generativa
Este blip se mueve de Trial a Assess para reflejar complejidades y riesgos recientemente reconocidos
La evaluación es vulnerable a position bias, verbosity bias y baja robustez, y un problema aún más serio es scaling contamination
Para responder a estas fallas, se exploran técnicas mejoradas como LLMs as a jury (usar varios modelos para llegar a consenso) o razonamiento chain-of-thought durante la evaluación

18. On-device information retrieval

Técnica que permite que la búsqueda, la conciencia de contexto y la retrieval-augmented generation (RAG) se ejecuten por completo en el dispositivo del usuario (móvil, desktop o edge)
Prioriza la privacidad y la eficiencia computacional combinando bases de datos locales ligeras con modelos optimizados para inferencia on-device
Una implementación prometedora combina sqlite-vec (una extensión de SQLite que habilita búsqueda vectorial dentro de una base de datos embebida) con EmbeddingGemma (un modelo de embeddings de 300 millones de parámetros basado en la arquitectura Gemma 3)
Se recomienda evaluarla para aplicaciones local-first y otros casos de uso donde la soberanía de los datos, la baja latencia y la privacidad son importantes

19. SAIF

SAIF (Secure AI Framework) es un framework desarrollado por Google para ofrecer una guía práctica para gestionar riesgos de seguridad en IA
Aborda de manera sistemática amenazas comunes como data poisoning y prompt injection mediante mapas de riesgo claros, análisis de componentes y estrategias prácticas de mitigación
Su enfoque en los riesgos cambiantes de construir sistemas de agentes es especialmente oportuno y valioso
Ofrece un playbook conciso y accionable que puede usarse para reforzar las buenas prácticas de seguridad en el uso de LLM y en aplicaciones impulsadas por IA

20. Service mesh without sidecar

Dado que persisten el costo y la complejidad operativa de los service mesh basados en sidecar, entusiasma la aparición de opciones sin sidecar como Istio ambient mode
Ambient mode introduce una arquitectura en capas que separa responsabilidades entre dos componentes principales: un proxy L4 por nodo (ztunnel) y un proxy L7 por namespace (Waypoint proxy)
ztunnel garantiza que el tráfico L3 y L4 se transporte de forma eficiente y segura, obtiene certificados para todas las identidades del nodo y maneja la redirección de tráfico con workloads compatibles con ambient
Waypoints proxy es un componente opcional de ambient mode que habilita funciones más ricas de Istio, como gestión de tráfico, seguridad y visibilidad

21. Small language models

A lo largo de varios volúmenes de Technology Radar, han observado el avance constante de los small language models (SLMs)
Con el aumento del interés en construir soluciones con agentes, también crece la evidencia de que los SLM pueden impulsar de forma eficiente la IA basada en agentes
La mayoría de los flujos de trabajo actuales con agentes se enfocan en tareas limitadas y repetitivas que no requieren razonamiento avanzado, por lo que encajan bien con los SLM
El desarrollo continuo de SLM como Phi-3, SmolLM2 y DeepSeek ofrece capacidades suficientes para estas tareas

22. Spec-driven development

Un enfoque emergente para flujos de trabajo de programación asistida por IA, cuya definición sigue evolucionando
Generalmente se refiere a un flujo de trabajo que comienza con especificaciones funcionales estructuradas y luego las descompone en partes más pequeñas, soluciones y tareas a través de varias etapas
Kiro de Amazon guía a los usuarios por tres etapas del flujo de trabajo: requisitos, diseño y generación de tareas
spec-kit de GitHub sigue un proceso similar de tres etapas, pero agrega una orquestación más rica, prompts configurables y una "constitution" que define principios inmutables que siempre deben seguirse

23. Team of coding agents

Una técnica en la que el desarrollador orquesta varios agentes de programación con IA, cada uno con un rol específico como architect, back-end specialist o tester
Herramientas como Claude Code, Roo Code y Kilo Code admiten subagentes y múltiples modos de operación
Basado en el principio demostrado de que asignar roles y personas específicos a un LLM mejora la calidad de la salida, se logran mejores resultados coordinando varios agentes especializados en lugar de depender de un solo agente de propósito general
Marca un cambio hacia pipelines de desarrollo asistido por IA orquestados y de múltiples etapas

24. Topology-aware scheduling

Las GPU y las LPU ya no son dispositivos independientes, sino redes de aceleradores estrechamente acopladas cuyo rendimiento depende de la ubicación y la topología
En sistemas a escala de rack como NVL72 de NVIDIA, 72 GPU comparten más de 13 TB de VRAM y funcionan como un solo acelerador, pero cuando la carga de trabajo cruza islas de switches, las operaciones colectivas se convierten en cuellos de botella
La arquitectura de Groq, con scheduling en software en tiempo de compilación, asume movimiento de datos determinista, y un scheduling aleatorio rompe esas suposiciones y su previsibilidad
Los schedulers ingenuos que ignoran la topología suelen distribuir cargas de trabajo multi-GPU de forma arbitraria, lo que empeora el tiempo por etapa y la eficiencia

25. Toxic flow analysis for AI

El chiste conocido de que la S de MCP significa "security" oculta un problema muy real
Cuando los agentes se comunican entre sí mediante llamadas a herramientas o APIs, pueden encontrarse rápidamente con lo que se conoce como lethal trifecta: acceso a datos personales, exposición a contenido no confiable y capacidad de comunicación externa
Un agente que tiene las tres es muy vulnerable, y como los LLM tienden a seguir las instrucciones de la entrada, el contenido de fuentes no confiables que incluya instrucciones para filtrar datos puede llevar fácilmente a una fuga de información
toxic flow analysis inspecciona el grafo de flujo de los sistemas de agentes para identificar rutas de datos potencialmente inseguras para una investigación adicional

Hold

26. AI-accelerated shadow IT

La IA reduce la barrera para que personas no programadoras construyan e integren software por su cuenta, en lugar de esperar al departamento de TI
Aunque les entusiasma el potencial que esto libera, están atentos a las primeras señales de AI-accelerated shadow IT
Las plataformas no-code de automatización de flujos de trabajo ahora admiten integración con APIs de IA, como OpenAI o Anthropic, lo que genera la tentación de usar la IA como cinta adhesiva para conectar integraciones que antes no eran posibles
Al mismo tiempo, los asistentes de programación con IA se están volviendo más agentivos, permitiendo que personas no programadoras con capacitación básica construyan aplicaciones utilitarias internas

27. Capacity-driven development

La clave del éxito de las prácticas modernas de desarrollo de software es mantener el enfoque en el flujo de trabajo
Los equipos stream-aligned se concentran en un único flujo valioso, como un recorrido de usuario o un producto, para entregar valor end-to-end de manera eficiente
Sin embargo, observan una tendencia preocupante hacia capacity-driven development, en la que equipos alineados de esta forma asumen funcionalidades de otros productos o flujos cuando tienen capacidad disponible
A corto plazo puede parecer eficiente, pero es una optimización local adecuada sobre todo para manejar picos de demanda, y cuando se normaliza aumenta la carga cognitiva y la deuda técnica

28. Complacency with AI-generated code

A medida que los asistentes y agentes de programación con IA ganan atención, aumentan los datos y estudios que resaltan la preocupación por complacency with AI-generated code
Hay suficiente evidencia de que estas herramientas pueden acelerar el desarrollo, pero los estudios muestran que la calidad del código puede deteriorarse con el tiempo
En la investigación de 2024 de GitClear, el código duplicado y el code churn aumentaron más de lo esperado, mientras que la actividad de refactorización en el historial de commits disminuyó
La investigación de Microsoft sobre trabajadores del conocimiento muestra que la confianza impulsada por IA a menudo aparece a costa del pensamiento crítico

29. Naive API-to-MCP conversion

Las organizaciones están ansiosas por convertir de forma fluida y directa sus APIs internas a Model Context Protocol (MCP) para que los agentes de IA interactúen con los sistemas existentes
Hay un número creciente de herramientas como MCP link y FastAPI-MCP que buscan facilitar esa conversión
Están en contra de esta naive API-to-MCP conversion, ya que las APIs normalmente están diseñadas para desarrolladores humanos y consisten en operaciones atómicas de granularidad fina que, cuando la IA intenta encadenarlas, pueden generar uso excesivo de tokens, contaminación de contexto y menor rendimiento del agente
Estas APIs suelen exponer datos sensibles o permitir acciones destructivas, especialmente en el caso de APIs internas

30. Equipos de ingeniería de datos independientes

Organizar equipos de ingeniería de datos separados que desarrollan y son dueños de pipelines y productos de datos aparte del dominio de negocio al que sirven es un antipatrón que conduce a ineficiencias y resultados de negocio débiles
Esta estructura repite errores del pasado al separar capacidades de DevOps, pruebas o despliegue, lo que genera silos de conocimiento, cuellos de botella y desperdicio de esfuerzo
Sin una colaboración estrecha, los ingenieros de datos a menudo carecen del contexto de negocio y de dominio necesario para diseñar productos de datos significativos, lo que limita tanto la adopción como el valor
En su lugar, los equipos de plataforma de datos deben enfocarse en mantener infraestructura compartida, mientras que los equipos de negocio multifuncionales deben construir y ser dueños de sus propios data products según los principios de data mesh

31. Text to SQL

Text to SQL usa LLM para traducir lenguaje natural a SQL ejecutable, pero su confiabilidad a menudo no cumple con las expectativas
Este blip se movió a Hold para desalentar su uso en flujos de trabajo no supervisados; por ejemplo, cuando la salida está oculta o se convierten dinámicamente consultas generadas por usuarios de forma automatizada
En estos casos, los LLM suelen alucinar debido a una comprensión limitada del esquema o del dominio, con el riesgo de recuperar datos incorrectos o modificar datos de forma no intencional
Para agentic business intelligence, eviten el acceso directo a la base de datos y usen en su lugar una capa semántica de abstracción de datos administrada como Cube o dbt's semantic layer

[Platforms]

Adopt

32. Arm in the cloud

Las instancias de cómputo Arm en la nube se han vuelto cada vez más populares en los últimos años por su eficiencia en costos y energía frente a las instancias tradicionales basadas en x86
Los principales proveedores de nube, incluidos AWS, Azure y GCP, ahora ofrecen opciones Arm sólidas
Muchos equipos han migrado con éxito cargas de trabajo como microservicios, bases de datos open source e incluso computación de alto rendimiento a Arm con cambios mínimos de código y solo algunos ajustes en scripts de build
Herramientas modernas como las multi-arch Docker images simplifican el build y el despliegue tanto en entornos Arm como x86

Trial

33. Apache Paimon

Apache Paimon es un formato open source de data lake diseñado para hacer posible una lakehouse architecture
Se integra sin fricciones con motores de procesamiento como Flink y Spark, y soporta tanto trabajos de streaming como de batch
Una ventaja clave de la arquitectura de Paimon es la combinación de un formato estándar de data lake con la estructura LSM (log-structured merge tree)
Esta combinación resuelve desafíos tradicionales de los data lakes, como actualizaciones de alto rendimiento y lecturas de baja latencia

34. DataDog LLM Observability

Datadog LLM Observability ofrece trazabilidad, monitoreo y diagnóstico end-to-end para flujos de trabajo de modelos de lenguaje grandes y aplicaciones de agentes
Mapea cada prompt, llamada de herramienta y paso intermedio a spans y traces, rastrea latencia, uso de tokens, errores y métricas de calidad, y se integra con la amplia suite de APM y observabilidad de Datadog
Las organizaciones que ya usan Datadog y están familiarizadas con su estructura de costos pueden encontrar que sus capacidades de visibilidad para LLM son una forma intuitiva de obtener observabilidad sobre cargas de trabajo de IA, asumiendo que pueden instrumentarlas
Configurar y usar instrumentación de LLM requiere cuidado y una comprensión sólida de la carga de trabajo y la implementación, y se recomienda una colaboración estrecha entre ingenieros de datos y personal de operaciones durante el despliegue

35. Delta Sharing

Delta Sharing es un estándar abierto y protocolo para compartir datos de forma segura entre plataformas, desarrollado por Databricks y la Linux Foundation
Es independiente de la nube y permite que las organizaciones compartan datos en vivo entre proveedores de nube y ubicaciones on-premises sin copiar ni replicar los datos
Usa una REST API simple para emitir URL prefirmadas de corta duración que permiten a los destinatarios consultar grandes conjuntos de datos con herramientas como pandas, Spark o Power BI
Soporta compartir tablas de datos, vistas, modelos de IA y notebooks, y ofrece una gobernanza centralizada sólida y auditoría

36. Dovetail

La plataforma Dovetail aborda el desafío persistente de gestionar datos de investigación cualitativa distribuidos
Ofrece un repositorio centralizado para entrevistas con usuarios, transcripciones e insights, transformando datos en bruto en activos estructurados y analizables
Es especialmente útil en flujos de trabajo de product discovery, donde crea trazabilidad de evidencia que conecta directamente citas de clientes y temas sintetizados con hipótesis de producto y ROI esperado
Al hacerlo, Dovetail fortalece el papel de los datos cualitativos en la toma de decisiones de producto

37. Langdock

Langdock es una plataforma para que las organizaciones desarrollen y ejecuten agentes de IA generativa y flujos de trabajo para operaciones internas
Ofrece un entorno integrado con asistentes de chat internos, una capa de API para conectarse a múltiples LLM y herramientas para construir flujos de trabajo de agentes que se integran con sistemas como Slack, Confluence y Google Drive
La plataforma enfatiza la soberanía de datos al ofrecer opciones on-premises y de hosting en la UE con estándares de cumplimiento empresarial
Las organizaciones que implementen Langdock igual deben prestar mucha atención a la gobernanza de datos y usar técnicas como toxic flow analysis para prevenir la lethal trifecta

38. LangSmith

LangSmith es la plataforma alojada del equipo de LangChain para ofrecer visibilidad, trazabilidad y evaluación de aplicaciones LLM
Captura traces detallados de cadenas, herramientas y prompts para que los equipos puedan depurar y medir el comportamiento del modelo, seguir regresiones de rendimiento y gestionar conjuntos de datos de evaluación
LangSmith es una plataforma SaaS propietaria con soporte limitado para flujos de trabajo que no usan LangChain, por lo que resulta más atractiva para equipos que ya invirtieron en ese ecosistema
Su soporte integrado para evaluación de prompts y experimentación es especialmente más pulido que alternativas open source como Langfuse

39. Model Context Protocol (MCP)

Model Context Protocol (MCP) es un estándar abierto que define cómo las aplicaciones y agentes de LLM se integran con fuentes de datos y herramientas externas
MCP se diferencia del protocolo Agent2Agent (A2A), que gestiona la comunicación entre agentes con foco en el acceso al contexto y a las herramientas
Desde el último blip, la adopción de MCP se ha disparado, y empresas importantes como JetBrains (IntelliJ) y Apple se han sumado al ecosistema junto con frameworks emergentes como FastMCP
El estándar en vista previa MCP Registry ahora admite el descubrimiento de herramientas públicas y propietarias

40. n8n

n8n es una plataforma de automatización de flujos de trabajo con licencia fair-code, similar a Zapier o Make (antes Integromat), pero pensada para desarrolladores que quieren opciones autohospedadas, extensibles y controlables por código
Ofrece un enfoque visual y low-code para crear flujos de trabajo, en comparación con Apache Airflow, pero también admite código personalizado en JavaScript o Python
Su principal caso de uso es integrar múltiples servicios en flujos de trabajo automatizados, aunque también puede conectar LLM con fuentes de datos, memoria y herramientas configurables
Muchos equipos usan n8n para prototipar rápidamente flujos de trabajo de agentes activados por aplicaciones de chat o webhooks, y a menudo aprovechan las funciones de importación y exportación para generar flujos de trabajo con ayuda de IA

41. OpenThread

OpenThread es una implementación open source del protocolo de red Thread desarrollada por Google
Soporta todas las funciones principales de la especificación Thread, incluidas capas de red como IPv6, 6LoWPAN y LR-WPAN, además de capacidades de red mallada donde los dispositivos pueden operar como nodos y border routers
OpenThread funciona en una amplia variedad de plataformas de hardware gracias a una capa de abstracción flexible y hooks de integración que permiten a los proveedores integrar sus propias funciones de radio y criptografía
Este protocolo maduro se usa ampliamente en productos comerciales y, según nuestra experiencia, es confiable para construir diversas soluciones de IoT, desde dispositivos de bajo consumo alimentados por batería hasta redes malladas de sensores a gran escala

Assess

42. AG-UI Protocol

AG-UI es un protocolo abierto y una biblioteca diseñados para estandarizar interfaces de usuario enriquecidas y la comunicación entre agentes
Se enfoca en agentes orientados directamente al usuario y se generaliza a cualquier frontend y backend mediante integraciones de cliente y middleware
El protocolo define una forma consistente para que los agentes backend se comuniquen con aplicaciones frontend, haciendo posible la colaboración en tiempo real con estado persistente entre la IA y los usuarios humanos
Soporta múltiples protocolos de transporte, incluidos SSE y WebSockets, y ofrece tipos de eventos estandarizados que representan distintos estados de la ejecución de agentes

43. Agent-to-Agent (A2A) Protocol

Agent2Agent (A2A) es un protocolo que define un estándar para la comunicación e interacción entre agentes en flujos de trabajo complejos de múltiples agentes
Usa Agent Cards para describir elementos clave de la comunicación entre agentes, incluidas especificaciones para el descubrimiento y la transferencia de capacidades, así como esquemas de seguridad
A2A complementa a Model Context Protocol (MCP) al centrarse en la comunicación entre agentes sin exponer detalles internos como el estado, la memoria o el funcionamiento interno de los agentes
El protocolo promueve buenas prácticas como un enfoque async-first para tareas de larga duración, respuestas en streaming para actualizaciones progresivas y transporte seguro mediante HTTPS, autenticación y autorización

44. Amazon S3 Vectors

Amazon S3 Vectors amplía el almacenamiento de objetos de S3 con capacidades nativas para vectores, ofreciendo almacenamiento vectorial integrado y búsqueda por similitud
Se integra de forma fluida con el ecosistema de AWS, incluidos Amazon Bedrock y OpenSearch, y ofrece funciones adicionales como filtrado por metadatos y gobernanza mediante IAM
Aunque sigue en vista previa y tiene limitaciones, su propuesta de valor es atractiva: este enfoque de almacenamiento vectorial rentable y accesible puede habilitar diversas aplicaciones que involucran grandes volúmenes de datos y donde la baja latencia no es la principal preocupación

45. Ardoq

Ardoq es una plataforma de arquitectura empresarial (EA) que permite a las organizaciones construir, gestionar y escalar una base de conocimiento de arquitectura para planificar el futuro de forma más efectiva
A diferencia de la documentación estática tradicional, que tiende al drift y a los silos, el enfoque basado en datos de Ardoq crea un grafo de conocimiento dinámico que extrae información de sistemas existentes y se mantiene actualizado a medida que evoluciona el panorama
Una función especialmente útil es Ardoq Scenarios, que permite modelar y definir visualmente estados futuros hipotéticos usando un enfoque de branching y merging similar a Git
Las organizaciones que buscan una transformación arquitectónica deberían evaluar plataformas de EA dedicadas como Ardoq por su potencial para simplificar y acelerar este proceso

46. CloudNativePG

CloudNativePG es un Kubernetes Operator que simplifica el alojamiento y la gestión de clústeres PostgreSQL de alta disponibilidad en Kubernetes
Ejecutar servicios con estado como PostgreSQL en Kubernetes puede ser complejo, ya que requiere conocimiento profundo tanto de Kubernetes como de la replicación de PostgreSQL
CloudNativePG abstrae gran parte de esta complejidad al tratar todo el clúster PostgreSQL como un único recurso declarativo configurable
Ofrece una arquitectura primary/standby fluida usando replicación nativa por streaming y proporciona de inmediato funciones de alta disponibilidad, incluidas capacidades de self-healing, failover automático promoviendo la réplica más actualizada y recreación automática de réplicas fallidas

47. Coder

Coder es una plataforma para aprovisionar rápidamente entornos de desarrollo estandarizados, siguiendo la práctica antes descrita de development environments in the cloud
En comparación con herramientas similares como Gitpod (ahora renombrado como Ona) y GitHub Codespaces, Coder ofrece mayor control sobre la personalización de estaciones de trabajo mediante Terraform
Hospeda las estaciones de trabajo en la infraestructura propia de la organización, en su nube o centro de datos, en lugar de en los servidores del proveedor
Este enfoque ofrece mayor flexibilidad, incluida la capacidad de ejecutar agentes de codificación con IA y acceder a sistemas internos de la organización

48. Graft

Graft es un motor de almacenamiento transaccional que permite una sincronización de datos sólida, consistente y eficiente en entornos edge y distribuidos
Usa lazy replication para sincronizar datos solo cuando es necesario, partial replication para minimizar el consumo de ancho de banda y serializable snapshot isolation para garantizar la integridad de los datos
En Radar mencionamos Electric para casos de uso similares, pero Graft se distingue porque convierte el almacenamiento de objetos en un sistema transaccional que soporta actualizaciones consistentes a nivel de página sin imponer un formato de datos
Es adecuado para impulsar aplicaciones móviles local-first, gestionar sincronización compleja entre plataformas y servir como columna vertebral de réplicas stateless en sistemas serverless o embebidos

49. groundcover

groundcover es una plataforma de observabilidad cloud-native que integra logs, trazas, métricas y eventos de Kubernetes en un solo panel
Aprovecha eBPF para capturar datos de observabilidad granulares con instrumentación de cero código, sin insertar agentes ni SDKs en el código de la aplicación
Los sensores eBPF de groundcover se ejecutan en nodos dedicados de cada clúster monitoreado, por lo que operan de forma independiente de las aplicaciones que observan
Entre sus funciones principales se incluyen visibilidad profunda a nivel de kernel, bring-your-own-cloud (BYOC) architecture para privacidad de datos y un modelo de precios independiente del volumen de datos que mantiene los costos predecibles

50. Karmada

Karmada ("Kubernetes Armada") es una plataforma para orquestar cargas de trabajo en múltiples clústeres de Kubernetes, nubes y centros de datos
Muchos equipos hoy combinan herramientas GitOps como Flux o ArgoCD con scripts personalizados para desplegar en todos los clústeres, así que una solución específica para este fin es bienvenida
Karmada aprovecha APIs nativas de Kubernetes, por lo que no requiere cambios en aplicaciones ya construidas para entornos cloud-native
Ofrece funciones avanzadas de scheduling para gestión multicloud, alta disponibilidad, recuperación ante desastres y programación de tráfico

51. OpenFeature

A medida que un negocio escala, la gestión de feature flags suele volverse cada vez más compleja, y los equipos necesitan una capa de abstracción que vaya más allá del simple feature toggle
OpenFeature proporciona esa capa mediante una especificación de API independiente del proveedor e impulsada por la comunidad que estandariza cómo se definen y consumen los feature flags
Su CLI ofrece un amplio soporte para múltiples definiciones de esquema, desde configuraciones básicas con variables de entorno o configuración en memoria hasta plataformas maduras como ConfigCat o LaunchDarkly
Sin embargo, queda una advertencia importante: los equipos deben gestionar por separado y con disciplina las distintas categories of flags para evitar la proliferación de flags, la complejidad de la aplicación y una sobrecarga excesiva de pruebas

52. Oxide

Construir y operar infraestructura privada es complejo, y esa es una de las principales razones por las que la nube pública es la opción predeterminada para la mayoría de las organizaciones
Pero para quienes lo necesitan, Oxide ofrece una alternativa que ensambla e integra hardware y software desde cero
Ofrece racks preconstruidos que incluyen cómputo, red y almacenamiento, ejecutando software de sistema totalmente integrado
Los equipos pueden gestionar recursos a través de la API IaaS de Oxide usando Terraform y otras herramientas de automatización; a esto Oxide lo llama infraestructura elástica on-premises

53. Restate

Restate es una plataforma de ejecución persistente diseñada para resolver los complejos desafíos de sistemas distribuidos al construir aplicaciones con estado y tolerantes a fallas
Mediante execution journaling registra cada paso para garantizar tolerancia a fallas, recuperación confiable y comunicación exactamente una vez entre servicios
La principal ventaja arquitectónica de la plataforma es que separa la lógica de la aplicación en tres tipos de servicios persistentes: Basic Services para funciones sin estado, Virtual Objects para modelar entidades concurrentes con estado y Workflows para orquestar procesos complejos de múltiples etapas
Se está evaluando cuidadosamente Restate en un sistema de seguros a gran escala y hasta ahora el desempeño ha sido muy satisfactorio

54. SkyPilot

SkyPilot es una plataforma open source para ejecutar y escalar cargas de trabajo de IA on-premises o en la nube
Desarrollado por Sky Computing Lab de UC Berkeley, SkyPilot actúa como un broker inteligente que encuentra y aprovisiona automáticamente las GPUs disponibles y más baratas en las principales nubes y clústeres de Kubernetes, lo que a menudo reduce los costos de cómputo
Para los equipos de infraestructura, simplifica la ejecución de IA en Kubernetes al ofrecer facilidad de uso similar a Slurm, solidez cloud-native y funciones como acceso SSH directo a pods, gang scheduling y soporte multiclúster
Admite el escalado fluido de cargas de trabajo de entrenamiento o inferencia

55. StarRocks

StarRocks es una base de datos analítica que redefine la inteligencia de negocios en tiempo real al combinar la velocidad de los sistemas OLAP tradicionales con la flexibilidad de los data lakehouses modernos
Logra latencias de consulta de menos de un segundo a gran escala mediante un motor de ejecución optimizado con SIMD, almacenamiento columnar y un sofisticado optimizador basado en costos
Esta arquitectura de alto rendimiento permite a los usuarios ejecutar análisis complejos directamente sobre formatos de datos abiertos como Apache Iceberg, sin precálculos ni copias de datos
Hay muchas plataformas en este espacio, pero se considera a StarRocks un fuerte candidato como solución rentable para escenarios que exigen concurrencia extrema y frescura de datos consistentemente actualizada

56. Uncloud

Uncloud es una herramienta ligera de orquestación y clustering de contenedores que permite a los desarrolladores llevar aplicaciones de Docker Compose a producción
Ofrece una experiencia simple y similar a la nube, sin la sobrecarga operativa de Kubernetes
Logra escalado entre máquinas y despliegues sin tiempo de inactividad al configurar automáticamente una red mesh segura con WireGuard para la comunicación y usar el proxy inverso Caddy para HTTPS automático y balanceo de carga
La principal ventaja arquitectónica de Uncloud es su diseño totalmente distribuido, que elimina la necesidad de un plano de control central y garantiza que el trabajo del clúster siga funcionando incluso si una máquina individual queda fuera de línea

[Tools]

Adopt

57. ClickHouse

ClickHouse es una base de datos open source distribuida, columnar y de procesamiento analítico en línea (OLAP) para analítica en tiempo real
Ha madurado como un motor sumamente potente y escalable capaz de manejar análisis de datos a gran escala
Sus vistas materializadas incrementales, motor de consultas eficiente y fuerte compresión de datos lo hacen ideal para consultas interactivas
Su soporte integrado para funciones de agregación aproximada permite equilibrar precisión y rendimiento, lo que resulta especialmente útil para análisis de alta cardinalidad

58. NeMo Guardrails

NeMo Guardrails es el toolkit open source de NVIDIA para añadir fácilmente mecanismos programables de seguridad y control a aplicaciones conversacionales basadas en LLM
Define y aplica reglas de comportamiento para garantizar que las salidas sean seguras, pertinentes y cumplan con las normativas
Los desarrolladores usan Colang, un lenguaje específico para este propósito, para crear flujos conversacionales flexibles, gestionar conversaciones y aplicar rutas y procedimientos operativos predefinidos
NeMo Guardrails ofrece una API async-first para rendimiento y soporte de guardrails para seguridad de contenido, seguridad general y alineación de entradas y salidas

59. pnpm

Desde el Radar anterior, el equipo ha seguido recibiendo comentarios positivos sobre pnpm
pnpm es un administrador de paquetes de Node.js que ofrece mejoras significativas de rendimiento frente a las alternativas, tanto en velocidad como en eficiencia del espacio en disco
Admite optimización incremental a nivel de archivos que enlaza por hard link los paquetes duplicados de las carpetas node_modules de varios proyectos en una sola ubicación en disco y mejora aún más el rendimiento
pnpm se ha convertido en la opción predeterminada para la gestión de paquetes de Node.js porque ofrece un ciclo de retroalimentación mucho más rápido con problemas mínimos de compatibilidad

60. Pydantic

Pydantic es una biblioteca de Python que usa type hints estándar para definir modelos de datos y aplicar esquemas de datos en tiempo de ejecución
Originalmente, las anotaciones de tipos se agregaron a Python para el análisis estático, pero su creciente versatilidad ha llevado a usos más amplios, incluida la validación en tiempo de ejecución
Está construido sobre un núcleo rápido en Rust, lo que ofrece validación, parsing y serialización de datos eficientes
Se ha vuelto esencial en aplicaciones de LLM y normalmente se usa con la técnica de structured output from LLMs para manejar la naturaleza impredecible de los LLM

Trial

61. AI Design Reviewer

AI Design Reviewer es un plugin de Figma para realizar auditorías de diseño o evaluaciones heurísticas y recopilar feedback accionable sobre diseños existentes o nuevos
Las auditorías abarcan críticas de UX, inconsistencias de UI, brechas de accesibilidad, calidad de contenido y escenarios de casos límite
Además de identificar problemas, ofrece recomendaciones conscientes del dominio que ayudan a los equipos a construir un vocabulario de diseño compartido y el fundamento detrás de las decisiones de diseño
El equipo ha usado AI Design Reviewer para analizar diseños legacy, identificando experiencias positivas que vale la pena conservar y experiencias negativas que deben resolverse, para informar los objetivos de UX de un rediseño

62. Barman

Barman (Backup and Recovery Manager) es una herramienta open source para gestionar respaldos y recuperación ante desastres de servidores PostgreSQL
Simplifica la creación de respaldos físicos mediante varios métodos, los organiza con un catálogo integral y soporta todo el proceso de recuperación ante desastres al restaurar respaldos en servidores en vivo con capacidades de recuperación a un punto en el tiempo
Descubrieron que Barman es potente y fácil de usar, y quedaron profundamente impresionados por la velocidad de las operaciones de recuperación a un punto en el tiempo durante actividades de migración
También es competente con respaldos programados y tiene la capacidad de manejar configuraciones complejas y mixtas de programación y retención

63. Claude Code

Claude Code de Anthropic es una herramienta de codificación con IA agente que ofrece una interfaz en lenguaje natural y un modelo de ejecución por agentes para planificar e implementar flujos de trabajo complejos de múltiples pasos
Aunque fue lanzado hace menos de un año, ya ha sido ampliamente adoptado por desarrolladores dentro y fuera de Thoughtworks, por lo que fue ubicado en Trial
Se han lanzado agentes de codificación basados en consola como Codex CLI de OpenAI, Gemini CLI de Google y el open source OpenCode, y asistentes basados en IDE como Cursor, Windsurf y GitHub Copilot ahora incluyen modo agente
Han visto que los equipos lo usan no solo para escribir y modificar código, sino también como un agente de IA de propósito general para gestionar especificaciones, historias, configuración, infraestructura y documentación

64. Cleanlab

En el paradigma de IA centrada en los datos, mejorar la calidad del dataset suele ofrecer mayores mejoras de rendimiento que ajustar el modelo en sí
Cleanlab es una biblioteca open source de Python diseñada para abordar este problema, identificando automáticamente problemas de datos comunes como etiquetado incorrecto, outliers y duplicados en datasets de texto, imágenes, tablas y audio
Construido sobre los principios de confident learning, Cleanlab aprovecha las probabilidades de predicción del modelo para estimar ruido en las etiquetas y cuantificar la calidad de los datos
Este enfoque independiente del modelo permite a los desarrolladores diagnosticar y corregir errores del dataset y luego reentrenar el modelo para lograr mayor robustez y precisión

65. Context7

Context7 es un servidor MCP que aborda las inexactitudes del código generado por IA
Mientras los LLM dependen de datos de entrenamiento desactualizados, Context7 asegura la generación de código preciso, actualizado y específico por versión para las bibliotecas y frameworks usados en el proyecto
Extrae documentación reciente y ejemplos de código funcional directamente de los repositorios fuente de los frameworks y los inyecta en la ventana de contexto del LLM en el momento del prompting
En su experiencia, Context7 reduce significativamente las alucinaciones de código y la dependencia de datos de entrenamiento desactualizados

66. Data Contract CLI

Data Contract CLI es una herramienta open source de línea de comandos diseñada para trabajar con la especificación Data Contract
Permite crear y editar contratos de datos y, de forma crucial, validar datos contra esos contratos, algo esencial para garantizar la integridad y calidad de los productos de datos
El CLI ofrece amplio soporte para múltiples definiciones de esquema (Avro, SQL DDL, Open Data Contract Standard, entre otras) y puede comparar distintas versiones de contratos para detectar de inmediato cambios importantes
Descubrieron que es especialmente útil para operacionalizar la gobernanza de contratos entre productos de datos mediante integración con CI/CD, particularmente en entornos de data mesh

67. Databricks Assistant

Databricks Assistant es una herramienta conversacional impulsada por IA e integrada directamente en la plataforma Databricks que actúa como programador en pareja contextual para profesionales de datos
A diferencia de los asistentes de codificación de propósito general, tiene la ventaja de una comprensión nativa del entorno y el contexto de datos de Databricks, incluido el metadata de Unity Catalog
El Assistant va más allá de generar snippets de código: puede escribir consultas complejas de SQL y Python de múltiples pasos, diagnosticar errores y ofrecer explicaciones detalladas y específicas del workspace
Para organizaciones que ya han invertido en el ecosistema de Databricks, puede acelerar la productividad y reducir la barrera de entrada para tareas de datos complejas

68. Hoppscotch

Hoppscotch es una herramienta open source ligera para desarrollo, depuración, pruebas y compartición de APIs
Soporta varios protocolos, incluidos HTTP, GraphQL y WebSocket, y ofrece clientes multiplataforma para web, escritorio y entornos CLI
Aunque el espacio de herramientas para APIs está saturado de alternativas como Postman, Insomnia y Bruno, Hoppscotch destaca por su huella ligera y su diseño amigable con la privacidad
Omite analítica, usa almacenamiento local-first y soporta self-hosting, por lo que es una opción sólida para organizaciones que buscan una manera intuitiva de compartir scripts de API mientras mantienen una fuerte privacidad de datos

69. NVIDIA DCGM Exporter

NVIDIA DCGM Exporter es una herramienta open source que ayuda a los equipos a monitorear entrenamiento distribuido con GPU a gran escala
Convierte la telemetría propietaria de NVIDIA Data Center GPU Manager (DCGM) a un formato abierto compatible con sistemas de monitoreo estándar
Expone métricas críticas en tiempo real tanto de las GPU como de los servidores host, como utilización de GPU, temperatura, energía y conteos de errores ECC
Esta visibilidad es esencial para organizaciones que ajustan finamente LLM personalizados o ejecutan trabajos de entrenamiento intensivos en GPU de larga duración

70. RelationalAI

Cuando grandes volúmenes de datos diversos se incorporan a Snowflake, las relaciones únicas y las reglas implícitas dentro de esos datos pueden volverse ambiguas
RelationalAI, construido como una Snowflake Native App, permite a los equipos crear modelos sofisticados que capturan conceptos significativos, definen entidades clave del negocio e incorporan lógica compleja directamente sobre tablas de Snowflake
Mediante un potente Graph Reasoner, los usuarios pueden generar, analizar y visualizar grafos de conocimiento relacional basados en estos modelos
Para organizaciones que gestionan conjuntos de datos grandes y que cambian con rapidez, construir grafos de conocimiento puede ser esencial para el monitoreo proactivo y para generar insights más ricos y accionables

71. UX Pilot

UX Pilot es una herramienta de IA que apoya varias etapas del proceso de diseño UX, desde wireframing hasta diseño visual de alta fidelidad y revisión
Acepta entradas de texto o imagen y puede generar automáticamente pantallas, flujos y layouts
La función Autoflow genera transiciones de flujo de usuario y Deep Design produce resultados más ricos y detallados
UX Pilot también incluye un plugin de Figma para exportar los diseños generados y refinarlos dentro de herramientas de diseño estándar

72. v0

v0 ha evolucionado desde que fue presentado por última vez en el Radar
Ahora incluye un modo de diseño que facilita a los product managers crear y ajustar prototipos de UI de autoservicio
La versión más reciente introduce un modelo propio con una gran ventana de contexto y capacidades multimodales, lo que permite a v0 generar y mejorar UI tanto a partir de entradas de texto como visuales
Otra incorporación destacable es el modo agente, que permite al sistema descomponer tareas más complejas y elegir el modelo adecuado para cada una

Assess

73. Augment Code

Augment Code es un asistente de programación con IA que ofrece soporte con profundo reconocimiento de contexto en codebases grandes
Destaca por su avanzado context engineering, que permite actualizaciones rápidas del índice de código y búsquedas veloces incluso cuando el código cambia con frecuencia
Augment soporta modelos como Claude Sonnet 4 y 4.5, así como GPT-5, se integra con GitHub, Jira y Confluence, y ofrece soporte para Model Context Protocol (MCP) para interoperabilidad con herramientas externas
Proporciona guía paso a paso para cambios complejos en codebases, desde refactorización y actualización de dependencias hasta actualizaciones de esquema

74. Azure AI Document Intelligence

Azure AI Document Intelligence (antes Form Recognizer) extrae texto, tablas y pares clave-valor de documentos no estructurados para convertirlos en datos estructurados
Usa modelos de deep learning preentrenados para interpretar el layout y el significado, y permite entrenar modelos personalizados para formatos especiales mediante una interfaz no-code
Uno de los equipos reportó que ADI redujo significativamente la captura manual de datos, mejoró la precisión de los datos y aceleró la generación de reportes, lo que llevó a una toma de decisiones basada en datos más rápida
Al igual que Amazon Textract y Google Document AI, ofrece procesamiento de documentos de nivel empresarial con una sólida comprensión del layout

75. Docling

Docling es una biblioteca open source de Python y TypeScript para procesamiento avanzado de documentos de datos no estructurados
Resuelve el a menudo ignorado problema de la “última milla” de convertir documentos reales, como PDF y PowerPoint, a formatos limpios y legibles por máquina
A diferencia de los extractores tradicionales, Docling usa un enfoque basado en visión por computadora para interpretar el layout del documento y su estructura semántica, lo que hace que su salida sea especialmente valiosa para pipelines de retrieval-augmented generation (RAG)
Convierte documentos complejos a formatos estructurados como JSON o Markdown, dando soporte a técnicas como structured output from LLMs

76. E2B

E2B es una herramienta open source para ejecutar código generado por IA en sandboxes seguros y aislados en la nube
Los agentes pueden usar estos sandboxes, construidos sobre microVM de Firecracker, para ejecutar código de forma segura, analizar datos, realizar investigación u operar máquinas virtuales
Esto permite construir y desplegar agentes de IA de nivel empresarial con control total sobre el entorno de ejecución y con seguridad

77. Helix editor

Ha habido cierto resurgimiento de editores de texto simples que buscan reemplazar al favorito de línea de comandos, Vim
Helix es uno de los competidores en este espacio concurrido, junto con Neovim y el más reciente Kakoune
Describiéndose con algo de humor como un editor de texto posmoderno, Helix ofrece múltiples cursores, soporte para Tree-sitter y soporte integrado para Language Server Protocol (LSP), que fue lo que inicialmente llamó nuestra atención
Está en desarrollo activo con un sistema de plugins en progreso y, en general, se siente familiar para usuarios de Vim, pero añade algunas comodidades modernas como editor modal ligero

78. Kueue

Kueue es un controlador nativo de Kubernetes para colas de trabajos que gestionan cuotas y consumo de recursos
Proporciona una API para manejar workloads de Kubernetes con distintas prioridades y requisitos de recursos, y funciona como un administrador a nivel de job que decide cuándo admitir o remover trabajos
Diseñado para gestión eficiente de recursos, priorización de trabajos y scheduling avanzado, Kueue ayuda a optimizar la ejecución de workloads en entornos Kubernetes, especialmente para workloads de ML que usan herramientas como Kubeflow
En lugar de reemplazar cluster-autoscaler y kube-scheduler, trabaja junto a ellos y se enfoca en la admisión de trabajos basada en orden, cuota, prioridad y conciencia de topología

79. MCPScan.ai

MCPScan.ai es un escáner de seguridad para servidores de Model Context Protocol (MCP) que opera en dos modos: escaneo y proxy
En modo de escaneo, analiza configuraciones y descripciones de herramientas para detectar vulnerabilidades conocidas como prompt injection, tool poisoning y toxic flows
En modo proxy, MCPScan.ai actúa como puente entre el sistema de agentes y el servidor MCP, monitoreando continuamente el tráfico en tiempo de ejecución
Este modo también aplica reglas de seguridad y guardrails personalizados, incluida la validación de llamadas a herramientas, detección de PII y restricciones de flujo de datos

80. oRPC

oRPC (OpenAPI Remote Procedure Call) ofrece APIs con seguridad de tipos de extremo a extremo en TypeScript mientras cumple por completo con la especificación OpenAPI
Puede generar automáticamente una especificación OpenAPI completa para simplificar la integración y la documentación
Mientras alternativas como tRPC y ElysiaJS a menudo requieren adoptar nuevos frameworks para obtener seguridad de tipos, oRPC se integra sin fricción con frameworks existentes de Node.js, incluidos Express, Fastify, Hono, Next.js
Esta flexibilidad lo convierte en una excelente opción para equipos que buscan adoptar seguridad de tipos de extremo a extremo en APIs existentes sin una refactorización disruptiva

81. Power user for dbt

Power user for dbt es una extensión para Visual Studio Code que se integra directamente tanto con entornos de dbt como de dbt Cloud
Como dbt sigue siendo una de nuestras herramientas favoritas, cualquier mejora en usabilidad es una adición bienvenida para el ecosistema
Antes, los desarrolladores dependían de varias herramientas fuera del IDE para validar código SQL o inspeccionar el linaje de modelos
Con esta extensión, esas funciones ahora están integradas en VS Code, con autocompletado de código, resultados de consultas en tiempo real y linaje visual de modelos y columnas

82. Serena

Serena es un potente toolkit de programación que brinda a agentes de código como Claude Code capacidades similares a un IDE para búsqueda y edición semántica de código
Al trabajar a nivel de símbolos y comprender la estructura relacional del código, Serena mejora significativamente la eficiencia de tokens
En lugar de leer archivos completos o depender de reemplazos de cadenas imprecisos, los agentes de código pueden usar herramientas precisas de Serena como find_symbol, find_referencing_symbols e insert_after_symbol para localizar y editar código
En proyectos pequeños el impacto es menor, pero a medida que crece la base de código, esta eficiencia se vuelve muy valiosa

83. SweetPad

La extensión SweetPad permite a los desarrolladores usar VS Code o Cursor durante todo el ciclo de vida de desarrollo de aplicaciones Swift en plataformas de Apple
Integra herramientas esenciales como xcodebuild, xcode-build-server y swift-format, eliminando la necesidad de cambiar constantemente a Xcode
Los desarrolladores pueden administrar simuladores y desplegar en dispositivos, además de compilar, ejecutar y depurar aplicaciones Swift para iOS, macOS y watchOS directamente desde el IDE sin abrir Xcode

84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)

Tape/Z (Tools for Assembly Program Exploration for Z/OS) es un toolkit en evolución para analizar código HLASM (High-Level Assembler) de mainframe
Fue desarrollado por Thoughtworker y ofrece funciones como parsing, construcción de grafos de flujo de control, seguimiento de dependencias y visualización de diagramas de flujo
Durante mucho tiempo hemos señalado la escasez de herramientas abiertas y guiadas por la comunidad en el espacio mainframe, donde la mayoría de las opciones son propietarias o están ligadas a ecosistemas de proveedores
Tape/Z ayuda a cerrar esa brecha al ofrecer capacidades de análisis accesibles y scriptables

[Languages and Frameworks]

Adopt

85. Fastify

Seguimos teniendo una experiencia positiva con Fastify, un framework web rápido, poco opinado y de bajo overhead para Node.js
Proporciona todas las funciones esenciales de un framework web minimalista, incluido parsing, validación y serialización, junto con un sólido sistema de plugins y fuerte apoyo de la comunidad
Los equipos no vieron desventajas importantes al usar Fastify frente a alternativas como Express.js, y además obtuvieron mejoras de rendimiento medibles, por lo que es una opción atractiva para el desarrollo web minimalista en Node.js

86. LangGraph

LangGraph es un framework de orquestación para construir aplicaciones multiagente con estado usando LLM
Ofrece primitivas de bajo nivel como nodos y aristas, junto con funciones integradas que dan a los desarrolladores control detallado sobre flujos de trabajo de agentes, gestión de memoria y persistencia de estado
Esto significa que los desarrolladores pueden comenzar con grafos simples preconstruidos y escalar hacia arquitecturas de agentes complejas y en evolución
Con soporte para patrones de resiliencia como streaming, gestión avanzada de contexto, fallback de modelos y manejo de errores de herramientas, LangGraph permite construir aplicaciones de agentes robustas y listas para producción

87. vLLM

vLLM es un motor de inferencia para LLM de alto rendimiento y eficiencia de memoria que puede ejecutarse en la nube o on-premises
Es compatible con múltiples arquitecturas de modelos y modelos open source populares
Los equipos desplegaron workers dockerized de vLLM en plataformas GPU como NVIDIA DGX e Intel HPC para alojar modelos como Llama 3.1 (8B y 70B), Mistral 7B y Llama-SQL para asistencia de programación a desarrolladores, recuperación de conocimiento e interacción con bases de datos en lenguaje natural
vLLM es compatible con el estándar OpenAI SDK, lo que permite servir modelos de forma consistente

Trial

88. Crossplane

Desde su última aparición en el Radar, la adopción de Crossplane ha seguido creciendo, especialmente para extender clústeres de Kubernetes
En la práctica, descubrimos que Crossplane destaca en casos de uso específicos en lugar de ser una herramienta de infraestructura como código (IaC) de propósito general
La observación anterior sigue vigente: Crossplane funciona mejor como acompañante de cargas de trabajo desplegadas dentro de Kubernetes y no como reemplazo completo de herramientas como Terraform
Los equipos que hicieron "all-in" con Crossplane como solución principal de IaC a menudo enfrentaron dificultades, mientras que quienes lo usaron de forma pragmática, para casos de uso personalizados y dirigidos, vieron resultados sólidos

89. DeepEval

DeepEval es un framework de evaluación open source basado en Python para medir el rendimiento de LLM
Puede usarse para evaluar retrieval-augmented generation (RAG) y otras aplicaciones construidas con LlamaIndex o LangChain, así como para líneas base y benchmarks de modelos
DeepEval evalúa exactitud, relevancia y consistencia para ofrecer valoraciones más confiables en escenarios reales, más allá de métricas de coincidencia de palabras
Incluye métricas como detección de alucinaciones, relevancia de respuestas y optimización de hiperparámetros, y admite GEval para crear métricas personalizadas según cada caso de uso

90. FastMCP

Model Context Protocol (MCP) se está consolidando rápidamente como un estándar para proporcionar contexto y herramientas a las aplicaciones con LLM
Sin embargo, implementar servidores MCP por lo general incluye una cantidad considerable de código repetitivo para configuración, manejo del protocolo y gestión de errores
FastMCP es un framework de Python que simplifica este proceso al abstraer la complejidad del protocolo y permitir que los desarrolladores definan recursos y herramientas MCP mediante decoradores intuitivos de Python
Esta abstracción permite que los equipos se enfoquen en la lógica de negocio, lo que da lugar a implementaciones MCP más limpias y fáciles de mantener

91. LiteLLM

LiteLLM es un SDK que ofrece integración fluida con múltiples proveedores de LLM a través de un formato de API estandarizado de OpenAI
Soporta una amplia variedad de proveedores y modelos, y ofrece una interfaz unificada para completado de texto, embeddings y generación de imágenes
Al abstraer las diferencias entre las APIs de cada proveedor, LiteLLM simplifica la integración y enruta automáticamente las solicitudes al endpoint de modelo correcto
A través de su framework proxy, también incluye capacidades de nivel de producción como guardrails, caché, logging, limitación de tasa y balanceo de carga

92. MLForecast

MLForecast es un framework y biblioteca de Python para pronóstico de series temporales que aplica modelos de machine learning a conjuntos de datos a gran escala
Simplifica el proceso, normalmente complejo, de ingeniería de características automatizada, incluyendo lags, estadísticas móviles y funciones basadas en fechas
Es una de las pocas bibliotecas con soporte nativo para frameworks de cómputo distribuido como Spark y Dask, lo que garantiza escalabilidad
También soporta pronóstico probabilístico usando métodos como conformal prediction, proporcionando medidas cuantitativas de la incertidumbre en las predicciones

93. Nuxt

Nuxt es un meta framework opinado construido sobre Vue.js para crear aplicaciones web full-stack, y a menudo se le conoce como el “Next.js para Vue.js”
Al igual que su contraparte en React, Nuxt ofrece funciones favorables para SEO como prerenderizado, renderizado del lado del servidor (SSR) y gestión de metadatos
Nuxt cuenta con el respaldo de Vercel, la misma empresa detrás de Next.js, y con el apoyo de una comunidad sólida y un ecosistema de módulos oficiales y de terceros
Estos módulos simplifican la integración de funciones como procesamiento de imágenes, sitemap y Tailwind CSS

94. Phoenix

Siguen teniendo experiencias positivas con Phoenix, un framework web MVC del lado del servidor escrito en Elixir
Phoenix se basa en el aprendizaje de Ruby on Rails sobre desarrollo rápido de aplicaciones y experiencia del desarrollador, al tiempo que evoluciona con un paradigma de programación funcional
En este volumen destacan el lanzamiento de Phoenix LiveView 1.0
LiveView es una solución HTML-over-the-wire similar a HTMX o Hotwire, que permite a los desarrolladores crear experiencias de usuario ricas y en tiempo real con HTML completamente renderizado en el servidor

95. Presidio

Presidio es un SDK de protección de datos para identificar y anonimizar datos sensibles en texto estructurado y no estructurado
Usa reconocimiento de entidades nombradas, expresiones regulares y lógica basada en reglas para detectar información de identificación personal (PII), como números de tarjeta de crédito, nombres y ubicaciones
Presidio soporta reconocedores de entidades personalizados y pipelines de anonimización, para que las organizaciones puedan ajustarlo a sus propios requisitos de privacidad y cumplimiento
El equipo usa Presidio al integrarlo con LLM en entornos empresariales con controles estrictos sobre el intercambio de datos

96. Pydantic AI

Pydantic AI sigue demostrando ser un framework open source estable y bien respaldado para construir agentes de GenAI en producción
Construido sobre la base confiable de Pydantic, ofrece una sólida seguridad de tipos, visibilidad de primera clase mediante OpenTelemetry y herramientas integradas de evaluación
El lanzamiento de la versión 1.0, el 4 de septiembre de 2025, marca un hito importante en su madurez
Desde entonces se ha vuelto confiable y ampliamente adoptado por su simplicidad y mantenibilidad, sumándose a la fila de otros frameworks populares de agentes como LangChain y LangGraph

97. Tauri

Tauri es un framework para construir aplicaciones de escritorio de alto rendimiento usando una sola base de código de UI web
A diferencia de wrappers web tradicionales como Electron, Tauri está construido sobre Rust y aprovecha el webview nativo del sistema operativo para ofrecer binarios más pequeños y mayor seguridad
Evaluaron Tauri por primera vez hace algunos años y desde entonces se ha expandido más allá del escritorio con soporte para iOS y Android
La versión más reciente incorpora un modelo más flexible de permisos y alcances, reemplaza la lista anterior de permisos y cuenta con una capa mejorada de comunicación entre procesos (IPC) que soporta transferencia de datos en bruto y mejora el rendimiento

Assess

98. Agent Development Kit (ADK)

Agent Development Kit (ADK) es un framework para desarrollar y desplegar agentes de IA que aplica disciplinas modernas de ingeniería de software en lugar de depender únicamente del prompting
Introduce abstracciones familiares como clases, métodos, patrones de workflow y soporte de CLI
En comparación con frameworks como LangGraph o CrewAI, la fortaleza de ADK está en su integración profunda con la infraestructura de IA de Google, ofreciendo grounding listo para empresa, acceso a datos y monitoreo
Está diseñado para la interoperabilidad y soporta el A2A protocol para wrappers de herramientas y comunicación entre agentes

99. Agno

Agno es un framework para construir, ejecutar y administrar sistemas multiagente
Ofrece la flexibilidad de crear agentes completamente autónomos o workflows controlados basados en pasos, e incluye soporte integrado para human-in-the-loop, gestión de sesiones, memoria y conocimiento
Valoran mucho su enfoque en la eficiencia, con tiempos de arranque de agentes impresionantes y bajo consumo de memoria
Agno viene con su propio runtime, AgentOS, una aplicación FastAPI con un plano de control unificado para pruebas, monitoreo y administración simplificados de sistemas de agentes

100. assistant-ui

assistant-ui es una biblioteca open source de TypeScript y React para interfaces de chat con IA
Maneja las partes complejas de implementar una UI de chat, como streaming, gestión de estado y funciones de UX comunes para edición de mensajes y cambio entre ramas, mientras permite a los desarrolladores diseñar sus propios componentes usando primitivas de Radix
Soporta integración con runtimes populares, incluyendo Vercel AI SDK y LangGraph, y ofrece soluciones de runtime personalizables para casos de uso complejos
Han construido con éxito una interfaz de chat simple con assistant-ui y están satisfechos con el resultado

101. AutoRound

AutoRound de Intel es un algoritmo avanzado de cuantización para comprimir modelos de IA de gran tamaño, como LLM y vision language models (VLM), minimizando la pérdida de precisión
Usa optimización sign-gradient descent para reducir el tamaño del modelo a anchos de bit ultrabajos (2-4 bits) y aplica anchos de bit mixtos en todas las capas para lograr una eficiencia óptima
Este proceso de cuantización también es muy rápido: puede cuantizar un modelo de 7 mil millones de parámetros en unos minutos con una sola GPU
AutoRound se integra con motores de inferencia populares como vLLM y Transformers, lo que lo convierte en una opción atractiva para la cuantización de modelos

102. Browser Use

Browser Use es una librería open source de Python que permite a agentes basados en LLM operar navegadores web e interactuar con aplicaciones web
Puede navegar, ingresar datos y extraer texto, y también administrar múltiples pestañas para coordinar tareas entre aplicaciones
La librería es especialmente útil cuando los agentes de IA necesitan acceder, manipular o recuperar información desde contenido web
Soporta varios LLM y aprovecha Playwright para combinar comprensión visual con extracción de estructura HTML y así lograr interacciones web más ricas

103. DeepSpeed

DeepSpeed es una librería de Python que optimiza el deep learning distribuido tanto para entrenamiento como para inferencia
Para entrenamiento, integra técnicas como Zero Redundancy Optimizer (ZeRO) y paralelismo 3D para escalar modelos eficientemente en miles de GPU
Para inferencia, combina paralelismo de tensor, pipeline, expertos y ZeRO con kernels personalizados y optimizaciones de comunicación para minimizar la latencia
DeepSpeed impulsa algunos de los modelos de lenguaje más grandes del mundo, incluidos Megatron-Turing NLG (530B) y BLOOM (176B)

104. Drizzle

Drizzle es un ORM ligero para TypeScript
A diferencia de Prisma ORM, ofrece a los desarrolladores tanto una API simple similar a SQL como una interfaz de consultas de estilo ORM más tradicional
También soporta extraer el esquema desde bases de datos existentes, lo que permite enfoques tanto database-first como code-first
Drizzle fue diseñado pensando en entornos serverless, tiene un tamaño de bundle pequeño y soporte para prepared statements

105. Java post-quantum cryptography

Las computadoras cuánticas siguen avanzando rápidamente, y ofertas SaaS como AWS Braket ahora dan acceso a algoritmos cuánticos en múltiples arquitecturas
Desde marzo, Java 24 introdujo Java post-quantum cryptography, sumando soporte para algoritmos de criptografía poscuántica como ML-KEM y ML-DSA
.Net 10 también amplía ese soporte
La recomendación es simple: si construyes software en estos lenguajes, empieza desde ahora a adoptar algoritmos resistentes a la computación cuántica para preparar tus sistemas para el futuro

106. kagent

Kagent es un framework open source para ejecutar IA basada en agentes dentro de clústeres de Kubernetes
Permite que agentes basados en LLM planifiquen y ejecuten tareas operativas, como diagnosticar problemas, modificar configuraciones e interactuar con herramientas de observabilidad, mediante APIs nativas de Kubernetes e integración con Model Context Protocol (MCP)
El objetivo es llevar "AgentOps" a la infraestructura cloud native combinando gestión declarativa con razonamiento autónomo
Como proyecto Sandbox de la CNCF, Kagent debe adoptarse con cuidado, especialmente considerando los riesgos de otorgar capacidades de gestión operativa a un LLM, y técnicas como toxic flow analysis pueden ser especialmente valiosas para evaluar y mitigar esos riesgos

107. LangExtract

LangExtract es una librería de Python que usa LLM para extraer información estructurada de texto no estructurado según instrucciones personalizadas
Procesa materiales específicos de dominio, como notas clínicas e informes, para identificar y organizar detalles clave, manteniendo la trazabilidad de cada dato extraído hasta su fuente
Las entidades extraídas pueden exportarse a archivos .jsonl (un formato estándar para datos de modelos de lenguaje) y visualizarse mediante una interfaz HTML interactiva para revisar el contexto
El equipo evaluó LangExtract para extraer entidades y poblar grafos de conocimiento de dominio, y encontró que es eficaz para transformar documentos complejos en representaciones estructuradas y legibles por máquina

108. Langflow

Langflow es una plataforma open source de low-code para construir y visualizar flujos de trabajo con LLM
Construida sobre LangChain, permite a los desarrolladores encadenar prompts, herramientas, bases de datos vectoriales y componentes de memoria mediante una interfaz de arrastrar y soltar, al tiempo que soporta código Python personalizado para lógica avanzada
Es especialmente útil para prototipar aplicaciones de agentes sin escribir código completo de backend
Sin embargo, Langflow sigue siendo relativamente nueva y aún tiene algunas asperezas para uso en producción, además de que aquí también aplican las precauciones habituales sobre las plataformas low-code

109. LMCache

LMCache es una solución de caché clave-valor (KV) para acelerar infraestructura de serving de LLM
Actúa como una capa de caché especializada a lo largo de todo un pool de motores de inferencia de LLM, almacenando entradas de caché KV precalculadas para texto que probablemente se procese varias veces, como historiales de chat o colecciones de documentos
Al mantener estos valores en disco, descarga de la GPU los cálculos de prefill para reducir el time-to-first-token (TTFT) y bajar los costos de inferencia en cargas de trabajo exigentes, como pipelines RAG, aplicaciones de chat multi-turno y sistemas de agentes
Es posible integrar LMCache con servidores de inferencia importantes como vLLM o NVIDIA Dynamo, y vale la pena evaluar su impacto en la configuración

110. Mem0

Mem0 es una capa de memoria diseñada para agentes de IA
Los enfoques ingenuos suelen guardar todo el historial de chat en una base de datos y reutilizarlo en conversaciones futuras, lo que lleva a un uso excesivo de tokens
Mem0 reemplaza esto con una arquitectura más sofisticada que separa la memoria en recuperación de corto plazo y una capa inteligente de largo plazo que solo extrae y almacena hechos y relaciones destacados
La arquitectura combina un almacén vectorial para similitud semántica con un grafo de conocimiento para comprender datos temporales y relacionales

111. Open Security Control Assessment Language (OSCAL)

Open Security Controls Assessment Language (OSCAL) es un formato abierto e interpretable por máquinas para el intercambio de información, diseñado para aumentar la automatización en cumplimiento y gestión de riesgos, y ayudar a los equipos a alejarse de enfoques manuales basados en texto
Liderado por el Instituto Nacional de Estándares y Tecnología de EE. UU. (NIST), OSCAL ofrece representaciones estándar en XML, JSON y YAML para expresar controles de seguridad relacionados con marcos de la industria como SOC 2 y PCI, así como marcos gubernamentales como FedRAMP de EE. UU., Cybersecurity Control Catalogue de Singapur e Information Security Manual de Australia
Aunque OSCAL aún no ha sido ampliamente adoptado fuera del sector público y su ecosistema sigue madurando, entusiasma su potencial para simplificar las evaluaciones de seguridad, reducir la dependencia de hojas de cálculo y ejercicios de marcar casillas, y permitir el cumplimiento automatizado cuando se integra en plataformas de compliance-as-code y continuous compliance

112. OpenInference

OpenInference complementa OpenTelemetry con un conjunto de convenciones y plugins diseñados para observar aplicaciones de IA
Proporciona instrumentación estandarizada para frameworks y bibliotecas de aprendizaje automático, ayudando a los desarrolladores a rastrear llamadas a LLM junto con el contexto circundante, como búsquedas en almacenes vectoriales o llamadas a herramientas externas sobre API y motores de búsqueda
Los spans pueden exportarse a cualquier recolector compatible con OTEL, lo que garantiza alineación con los pipelines de telemetría existentes
Anteriormente destacamos Langfuse como una plataforma de visibilidad para LLM de uso general, y el OpenInference SDK puede registrar trazas en Langfuse y otras plataformas de visibilidad compatibles con OpenTelemetry

113. Valibot

Valibot es una biblioteca de validación de esquemas para TypeScript
Como otras bibliotecas populares de validación para TypeScript, como Zod y Ajv, ofrece inferencia de tipos, pero se diferencia por su diseño modular
Esta arquitectura permite que los bundlers realicen tree shaking y code splitting de forma efectiva, incluyendo solo las funciones de validación que realmente se usan
Valibot puede reducir el tamaño del bundle hasta en un 95% frente a Zod en escenarios óptimos, lo que la convierte en una opción atractiva para validación de esquemas en entornos donde el tamaño del bundle es importante, como validación del lado del cliente o funciones serverless

114. Vercel AI SDK

Vercel AI SDK es un toolkit open source full-stack para crear aplicaciones y agentes impulsados por IA en el ecosistema TypeScript
Consta de dos componentes principales: AI SDK Core estandariza las llamadas a LLM de forma independiente del modelo, con soporte para generación de texto, generación de objetos estructurados y llamadas a herramientas
AI SDK UI, de forma similar a assistant-ui, simplifica el desarrollo frontend en React, Vue, Next.js y Svelte con streaming, gestión de estado y actualizaciones de UI en tiempo real
Para equipos que ya trabajan dentro del ecosistema de TypeScript y Next.js, Vercel AI SDK ofrece una forma rápida y fluida de crear aplicaciones de IA con experiencias ricas del lado del cliente

Publicado Thoughtworks Technology Radar, Volumen 33

Introducción de orquestación de infraestructura en IA

Auge de los agentes basados en MCP

Flujos de trabajo de codificación con IA

Aparición de nuevos antipatrones de IA

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

Trial

Assess

Hold

[Platforms]

Adopt

Trial

Assess

[Tools]

Adopt

Trial

Assess

[Languages and Frameworks]

Adopt

Trial

Assess

Lecturas relacionadas

Aún no hay comentarios.