GeekNews Recientes Comentarios Archivo
◀ Año anterior | ◁ Mes anterior | << Semana anterior | < Día anterior | 2026-02-18 | Día siguiente > | Semana siguiente >> | Mes siguiente ▷
21
 

SkillsBench: un benchmark para evaluar el rendimiento de las habilidades de los agentes en diversas tareas

(arxiv.org)
SkillsBench mide cómo las habilidades afectan el rendimiento de agentes LLM en 84 tareas de 11 dominios, mostrando mejoras promedio con habilidades curadas pero no con habilidades autogeneradas.
3 puntos por GN⁺ 2026-02-18 | 1 comentarios
22
 

El renacer de Triforce

(dolphin-emu.org)
Dolphin ahora emula por completo la plataforma arcade Triforce y amplía su alcance como emulador de preservación para GameCube, Wii y Triforce.
5 puntos por GN⁺ 2026-02-18 | 2 comentarios
GeekNews | Acerca de Términos Privacidad Contacto
GeekNews es una plataforma de noticias de tecnología que selecciona novedades sobre tecnología e IA.