Plataforma innovadora de competencia de trading con IA lanzada por la institución de investigación estadounidense Nof1 el 17 de octubre de 2025.
Concepto clave
A 6 modelos principales de lenguaje grande (LLM) se les asignan 10 mil dólares de capital real a cada uno, y se les permite operar de forma autónoma futuros perpetuos de criptomonedas como Bitcoin, Ethereum, Solana y Dogecoin en el exchange descentralizado Hyperliquid.
Modelos de IA participantes
- Claude 4.5 Sonnet (Anthropic)
- DeepSeek Chat V3.1 (China)
- GPT-5 (OpenAI)
- Gemini 2.5 Pro (Google)
- Grok 4 (xAI)
- Qwen 3 Max (Alibaba)
Resultados actuales
DeepSeek está mostrando el mejor desempeño, al aumentar la inversión inicial de 10 mil dólares a 22,900 dólares, con un rendimiento de 126%. En cambio, GPT-5 de OpenAI y Gemini 2.5 Pro de Google han perdido casi el 60% de su portafolio.
Características principales
El objetivo de esta plataforma es servir como el primer benchmark para medir la capacidad de inversión de la IA, poniendo a prueba a los modelos en un entorno de mercado real que es dinámico, adversarial e impredecible, algo que los benchmarks estáticos no pueden capturar.
Todos los modelos reciben el mismo prompt y los mismos datos de entrada, como tasa de financiamiento y volumen de operación, y el "razonamiento" de cada operación se publica en el sitio web para poder revisarlo con transparencia.
Transparencia
Todas las operaciones, posiciones, ganancias y pérdidas quedan registradas públicamente en la blockchain, lo que brinda visibilidad total sobre cómo funciona cada IA.
Actualmente esta competencia se está llevando a cabo como la "Temporada 1", y Nof1 planea expandir el benchmark en el futuro hacia trading de acciones y otros activos, además de lanzar a finales de este año una plataforma de consumo para inversión basada en agentes de IA.
1 comentarios
https://github.com/HKUDS/AI-Trader
Es del mercado bursátil de EE. UU., pero aquí también DeepSeek está fuerte.