



¿Qué pasaría si le dieras a GPT-5 $10,000 para invertir en criptomonedas? ¿Qué pasaría si se lo dieras a otros modelos al mismo tiempo y estuvieran compitiendo entre sí? Esa es solo la idea que tuvieron Nof1…y el resultado es fascinante.
Seis modelos que invierten en criptomonedas. Con Alpha Arena, los responsables de Nof1 han creado un nuevo punto de referencia que, en su opinión, “se vuelve más difícil cuanto más inteligente es la IA”. La idea es relativamente simple: medir el desempeño de seis modelos de vanguardia para ver cómo se desempeñan cuando recibes $10,000 (en términos reales) e inviertes en criptomonedas en mercados reales. Los candidatos son los siguientes:
- GPT-5
- Géminis 2.5 Pro
- Soneto de Claudio 4.5
- Grok 4
- Chat DeepSeek v3.1
- Qwen 3 Max
DeepSeek y Qwen triunfan, GPT-5 y Gemini se hunden. El resultado de estos 11 días desde el inicio de esta “carrera” es fascinante. Los dos modelos chinos DeepSeek y Qwen han conseguido enormes ventajas: el rendimiento de DeepSeek es actualmente del 97% (antes era del 123%), mientras que Qwen no está mal con un 53%. Claude (0,84%) y Grok (-8,2%) aguantan o pierden fácilmente, pero cuidado porque GPT-5 (-65,7%) y Gemini 2.5 Pro (66%) están perdiendo actualmente dos tercios de sus inversiones.
Activos criptográficos que van y vienen. Para este experimento, los modelos pueden invertir en seis de las criptomonedas más relevantes del mercado: Bitcoin, Ethereum, Dogecoin, Ripple, Solana y BNB. Los modelos deciden si se toman posiciones en una o más posiciones, así como el nivel y nivel de apalancamiento. Los puestos suelen ocuparse durante unas pocas horas, pero en algunos casos pueden ocuparse durante días.
aprende poco a poco. Todos compiten desde el 18 de octubre del año pasado en la “primera temporada” de un experimento que durará hasta el 3 de noviembre. Explica a sus creadoresEsta primera iteración nos permitirá sacar conclusiones iniciales sobre cómo funcionan estos modelos en las finanzas.
Venimos aquí para ganar dinero.. El objetivo es simple: maximizar las ganancias y minimizar las pérdidas (PnL). Esta primera temporada es exactamente eso, porque a partir de ahí aplicaremos lo que hemos aprendido después de cada temporada para refinar las indicaciones y agregar nuevas características al experimento, creando modelos que teóricamente funcionan cada vez mejor a la hora de invertir en los mercados financieros.
Comercio algorítmico en su máxima expresión. Lo que hacen estos modelos sería una locura para los inversores humanos, especialmente porque todos ellos no sólo se exponen a la volatilidad del mercado criptográfico, sino que también la multiplican porque aprovechan la volatilidad. Aprovechar (Aprovechar). Con este mecanismo puedes obtener enormes beneficios mucho más rápido, pero el riesgo también es extremo. De hecho, los modelos utilizan un apalancamiento absolutamente excepcional de 20x o 25x y pueden tomar posiciones cortas (cortas, «apuestas» a que el precio de un activo bajará) o posiciones largas (largas, «apuestas» a que el precio del activo subirá).
Las máquinas no entran en pánico. Para intentar controlar estos riesgos, los modelos incluyen reglas claras en sus indicaciones con respecto a los límites de riesgo (por ejemplo, establecer señales claras de límite de pérdidas) o la confianza en sus criterios. Y es más, los siguen, lo que permite a los modelos mantener su posición a menos que se produzcan estas señales. Por cierto, aquí estamos hablando de operaciones de frecuencia media o baja: las decisiones se toman en minutos o incluso horas, no en microsegundos. Esto, dicen los creadores, responde a la pregunta de si un modelo puede tomar buenas decisiones si tiene suficiente tiempo e información.
Ni se te ocurra hacerlo en casa.. Este experimento es sólo eso, un experimento, y en términos financieros, de hecho, se ha filtrado por todas partes. En primer lugar, porque el periodo de prueba de esta primera temporada es extremadamente corto y no permite evaluar el comportamiento a largo plazo. Y por último (entre otras muchas cosas) porque la información a la que tienen acceso los modelos es muy limitada. No tienen en cuenta ninguna noticia relacionada con este ámbito y sólo cuentan con datos numéricos correspondientes a precios medios y volúmenes actuales e históricos, así como algunos indicadores técnicos. Esta información.
Los modelos lo cuentan todo.. Una de las secciones de la interfaz muestra el “Chat de Modelo”, donde puedes ver cómo cada modelo “refleja” su posición. Si hacemos clic en esta reflexión podremos ver todos los datos actuales e históricos con los que trabajó para tomar esta decisión (mantengo mi postura, la cambio) y así podremos conocer los motivos de su mudanza en cualquier momento.
Sólo porque estén ganando ahora no significa que sean los mejores.. Los responsables de Nof1 explican que no se trata de declarar el mejor de los seis modelos de trading, porque es sólo un experimento. Como dicen, «Somos profundamente conscientes de las deficiencias de esta primera temporada, que incluyen, entre otras: sesgo de respuesta, tamaños de muestra limitados/falta de precisión estadística y la brevedad del período de evaluación». Este experimento se repetirá a lo largo de diferentes temporadas y se agregarán nuevas características a los mecanismos de toma de decisiones y a la información disponible para los modelos, y sin duda todo esto ayudará a determinar mejor el comportamiento de estos modelos y tal vez a aclarar si algunos realmente se comportan consistentemente mejor que otros. Fascinante.
Imagen | Aedrian Salazar
En | Un país ha emprendido el experimento de criptomonedas más grande del mundo: Bután y las 800.000 tarjetas de identificación de Ethereum











