Cuatro de los programas de inteligencia artificial más populares colapsaron y se quemaron en una competencia de inversión en criptomonedas, y la mayoría perdió más del 50% del dinero que debían maximizar.
Sólo dos programas chinos han logrado generar incluso un beneficio modesto.
el experimento Arena Alfa La competencia de la compañía Nof1 dio a seis modelos de IA $10,000, datos de entrada idénticos e incentivó a todos a ganar la mayor cantidad de dinero posible negociando acciones criptográficas en el mercado abierto del 17 de octubre al 3 de noviembre.
El objetivo: encontrar qué robot podría hacerte rico mejor.
Jay Azhang, de 34 años, dijo al Post que el objetivo de su proyecto (y de futuras iteraciones de la competencia) es ayudar a la persona promedio a obtener las mejores herramientas para ganar dinero.
“Nuestro objetivo es ayudar a las personas a comerciar mejor y, con suerte, darles acceso a los últimos modelos de comercio”, dijo Azhang. “Es un área de investigación única.
“Nadie más está realmente entrenando estos modelos para observar todos estos números”.
Programas de IA Grok de xAI; Claude Soneto de Antrópico; Géminis de Google; ChatGPT de OpenAI y los robots chinos Deepseek y Qwen aseguraron los premios de cinco cifras y se les pidió que tomaran todas las demás decisiones, incluso si apostar a largo o corto en su elección de criptomonedas.
Los bots pudieron invertir en criptomonedas blockchain Bitcoin,
Azhang dijo que el mercado de criptomonedas, en lugar de negociar acciones y participaciones, obtuvo el mejor desempeño para las métricas de competencia debido a los datos de blockchain fácilmente disponibles, el ciclo de negociación de 24 horas y la falta de influencia y ventajas que los comerciantes individuales tienen sobre los fondos de cobertura en otros mercados financieros.
“Además, un poco más de volatilidad”, dijo Azhang sobre el mercado de criptomonedas. “Así que es un poco más emocionante”.
Los resultados mostraron una incompetencia sorprendente.
ChatGPT, el bot más popular según Contraestadísticaterminó con sólo $3,794, una caída del 63%.
El segundo peor fue Gemini, con una caída del 56% y solo quedaban $4,485, a pesar de tener el mayor número de transacciones, 272.
Grok de Elon Musk y Claude Sonnet de Anthropic tuvieron un desempeño deficiente y en ocasiones fueron rentables durante la prueba de 17 días. Pero Grok terminó con una caída del 45% con 5.226 dólares, mientras que Claude Sonnet se embolsó 6.740 dólares, un 30% menos.
El modelo chino Deepseek vio caer sus beneficios en los últimos días de negociación, pero se encontró en números positivos: con 10.476 dólares para un modesto rendimiento del 4%. Estaba al 100% alrededor del 26 de octubre.
Qwen, de la empresa china Alibaba, fue el más volátil: operó con pérdidas en sus inversiones iniciales durante los primeros tres días y luego vertió con éxito todos sus fondos restantes, excepto 90 dólares, en una posición larga en Bitcoin. Ganó la competencia con un crecimiento del 20% y $12,287.
Durante el período del 17 de octubre al 3 de noviembre, Bitcoin bajó un 0,44 por ciento, Ethereum bajó un 11 por ciento, XRP subió un 0,87 por ciento, BNB bajó un 8 por ciento, Doge bajó un 10 por ciento y Solana subió poco más del 1 por ciento, según datos de Coinbase.
“Es difícil decir qué podemos sacar de esto”, dijo Azhang. “Una cosa que sabemos es que hay patrones dentro de los modelos y están claramente sesgados y tienen preferencias.
“Por ejemplo, Claude casi siempre es largo y se niega a ser bajo. Es como un eterno optimista, mientras que Géminis está feliz de ser bajo”, dijo Azhang. “Claramente tienen estos sesgos inductivos cuando se trata de comercio”.
Alpha Arena está planeando una próxima ronda que agregará más modelos de inteligencia artificial y también asignará a los programas la negociación de acciones y criptomonedas.
“Apenas estamos comenzando”, dijo Azhang al Post.



