最近AI圈和投资圈都被一场炒股大赛刷屏啦!
起因是一家名叫Nof1的初创公司组织了一场AI炒股大赛——Alpha Arena。
这并非是模拟盘,而是实打实的给每个AI 工具一万美金,让它们自己炒股,并对收益进行24小时监控。
此次比赛从美东时间10月18号开始,为期2周,在11月3号结束,目前是第四天。

参赛的AI选手阵容堪称豪华,汇集了国内外最顶级的AI模型。
海外组: OpenAI的GPT-5、谷歌的Gemini 2.5 Pro、马斯克的Grok 4,以及Anthropic的Claude Sonnet 4.5。
国内组: 阿里通义Qwen3 Max和幻方量化背景的DeepSeek chat v3.1。
那么,几天过去了,看看这些AI究竟谁是股神,谁又成了韭菜?
看到结果后,你绝对会大吃一惊。

截至北京时间晚上22:00,数据显示,收益率最多的是DeepSeek,目前达到13%的收益率,而昨天这一数据达到了惊人的40%。

而收益率最低的居然是用户量最多的GPT-5,目前账户还剩5414美金,亏损高达45.81%,属实是亏麻了!
纵观整个收益曲线,GPT-5只有在比赛开始的时候小有盈利,其他时间都在亏,特别是19号以后,收益曲线一降再降,根本就止不住。

收益率仅次于DeepSeek的是Grok 4,目前收益是11.7%,此前最高的收益率是38.15%。
和GPT-5相反的是,除了在第一天亏了点外,其余时间都在盈利,曾经有段时间收益率一度接近DeepSeek。

排名第三的则是Claude sonnet 4.5,目前收益是11.45%,此前最高的收益率达到28.08%。
整体看下来,Claude sonnet 4.5可圈可点,此前很长一段时间都在和Grok争夺老二的位置。

排名第四的是Qwen3 Max,还属于小盈利阶段,目前资金是10326美金,赚了326美金。
不过这四天绝大部分时间都是亏损的状态,目前在盈亏线上疯狂挣扎。

除了GPT-5外,Gemini 2.5 Pro同样也亏麻了,目前本金还剩下5037美金。
情况和GPT-5一样,除了在第一天稍有盈利外,其余时间都在亏,和GPT-5争夺倒数第一。

细看这四天的收益率,DeepSeek长期霸榜第一,Grok紧随其后,其次是Claude sonnet 4.5、Qwen3 Max、垫底是两位大聪明,分别是Gemini 2.5 Pro,GPT-5。

该网站不仅可以24小时监控收益率,还能详细记录每款模型的交易过程。
不过,Deepseek如此表现也不意外。
Deepseek 背后的幻方量化,是管理规模超千亿人民币的量化巨头,十几年来积累了海量的交易数据和策略。
而其他都是纯互联网玩家出身,有点专业拳击手绞杀业余选手的感觉。
比如,DeepSeek的策略极其简洁有效,开盘后迅速全仓杀入,以15倍杠杆做多以太坊等多个主流币种,然后就坚定持有。
这种看似简单的“All in and Hold”策略,在过去几天的上涨行情中为它带来了丰厚的回报,一度盈利接近40%,不过后续随着市场的波动收益逐渐跌落了下来。

GPT-5作为场上最受瞩目的明星选手,它的表现可以说让所有人大跌眼镜,开局就采取了错误的看空策略,导致了重大亏损。
后续同样也是因为看空策略,一路狂跌。

还有同样难兄难弟的Gemini 2.5 Pro,它的表现完美诠释了什么叫“操作越多,亏得越多”。
它是全场交易最频繁的选手,短短几天就交易了70次, 一会儿看空,一会儿又反手追多,策略摇摆不定。
这种“追涨杀跌”式的操作,加上高昂的交易手续费,使其账户净值大幅缩水。

同样激进的还有Grok 4,它和DeepSeek一样,选择了全仓做多的策略,在市场上涨时迅速积累了大量资金。
不过由于经常满仓,波动较大并不稳定。

而最稳健的选手莫过于 Claude sonnet 4.5,它的仓位最少,交易风格沉稳,它似乎更倾向于在看准机会后才出手。
Qwen 3似乎和比特币杠上了,很长时间的仓位都是比特币。

为什么这场比赛值得这么多人关注?
这场比赛最有趣的地方在于,它把AI从枯燥的榜单,扔进了最真实、最不可预测的金融市场。
过去,我们用MMLU、ImageNet这些静态的排行榜来衡量AI的能力。
但市场不一样,它是一个由无数信息、情绪构成的生命体,在这里,没有标准答案,只有不断变化的概率。
模型不仅仅要去分析数据,还要去分析市场的情绪,跟一个真正的交易员一样。
看到DeepSeek的战绩,估计已经有不少朋友心动了,“以后是不是跟着AI炒股就行了”
虽然AI能快速整合分析海量信息,比如,它可以在几秒钟内读完一家公司所有的财报和研报,给出逻辑清晰的方案。
但它的弱点也很明显:它无法提前知道任何内幕信息或市场突发动态以及了解你的财务状况、风险偏好等等。
或许,最佳的组合,永远是AI工具 + 人类的智慧与直觉。
这场AI投资大赛才刚刚开始,目前的胜负还远未决定。
但它似乎向我们展示了每款模型的不同性格,有激进性、有沉稳性。
同时它们也和广大的股民一样,一样有可能沦为绿油油的韭菜,比如GPT-5和Gemini 2.5 Pro。