出品 | 妙投APP
作者 | 段明珠
编辑 | 关雪菁
头图 | AI生成
用AI搞投资,全球最顶级的6个 AI 大模型,谁是理论家,谁是实战派?
要说在国际 AI 圈里, GPT 和 Claude 的热度绝对更高,但意料之外情理之中的是,当下正在进行的一场金融实战比赛中,从大A身经百炼锻炼出的 DS 表现更优异,而 Qwen 的半路超车亦很惊艳。
目前,前两名分别是幻方 DeepSeek V3.1 Chat 和阿里 Qwen 3 Max,收益率把后面几位远远抛下;在保本线上“挣扎”的是马斯克的 Grok 4 和 Anthropic 旗下的 Claude 4.5 Sonnet ;一度爆亏70%左右的是谷歌的 Gemini 2.5 Pro 和 OpenAI 开发的 GPT-5,估计比赛剩下时间都要在漫漫回本路上。
这场比赛由美国实验室 Nof1 启动,这是家号称首个专注于金融市场的 AI 实验室,这次其向六个顶尖的大模型各提供10,000美元的真实资金,让它们在真实市场中,用真金白银进行投资比赛。
这本质上是一次针对 AI 模型交易能力的压力测试,而非单纯的市场表现对比。核心在于观察不同 AI 在真实波动市场中的策略有效性、风险控制及执行纪律。
随着比赛推进,AI 似乎也展现出不同性格,DS 稳健得像个量化老手,与之形成鲜明对比的是 GPT ,被网友调侃“交易风格神似散户”;Claude 的谨慎像个保守的基金经理,而 Qwen 则是看准机会就全仓押注一只。
为何这些 AI 表现差异如此巨大?与背后各家平台有何关系?这场比赛 AI 的决策依据主要是数据技术分析,这对普通投资者的借鉴和警示又是什么?
差异从何而来?
先看这些 AI 的具体操作。
这次比赛的规则比较简单:
6个 AI 各1万美元用来实时跟进虚拟货币永续合约,全天候可实时观看;
跟踪标的仅限于6种主流品种;
自行确定策略(仓位、看涨或看跌等);
比赛开始于美东时间10月18日,将持续两周,于11月3日结束;
胜负标准是风险调整后的收益,不光看赚多少,还得看承担多大风险。
从开始至今,这场金融实战比赛已经历2轮淘汰赛。

第一波被淘汰的是,Gemini 和 GPT-5。
不得不说这次比赛的时机很好。前不久,全球资本市场刚经历了黑天鹅事件,所以比赛开始正处于价格相对低点,适合建仓。
开始第一天,各家 AI 落子就显出差异。
DS 全仓全覆盖做多,且杠杆在10到15倍,相当于自己设计并持有 A6 指数,且不换手不止损不止盈,只要价格大趋势上涨,就可躺赢;甚至稳妥起见,还预留了几千美元现金备用。
Grok开始也是全多头布局,但交易风格更为激进,收益率和 DS 追得比较近;Claude 分析能力强,但执行却犹豫不决,经常调仓失败、反复止损,收益曲线在零轴上下反复。
此时 Qwen、Gemini 和 GPT-5 微亏。但亏损原因大为不同,Qwen 选择每天押注一个标的,所以小亏小赚,还不显山露水。
而 Gemini 就比较像韭菜,策略漂移,先开空单,但遇到市场反弹,于是平仓,随即转为做多,但又同时做空别的……就这样不断地开仓平仓,先空后多,摇摆不定;不仅产生高额交易成本,后续还在频繁交易中错过主升浪。
举个简单的例子,Gemini 的操作相当于在8月“易中天”主升浪的时候,做多中际旭创的同时做空新易盛,过了一天又完全反转过来。
就这样 Gemini 成了第一阶段损失最大的。
GPT-5 也有同样问题,只是此时还有 Gemini 给它垫底。
真正拉开差距是在19日下午。DS 和 Grok 开始大涨,而 GPT-5 和 Gemini 掉头急转直下。究其原因是跟踪资本市场在回调后迎来一波强劲反弹,做多的 DS 吃到红利;而 Gemini 一看到下跌就去做空,结果在这波拉升中爆亏,亏损率超40%。
第二波被淘汰的是,Grok 和 Claude。当然,如今它俩的收益曲线回升到零轴以上;难过的是早被淘汰的两个在这波中被甩得更远,尤其是 GPT-5 亏损率最高时超过75%,比赛期间几乎难以翻身。
当市场迎来一次更深的回调,所有模型也在22日凌晨经历了一次大跌。期间 Claude 直接从赚到赔,Grok 也回吐完盈利开始一路下滑;DS 的稳健此时发挥了作用,仅微亏一点很快又开始赚钱。
有意思的是,Grok 持仓中分给更依赖马斯克叙事红利的虚拟资产更多份额,但这种缺乏基本面支撑,一旦市场情绪退潮便快速回吐收益。
反观 GPT-5 和 Gemini ,两者都对走势判断完全错误,在这次回调中越跌越深,而在后续反弹时因本金亏损过多,又过于谨慎(一度空出近一半资金)而回血很慢。类似于下跌时重仓出击,上涨时唯唯诺诺。算笔账,如果投资先亏了50%,需要赚100%才能回本,难度倍增。
这阶段 GPT-5 成了垫底的。原因从其经典语录中可看出一二:“亏了72%手头只剩$1458, 我本来想拿**做一单,但瞅了瞅行情,感觉指标不太妙有下跌的可能,而且最近交易有点太频繁了,所以最后还是决定不做了。现在我主要得把手头每个单子的止损点和盈利目标都好好记下来。”
异军突起的是阿里 Qwen。22日傍晚起,阿里 Qwen 的收益曲线陡然上升,并快速超越 DS 成为新王(后又被 DS 超越,但仍在第二位)。看操作,Qwen 反超是看到上涨信号,直接满仓高倍杠杆做多最强的虚拟资产;且账户可用现金基本不到100美元,不留操作空间,猛猛all in。
Qwen 的经典语录是:“总盘子一万二千五,现在浮盈差不多25%了,还有97刀现金。我那个20倍的**多单还拿着呢,已经想好怎么溜了。数据显示这波还能涨,必须跟上节奏。”
27日 DS 再次超过 Qwen ,自此,6个顶级 AI 模型的位次基本稳定。目前在预测网站上,44%的投票者认为阿里 Qwen 会赢下比赛,紧随其后的是 DS ,投票率在35%。谁能最终胜出还有悬念,但对于谁会输掉比赛,大家的共识度更高,有高达60%的人认为 GPT-5 会是最后的失败者。

中国队胜出原因分析
要明确的是,这次 AI 大赛与以往最大的不同是,让 AI 们直面真实、动态、复杂甚至混乱的虚拟币市场。
事实上,佛罗里达大学研究人员曾让 GPT 回测2021年10月至2022年12月的数据,这期间其驱动的交易模型收益率超过500%, 而同期标准普尔500指数 ETF 回报率是-12%。
但此次比赛中,恰恰 GPT-5 是表现最差的那个。这说明,实践是检验真理的唯一标准,“市场是检测AI智能的终极测试”。
在真实的交易场景中,或许光有强大的语言能力是不够的,对市场的理解更加重要。每一秒的价格都在变化,没有标准答案只有盈亏。更重要的是,这类市场是典型的零和博弈,你赚的钱就是别人亏的钱。

时间截止:北京时间2025年10月28日15点16分
从目前统计数据可见:
Gemini 的问题在于频繁交易,小赢大亏。交易次数上排在第二的GPT-5也仅赶上它的零头;这样的坏处是频繁操作加剧了滑点(实际成交价格与预设挂单价格的偏差)和手续费损耗。从胜率来看,其表现不算最差,但最大一次收益金额约为最大损失的一半,可简单看为赚1块钱得赔出去2块。
GPT-5 也存在频繁交易和小赢大亏的问题,雪上加霜的是,胜率还低。其“赌徒式”决策风格、多空双亏的策略矛盾,加上未为头寸设置止损线,导致其多次爆亏,严重侵蚀本金。其就如同“想得太多的分析师,处处下注却处处被打脸”。
Claude 过于谨小慎微,善于分析;虽然胜率较高,风险管理得当,但在趋势明确的市场中,保守反而成了包袱。
Grok 试图捕捉多个机会,但胜率一般;如前面所提,不知是否和出身相关,其对同样与马斯克有密切关系的虚拟币“情有独钟”,很难说是不是因为这而拖累了表现。
再看表现最好的两只中国队。
DS 明显是均衡稳健派,波动曲线更平稳;夏普比率是参赛 AI 中最高的,意味着其用最小的风险换最优的回报,是专业选手。
它的交易期望值远高于 Qwen ,这个指标可理解为:“平均下来,每做一次交易,我预计能赚多少钱?”这意味着,DS 交易策略在统计上更为稳健,其盈利的可复制性和质量远高于 Qwen。这大概也能解释为何后来其又能再次超过 Qwen 。
同时,DS 的平均持仓时间至今长达49小时,这表明它可能识别到所持资产处于上升趋势,并坚定地执行了看涨策略。
DS 的经典语录:我正乘着市场上涨的浪潮,持有仓位,因为它们都处于盈利状态,并且没有触发任何失效条件。我的账户价值从 10,000 美元的起始值上涨至 13,745.78 美元,总回报率高达 37.46%。
最后看 Qwen,市面上对它的评价也比较两极,看好的说它“好像有交易员的直觉,知道何时该等,何时该动”,不看好的会认为它是“孤注一掷的大赌徒”。
从数据来看,其80%以上的收益来自一笔多头交易,而夏普率为0.338,这表明其高收益是通过承受极高的波动性和风险换来的。这更像是一种高“Beta”(市场风险)暴露,而非稳定的“Alpha”。
这次 Qwen 的爆发得益于两个因素:下注时机精妙;选择正确的资产和方向。其胜率在所有 AI 模型中最高,但因为时间较短,策略还需要继续得到验证。“真正的Alpha应体现在持续超越市场基准的能力,而非短期爆发力。”
不同 AI 对风险和收益的平衡完全不同,训练数据的影响可能是关键。
Deepseek背后的幻方量化,十几年来在堪称“地狱级”难度的大A市场积累了海量的交易数据和策略,且真正赚了钱;这些数据即使不直接用于训练,可能也会影响对“什么是好的交易决策”的理解。
相比之下,OpenAI 和 Google 的训练数据可能更偏向学术论文和网络文本,对实盘交易的理解不够接地气。
同时,有交易员推测,DS 可能在训练时特别优化了时间序列预测能力,而 GPT-5 可能更擅长处理自然语言。在面对价格图表这种结构化数据时,不同的架构会有不同的表现。
AI 该如何帮助投资?
从这些 AI 的操作可得到的直接经验是:
首先,从长期投资的角度,如果没有信心成为千万分之一的顶尖交易员,DS 的多头分散策略更具可持续性;普通投资者要避免过度交易,且谨慎使用杠杆,因为即使是顶级AI,在高杠杆下也随时可能破产。
其次,若判断市场处于上行大周期,就应学会忽略中途的小幅震荡。相比频繁交易,在“牛市”中稳持反而是更优解。
那么,将投资交给AI真的靠谱吗?
显然,看到这次 GPT-5 的表现,国外交易员可以松口气,他们暂时不会被 AI 取代;而看到 DS 和 Qwen 的表现,大A的散户们可能会心中一寒,对手太厉害。
客观来看,AI 的优势在于理性,它不会情绪化,也不会贪婪或恐惧。它能在极短时间内读完海量报告、理清逻辑链条,提供结构化的判断。
但它的短板同样明显:无法预测未来,也难以捕捉市场的动态博弈与隐性信号;面对宏观突发与黑天鹅事件,它的反应往往滞后。
所以关键是,如何运用好 AI 来帮助投资。
事实上,过去一年里,已经有人依靠 AI 推荐选股并取得了真实收益。但前提是:这些用户本身就具备较强的投资素养,能够提供专业的提示词,如自身风险偏好、目标收益区间,让 AI 分析财报、估值、波动率与趋势等,再生成针对不同市场的个性化策略。
换句话说,能高效用好 AI 的人,本身已经是成熟投资者,AI只是他们的决策辅助工具。
金融市场确实是下一个 AI 时代的最佳训练环境。未来,理性的工具与人的智慧相结合,或许才是最佳交易策略。


评论