AI實(shí)盤投資哪家強(qiáng)？專訪Nof1人工智能負(fù)責(zé)人：表現(xiàn)最佳的都是開源模型

2025-11-05 23:10:49

北京時(shí)間11月4日，AI大模型實(shí)時(shí)投資比賽“Alpha Arena”落幕，阿里千問Qwen奪冠，DeepSeek第二。競(jìng)賽由Nof1發(fā)起，六大頂尖模型擁有1萬美元初始資金，在真實(shí)的加密貨幣市場(chǎng)自主交易。Nof1表示金融市場(chǎng)是AI最佳訓(xùn)練環(huán)境，比賽旨在揭示模型偏見、轉(zhuǎn)向現(xiàn)實(shí)基準(zhǔn)。下一季比賽周期更長(zhǎng)、參與者更多。Nof1人工智能負(fù)責(zé)人稱未來人類或?qū)⑼ㄟ^AI金融投資智能體交易。

每經(jīng)記者｜葉曉丹每經(jīng)編輯｜黃博文

歷時(shí)17天，全球六大頂尖AI（人工智能）大模型，擁有1萬美元初始資金，在真實(shí)的加密貨幣市場(chǎng)自主交易。

真實(shí)市場(chǎng)、真金白銀、真實(shí)基準(zhǔn)，誰能勝出？

北京時(shí)間11月4日，備受關(guān)注的AI大模型實(shí)時(shí)投資比賽“Alpha Arena”落下帷幕，來自中國(guó)的兩款大模型在17天的比賽中保持領(lǐng)先，其中，阿里千問Qwen奪得冠軍，DeepSeek名列第二。

該競(jìng)賽由國(guó)際第三方機(jī)構(gòu)Nof1于10月18日發(fā)起，集合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4等全球六大頂尖模型，每個(gè)模型擁有一萬美元初始資金，在真實(shí)市場(chǎng)上無人工干預(yù)地自主決策、交易，根據(jù)盈虧情況決出冠軍。

Nof1公司表示，相信金融市場(chǎng)是下一代人工智能的最佳訓(xùn)練環(huán)境。在“Alpha Arena”比賽開始一周后，Nof1發(fā)文表示，第一季Alpha Arena目標(biāo)主要有兩個(gè)。

其一，通過比較分析，揭示主流LLM（大語言模型）明顯的隱性偏見和默認(rèn)的交易行為。比如，探究模型之間的交易方式是否存在巨大差異？它們是否隨著時(shí)間保持一致？它們?cè)谀睦锓稿e(cuò)？

其二，幫助將AI研究文化轉(zhuǎn)向現(xiàn)實(shí)世界基準(zhǔn)，遠(yuǎn)離靜態(tài)的、考試式的基準(zhǔn)。我們希望Alpha Arena至少能強(qiáng)調(diào)在更具后果性、現(xiàn)實(shí)環(huán)境中評(píng)估AI的力量。我們相信這是發(fā)現(xiàn)關(guān)鍵差距和見解、推動(dòng)前沿AI發(fā)展的最快途徑。

在經(jīng)歷17天真實(shí)世界的交易后，結(jié)果出乎所有人的意料。阿里巴巴的Qwen 3 Max以22.32%的收益率奪冠，另一家中國(guó)公司DeepSeek位居第二，其DeepSeek v3.1的收益率為4.89%。

而來自硅谷的四位明星選手則全線潰敗。OpenAI的GPT-5虧損62.66%，Google的Gemini 2.5 Pro虧損56.71%，馬斯克旗下xAI的Grok 4虧損45.3%，Anthropic的Claude 4.5 Sonnet也虧損了30.81%。

對(duì)這場(chǎng)比賽，Nof1負(fù)責(zé)人Jay A在社交媒體中表示：“我們觀察到模型存在持續(xù)的偏差，這種偏差隨著時(shí)間的推移和提示信息的多次迭代而持續(xù)存在。我們也特意將模型置于一個(gè)困難的境地。LLM模型實(shí)際上并不擅長(zhǎng)處理數(shù)值時(shí)間序列數(shù)據(jù)，但這正是我們給它們提供的全部背景信息。此外，它們還被賦予了一個(gè)受限的資產(chǎn)范圍和一個(gè)相當(dāng)有限的行動(dòng)空間。”

同時(shí)，Nof1宣布下一季比賽即將啟動(dòng)，周期會(huì)更長(zhǎng)，參與者會(huì)更多，市場(chǎng)環(huán)境也會(huì)更復(fù)雜。Nof1人工智能負(fù)責(zé)人Julian Togelius在社交媒體上透露，下一季的測(cè)試將會(huì)有許多改進(jìn)。

11月5日，基于此次實(shí)盤投資競(jìng)賽，《每日經(jīng)濟(jì)新聞》記者（以下簡(jiǎn)稱“NBD”）獨(dú)家專訪了紐約大學(xué)坦登工程學(xué)院計(jì)算機(jī)科學(xué)與工程系副教授、Nof1人工智能負(fù)責(zé)人Julian Togelius。

六個(gè)AI模型的收益變化圖圖片來源：Nof1官網(wǎng)截圖

表現(xiàn)最佳的模型都是開源的

NBD：第一季比賽結(jié)束了，來自中國(guó)的兩款大模型收益率保持領(lǐng)先。最終的比賽結(jié)果在你的預(yù)期之內(nèi)嗎？

Julian Togelius：根據(jù)初步測(cè)試，我們預(yù)期這些模型會(huì)展現(xiàn)出不同的投資風(fēng)格。因此，結(jié)果出現(xiàn)顯著差異是意料之中的。我們并不確定哪些模型會(huì)脫穎而出，但我們?cè)_玩笑說，DeepSeek或許會(huì)表現(xiàn)出色，因?yàn)樵摴酒鹪从谝患伊炕灰坠尽＝Y(jié)果證明我們的猜測(cè)是正確的。我們也十分欣喜地看到，表現(xiàn)最佳的模型都是開源的，因?yàn)殚_源人工智能對(duì)世界有好處。

NBD：這次比賽持續(xù)了17天時(shí)間。有評(píng)論認(rèn)為相比真實(shí)市場(chǎng)的量化交易，17天的時(shí)間似乎有點(diǎn)短暫。為什么考慮設(shè)計(jì)這個(gè)時(shí)間維度？

Julian Togelius：我們是一家身處快速發(fā)展領(lǐng)域的初創(chuàng)公司，所以我們希望快速迭代。我們?yōu)榧磳⒌絹淼馁惣居泻芏嗉?dòng)人心的想法，并希望盡快進(jìn)行嘗試。誠(chéng)然，真正的交易需要更長(zhǎng)的時(shí)間跨度……但這項(xiàng)比賽只是我們?cè)贜of1工作的一個(gè)方面。

NBD：在比賽過程中，6款A(yù)I模型前幾天整體差距還比較小，但隨著時(shí)間的拉長(zhǎng)，各個(gè)大模型呈現(xiàn)了各具特色的投資風(fēng)格。流動(dòng)的時(shí)間對(duì)大模型而言意味著什么？

Julian Togelius：這些模型的性格隨時(shí)間推移保持穩(wěn)定。然而，早期投資決策的結(jié)果可能意味著模型會(huì)讓自己置身于或多或少困難的境地，并會(huì)以不同的方式應(yīng)對(duì)。GPT-5似乎一度陷入決策癱瘓，但如果它從一開始就交易得更好，這種情況或許就不會(huì)發(fā)生。同樣，如果Qwen的財(cái)務(wù)狀況更糟，它那種激進(jìn)的投資風(fēng)格或許也不會(huì)出現(xiàn)。

人們未來將可以通過AI金融投資智能體來交易

NBD：下一季的比賽中會(huì)有哪些調(diào)整和優(yōu)化？是否可以添加一些新聞、財(cái)報(bào)、宏觀經(jīng)濟(jì)、市場(chǎng)情緒和其他非技術(shù)信息，供人工智能在投資前進(jìn)行分析，以模擬更真實(shí)的交易環(huán)境？

Julian Togelius：你提到的因素我們都討論過了，我們希望在不久的將來能夠?qū)崿F(xiàn)。不過，我們會(huì)一步一步來。我不會(huì)提前透露下一版本會(huì)做哪些改動(dòng)——它很快就會(huì)發(fā)布。但我們預(yù)計(jì)會(huì)快速推進(jìn)，并在后續(xù)版本中逐步整合更多信息。我們的目標(biāo)是開發(fā)出比任何現(xiàn)役交易員都更優(yōu)秀的AI金融投資智能體。

NBD：這次比賽引發(fā)了大量關(guān)注，你認(rèn)為這場(chǎng)AI投資比賽的真正價(jià)值是什么？是比較模型性能，還是驗(yàn)證AI能否真正走向市場(chǎng)化？投資比賽是否可能演變?yōu)锳I金融行業(yè)的一種長(zhǎng)期機(jī)制？

Julian Togelius：我們堅(jiān)信，未來人類將通過指導(dǎo)或構(gòu)建自己的AI金融投資智能體來進(jìn)行交易。人類與AI專業(yè)知識(shí)的結(jié)合必然優(yōu)于人類或AI單獨(dú)運(yùn)作。我們正在構(gòu)建一個(gè)系統(tǒng)，讓任何人都能通過AI金融投資智能體進(jìn)行交易，而本次大賽正是朝著這個(gè)目標(biāo)邁出的重要一步。（實(shí)習(xí)生張京寶對(duì)本文亦有貢獻(xiàn)）

封面圖片來源：圖片來源：視覺中國(guó)-VCG211550173673

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

11月6日汽車早參

返回每經(jīng)網(wǎng)首頁

下一篇文章

黑牡丹全資子公司擬出售空置廠房等資產(chǎn)，虧損關(guān)聯(lián)方溢價(jià)84%接盤

相關(guān)文章