• <acronym id="mz9d1"><output id="mz9d1"></output></acronym>

    <sub id="mz9d1"><ol id="mz9d1"><nobr id="mz9d1"></nobr></ol></sub>
        1. <sup id="mz9d1"></sup>
          每日經(jīng)濟(jì)新聞
          推薦

          每經(jīng)網(wǎng)首頁 > 推薦 > 正文

          AI實(shí)盤投資哪家強(qiáng)?專訪Nof1人工智能負(fù)責(zé)人:表現(xiàn)最佳的都是開源模型

          2025-11-05 23:10:49

          北京時(shí)間11月4日,AI大模型實(shí)時(shí)投資比賽“Alpha Arena”落幕,阿里千問Qwen奪冠,DeepSeek第二。競(jìng)賽由Nof1發(fā)起,六大頂尖模型擁有1萬美元初始資金,在真實(shí)的加密貨幣市場(chǎng)自主交易。Nof1表示金融市場(chǎng)是AI最佳訓(xùn)練環(huán)境,比賽旨在揭示模型偏見、轉(zhuǎn)向現(xiàn)實(shí)基準(zhǔn)。下一季比賽周期更長(zhǎng)、參與者更多。Nof1人工智能負(fù)責(zé)人稱未來人類或?qū)⑼ㄟ^AI金融投資智能體交易。

          每經(jīng)記者|葉曉丹    每經(jīng)編輯|黃博文    

          歷時(shí)17天,全球六大頂尖AI(人工智能)大模型,擁有1萬美元初始資金,在真實(shí)的加密貨幣市場(chǎng)自主交易。

          真實(shí)市場(chǎng)、真金白銀、真實(shí)基準(zhǔn),誰能勝出?

          北京時(shí)間11月4日,備受關(guān)注的AI大模型實(shí)時(shí)投資比賽“Alpha Arena”落下帷幕,來自中國(guó)的兩款大模型在17天的比賽中保持領(lǐng)先,其中,阿里千問Qwen奪得冠軍,DeepSeek名列第二。

          該競(jìng)賽由國(guó)際第三方機(jī)構(gòu)Nof1于10月18日發(fā)起,集合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4等全球六大頂尖模型,每個(gè)模型擁有一萬美元初始資金,在真實(shí)市場(chǎng)上無人工干預(yù)地自主決策、交易,根據(jù)盈虧情況決出冠軍。

          Nof1公司表示,相信金融市場(chǎng)是下一代人工智能的最佳訓(xùn)練環(huán)境。在“Alpha Arena”比賽開始一周后,Nof1發(fā)文表示,第一季Alpha Arena目標(biāo)主要有兩個(gè)。

          其一,通過比較分析,揭示主流LLM(大語言模型)明顯的隱性偏見和默認(rèn)的交易行為。比如,探究模型之間的交易方式是否存在巨大差異?它們是否隨著時(shí)間保持一致?它們?cè)谀睦锓稿e(cuò)?

          其二,幫助將AI研究文化轉(zhuǎn)向現(xiàn)實(shí)世界基準(zhǔn),遠(yuǎn)離靜態(tài)的、考試式的基準(zhǔn)。我們希望Alpha Arena至少能強(qiáng)調(diào)在更具后果性、現(xiàn)實(shí)環(huán)境中評(píng)估AI的力量。我們相信這是發(fā)現(xiàn)關(guān)鍵差距和見解、推動(dòng)前沿AI發(fā)展的最快途徑。

          在經(jīng)歷17天真實(shí)世界的交易后,結(jié)果出乎所有人的意料。阿里巴巴的Qwen 3 Max以22.32%的收益率奪冠,另一家中國(guó)公司DeepSeek位居第二,其DeepSeek v3.1的收益率為4.89%。

          而來自硅谷的四位明星選手則全線潰敗。OpenAI的GPT-5虧損62.66%,Google的Gemini 2.5 Pro虧損56.71%,馬斯克旗下xAI的Grok 4虧損45.3%,Anthropic的Claude 4.5 Sonnet也虧損了30.81%。

          對(duì)這場(chǎng)比賽,Nof1負(fù)責(zé)人Jay A在社交媒體中表示:“我們觀察到模型存在持續(xù)的偏差,這種偏差隨著時(shí)間的推移和提示信息的多次迭代而持續(xù)存在。我們也特意將模型置于一個(gè)困難的境地。LLM模型實(shí)際上并不擅長(zhǎng)處理數(shù)值時(shí)間序列數(shù)據(jù),但這正是我們給它們提供的全部背景信息。此外,它們還被賦予了一個(gè)受限的資產(chǎn)范圍和一個(gè)相當(dāng)有限的行動(dòng)空間。”

          同時(shí),Nof1宣布下一季比賽即將啟動(dòng),周期會(huì)更長(zhǎng),參與者會(huì)更多,市場(chǎng)環(huán)境也會(huì)更復(fù)雜。Nof1人工智能負(fù)責(zé)人Julian Togelius在社交媒體上透露,下一季的測(cè)試將會(huì)有許多改進(jìn)。

          11月5日,基于此次實(shí)盤投資競(jìng)賽,《每日經(jīng)濟(jì)新聞》記者(以下簡(jiǎn)稱“NBD”)獨(dú)家專訪了紐約大學(xué)坦登工程學(xué)院計(jì)算機(jī)科學(xué)與工程系副教授、Nof1人工智能負(fù)責(zé)人Julian Togelius。

          六個(gè)AI模型的收益變化圖 圖片來源:Nof1官網(wǎng)截圖

          表現(xiàn)最佳的模型都是開源的

          NBD:第一季比賽結(jié)束了,來自中國(guó)的兩款大模型收益率保持領(lǐng)先。最終的比賽結(jié)果在你的預(yù)期之內(nèi)嗎?

          Julian Togelius:根據(jù)初步測(cè)試,我們預(yù)期這些模型會(huì)展現(xiàn)出不同的投資風(fēng)格。因此,結(jié)果出現(xiàn)顯著差異是意料之中的。我們并不確定哪些模型會(huì)脫穎而出,但我們?cè)_玩笑說,DeepSeek或許會(huì)表現(xiàn)出色,因?yàn)樵摴酒鹪从谝患伊炕灰坠尽=Y(jié)果證明我們的猜測(cè)是正確的。我們也十分欣喜地看到,表現(xiàn)最佳的模型都是開源的,因?yàn)殚_源人工智能對(duì)世界有好處。

          NBD:這次比賽持續(xù)了17天時(shí)間。有評(píng)論認(rèn)為相比真實(shí)市場(chǎng)的量化交易,17天的時(shí)間似乎有點(diǎn)短暫。為什么考慮設(shè)計(jì)這個(gè)時(shí)間維度?

          Julian Togelius:我們是一家身處快速發(fā)展領(lǐng)域的初創(chuàng)公司,所以我們希望快速迭代。我們?yōu)榧磳⒌絹淼馁惣居泻芏嗉?dòng)人心的想法,并希望盡快進(jìn)行嘗試。誠(chéng)然,真正的交易需要更長(zhǎng)的時(shí)間跨度……但這項(xiàng)比賽只是我們?cè)贜of1工作的一個(gè)方面。

          NBD:在比賽過程中,6款A(yù)I模型前幾天整體差距還比較小,但隨著時(shí)間的拉長(zhǎng),各個(gè)大模型呈現(xiàn)了各具特色的投資風(fēng)格。流動(dòng)的時(shí)間對(duì)大模型而言意味著什么?

          Julian Togelius:這些模型的性格隨時(shí)間推移保持穩(wěn)定。然而,早期投資決策的結(jié)果可能意味著模型會(huì)讓自己置身于或多或少困難的境地,并會(huì)以不同的方式應(yīng)對(duì)。GPT-5似乎一度陷入決策癱瘓,但如果它從一開始就交易得更好,這種情況或許就不會(huì)發(fā)生。同樣,如果Qwen的財(cái)務(wù)狀況更糟,它那種激進(jìn)的投資風(fēng)格或許也不會(huì)出現(xiàn)。

          人們未來將可以通過AI金融投資智能體來交易

          NBD:下一季的比賽中會(huì)有哪些調(diào)整和優(yōu)化?是否可以添加一些新聞、財(cái)報(bào)、宏觀經(jīng)濟(jì)、市場(chǎng)情緒和其他非技術(shù)信息,供人工智能在投資前進(jìn)行分析,以模擬更真實(shí)的交易環(huán)境?

          Julian Togelius:你提到的因素我們都討論過了,我們希望在不久的將來能夠?qū)崿F(xiàn)。不過,我們會(huì)一步一步來。我不會(huì)提前透露下一版本會(huì)做哪些改動(dòng)——它很快就會(huì)發(fā)布。但我們預(yù)計(jì)會(huì)快速推進(jìn),并在后續(xù)版本中逐步整合更多信息。我們的目標(biāo)是開發(fā)出比任何現(xiàn)役交易員都更優(yōu)秀的AI金融投資智能體。

          NBD:這次比賽引發(fā)了大量關(guān)注,你認(rèn)為這場(chǎng)AI投資比賽的真正價(jià)值是什么?是比較模型性能,還是驗(yàn)證AI能否真正走向市場(chǎng)化?投資比賽是否可能演變?yōu)锳I金融行業(yè)的一種長(zhǎng)期機(jī)制?

          Julian Togelius:我們堅(jiān)信,未來人類將通過指導(dǎo)或構(gòu)建自己的AI金融投資智能體來進(jìn)行交易。人類與AI專業(yè)知識(shí)的結(jié)合必然優(yōu)于人類或AI單獨(dú)運(yùn)作。我們正在構(gòu)建一個(gè)系統(tǒng),讓任何人都能通過AI金融投資智能體進(jìn)行交易,而本次大賽正是朝著這個(gè)目標(biāo)邁出的重要一步。(實(shí)習(xí)生張京寶對(duì)本文亦有貢獻(xiàn))


          封面圖片來源:圖片來源:視覺中國(guó)-VCG211550173673

          如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
          未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

          讀者熱線:4008890008

          特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

          歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

          每經(jīng)經(jīng)濟(jì)新聞官方APP

          0

          0

          国产日本精品在线观看_欧美日韩综合精品一区二区三区_97国产精品一区二区三区四区_国产中文字幕六九九九
        2. <acronym id="mz9d1"><output id="mz9d1"></output></acronym>

          <sub id="mz9d1"><ol id="mz9d1"><nobr id="mz9d1"></nobr></ol></sub>
              1. <sup id="mz9d1"></sup>
                在线人成视频福利免费 | 亚洲国产精品中文乱码AV | 午夜电影久久久久久 | 亚洲欧美国产国产综合一区 | 亚洲无玛中文字幕久久婷婷 | 日本私人免费网站在线观看 |