每日經濟新聞 2025-11-27 22:41:34
每經編輯|程鵬
11月27日,DeepSeek在HuggingFace推出新型數學推理模型DeepSeekMath-V2,采用可自我驗證的訓練框架。該模型基于DeepSeek-V3.2-Exp-Base構建,通過LLM驗證器自動審查生成的數學證明,并利用高難度樣本持續優化性能。在IMO 2025和CMO 2024中均達到金牌水平,Putnam 2024獲118/120分。團隊表示,該成果驗證了自驗證推理路徑的可行性,為構建可靠數學智能系統提供新方向。模型代碼與權重已開源,發布于Hugging Face及GitHub平臺。

編輯|程鵬 杜恒峰
校對|金冥羽
封面圖片來源:視覺中國

來源:每經快訊
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP