• <acronym id="mz9d1"><output id="mz9d1"></output></acronym>

    <sub id="mz9d1"><ol id="mz9d1"><nobr id="mz9d1"></nobr></ol></sub>
        1. <sup id="mz9d1"></sup>
          每日經濟新聞
          要聞

          每經網首頁 > 要聞 > 正文

          剛剛!DeepSeek重大發(fā)布!梁文鋒參與共創(chuàng)!

          每日經濟新聞 2025-02-19 00:53:05

          每經編輯 金冥羽    

          2月18日,DeepSeek在海外社交平臺發(fā)布了一篇純技術論文報告,論文主要內容是關于NSA(Natively Sparse Attention,原生稀疏注意力)。

          據介紹,NSA專為長文本訓練與推理設計,能利用動態(tài)分層稀疏策略等方法,通過針對現代硬件的優(yōu)化設計,顯著優(yōu)化傳統(tǒng)AI模型在訓練和推理過程中的表現,特別是提升長上下文的推理能力,在保證性能的同時提升了推理速度,并有效降低了預訓練成本。

          CFF20LXzkOySME66m7r8N7ibHjYjAVFPrynFl1dR0mkG7DLwbZV9pMBxycKciafL0ONp4lwFhKbxBUUfz3L2QxVQ.jpg

          在這篇名為《原生稀疏注意力:硬件對齊且可原生訓練的稀疏注意力機制》(Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention)的論文署名中,DeepSeek創(chuàng)始人兼CEO梁文鋒也作為共創(chuàng)在列。

          CFF20LXzkOySME66m7r8N7ibHjYjAVFPrOibRsm9FiaQJ73k5P6JkH1L4Jg5bcibUBLdfjzDqDSul7HbQ1aTqmQuiag.jpg

          其他研究人員來自DeepSeek、北大和華盛頓大學,其中第一作者Jingyang Yuan(袁景陽)是在DeepSeek實習期間完成的這項研究。

          值得一提的是,今日中午12點(太平洋時間17晚8點),馬斯克旗下AI公司xAI發(fā)布了Grok 3及其精簡版Grok 3 mini。發(fā)布會采用視頻直播形式,觀看人數超過100萬人。

          CFF20LXzkOySME66m7r8N7ibHjYjAVFPraRGGG8So4icn2uCbtb7Y0uDxynOSSNibibZDPjzRYLxsTiarOSbQ61SveQ.png

          圖片來源:直播截圖

          Grok 3是xAI對OpenAI的o3-mini和DeepSeek的R1等模型的回應,它可以分析圖像和回答問題,并為X上的許多功能提供支持。此前馬斯克在X上造勢稱,Grok 3是“地球上最聰明的人工智能”。

          在此次直播中,馬斯克透露,實際上,到訓練進行到92天時,集群的規(guī)模已經擴大到了20萬塊GPU。

          編輯|金冥羽?杜波

          校對|陳柯名

          封面圖片來源:視覺中國

          CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

          每日經濟新聞綜合自券商中國、財聯(lián)社、公開資料等

          如需轉載請與《每日經濟新聞》報社聯(lián)系。
          未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

          讀者熱線:4008890008

          特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現在本站,可聯(lián)系我們要求撤下您的作品。

          歡迎關注每日經濟新聞APP

          每經經濟新聞官方APP

          0

          0

          国产日本精品在线观看_欧美日韩综合精品一区二区三区_97国产精品一区二区三区四区_国产中文字幕六九九九
        2. <acronym id="mz9d1"><output id="mz9d1"></output></acronym>

          <sub id="mz9d1"><ol id="mz9d1"><nobr id="mz9d1"></nobr></ol></sub>
              1. <sup id="mz9d1"></sup>
                亚洲最新a在线观看 | 日韩精品一区二区三区免费视频喜 | 中文字幕婷婷日韩欧美亚洲 | 日韩一区二区三区在线播放 | 亚洲国产中文一卡二卡三卡免费 | 亚洲精品秘在线看 |