国产一区二区三区中文,黄网av在线,国产精品第2页,国产成人精品国内自产拍免费看

首頁  ?  新聞頻道  ?  國際新聞

國際期刊發表DeepSeek大規模推理模型訓練方法 揭示AI背后的科學

2025-09-18 10:34:21

來源:中國新聞網

  中新網北京9月18日電 (記者 孫自法)作為一家專注于大語言模型(LLM)和通用人工智能(AGI)技術的中國公司,DeepSeek(深度求索)今年早些時候發布的開源人工智能(AI)模型DeepSeek-R1采用的大規模推理模型訓練方法,頗受關注。

  北京時間9月17日夜間,該訓練方法在國際知名學術期刊《自然》上線發表,其揭示AI技術背后的科學研究表明,大語言模型的推理能力可通過純強化學習來提升,從而減少增強性能所需的人類輸入工作量。訓練出的模型在數學、編程競賽和STEM(科學、技術、工程、數學)領域研究生水平問題等任務上,比傳統訓練的大語言模型表現更好。

  論文通訊作者為DeepSeek創始人梁文鋒,他領導的DeepSeek-AI團隊表示,讓AI模型像人類一樣進行推理一直是難題,雖然大語言模型已顯示出一些推理能力,但訓練過程需要大量計算資源。通過人工提示引導可改進這類模型,促使其生成中間推理步驟,從而大為強化其在復雜任務中的表現。不過,這個方法會導致計算成本過高,并限制其擴展潛力。

  DeepSeek-AI團隊介紹說,DeepSeek-R1包含一個在人類監督下的深入訓練階段,以優化推理過程。該模型使用了強化學習而非人類示例來開發推理步驟,從而減少了訓練成本和復雜性。DeepSeek-R1在被展示優質的問題解決案例后,會獲得一個模板來產生推理過程。這一模型通過解決問題獲得獎勵,從而強化學習效果。

  在評估AI表現的數學基準測試中,DeepSeek-R1-Zero和DeepSeek-R1得分分別為77.9%和79.8%。此外,該模型在編程競賽及研究生水平的生物學、物理和化學問題上同樣表現優異。

  《自然》同期發表國際同行專家的“新聞與觀點”文章指出,當前版本的DeepSeek-R1有一些能力限制,希望能在未來版本中得到改進。例如,該模型有時會混合語言,目前只針對中文和英文做了優化;它對提示詞也很敏感,需要精心設計的提示詞工程,在某些任務上沒有展現出明顯提升,例如軟件工程任務。

  DeepSeek-AI團隊總結認為,未來研究可以聚焦優化獎勵過程,以確保推理和任務結果可靠。(完)

  • 相關閱讀
  • 外交部:奉勸美方停止脅迫拉美國家選邊站隊

    新華社北京9月18日電(記者馬卓言、王慧慧)針對外媒稱美國脅迫拉美國家減少甚至中斷同中國發展關系,外交部發言人林劍18日表示,拉美和加勒比不是誰的“后院”,有權自主選擇發展道路和合作伙伴,奉勸美方停止脅迫拉美國家選邊...

    時間:09-19
  • 通訊丨美國關稅沖擊下巴西咖啡產業尋新機

    新華社里約熱內盧9月18日電 通訊|美國關稅沖擊下巴西咖啡產業尋新機新華社記者周永穗 王天聰正值旱季,巴西東南部米納斯吉拉斯州天氣干燥。大片咖啡樹采摘已結束,農機駛過,紅土飛揚。咖啡樹靜靜佇立,等待來年的豐收。巴西...

    時間:09-19
  • 通訊|一部劇:微短劇拓展中泰文化與產業合作新空間

    新華社南寧/曼谷9月19日電 通訊|一部劇:微短劇拓展中泰文化與產業合作新空間新華社記者趙歡 夏康靜曼谷地鐵早高峰,不少年輕人刷著手機,屏幕上播放著來自中國的微短劇,“豪門恩怨”、職場逆襲、古裝奇緣等故事情節扣人心弦...

    時間:09-19
  • 特朗普稱美方正試圖收回阿富汗巴格拉姆空軍基地

    新華社倫敦9月18日電(記者趙家淞)美國總統特朗普18日在英國首相鄉村官邸契克斯別墅會晤英國首相斯塔默時表示,美方正試圖收回阿富汗巴格拉姆空軍基地。特朗普在記者會上批評美國前政府關于美軍撤離阿富汗的決定和行動。...

    時間:09-19
  • 中國代表三問美國否決聯合國安理會加沙問題決議草案

    新華社聯合國9月18日電 聯合國安理會18日就加沙問題決議草案進行表決。安理會15個成員中14個投了贊成票,常任理事國美國行使了否決權,導致決議草案未獲通過。中國常駐聯合國代表傅聰在表決后作解釋性發言,對美國濫用否決...

    時間:09-19
  • 報告:結構性問題難解  歐盟持續面臨藥品短缺

    新華社北京9月19日電 歐盟審計機構歐洲審計團17日發布報告指出,由于供應鏈脆弱、內部市場分割等結構性問題,歐盟至今未能找到有效解決方案,常用抗生素、疫苗等藥品短缺現象仍將持續存在。亟待“診治” 關乎“歐盟戰略自...

    時間:09-19
  • 2025環球人物年度盛典在四川瀘沽湖畔舉行

    人民網訊 “梨花開,春帶雨。梨花落,春入泥。”一曲《梨花頌》將環球人物年度盛典推向高潮。盡管現場下起綿綿細雨,觀眾依然熱情高漲,紛紛為著名京劇表演藝術家胡文閣的表演喝彩。“我要堅持把傳承京劇藝術作為使命,讓國粹...

    時間:09-19
  • 是什么,讓一檔美國著名脫口秀突然停播?

    新華社北京9月18日電 美國廣播公司(ABC)17日宣布,將“無限期”停播主持人吉米·基梅爾的深夜脫口秀節目,原因是基梅爾在節目中對美國知名保守派活動人士查理·柯克遭槍殺事件發表的言論引發爭議。停播決定得到美國總統...

    時間:09-19
  • 商務部:中方絕不會以犧牲原則立場、企業利益和國際公平正義為代價尋求達成任何協議

    新華社北京9月18日電(記者謝希瑤)商務部新聞發言人何亞東18日表示,關于TikTok問題,中方立場是一貫的。我們反對將科技和經貿問題政治化、工具化、武器化,絕不會以犧牲原則立場、企業利益和國際公平正義為代價,尋求達成任何...

    時間:09-19
  • 中國詩人亮相第十五屆布加勒斯特國際詩歌節朗誦會

    新華社布加勒斯特9月18日電(記者張改萍)當地時間16日晚至17日晚,在第十五屆布加勒斯特國際詩歌節期間,中國詩人參與的大型詩歌朗誦會在羅馬尼亞國家文學博物館和中央圖書館舉行。在朗誦會上,中國詩人與來自羅馬尼亞、葡萄...

    時間:09-19
免責聲明:本網對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網站轉載圖片、文字之類版權申明,本網站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網站將在第一時間及時刪除。
主站蜘蛛池模板: 西和县| 定南县| 兴文县| 浦北县| 南丰县| 江油市| 商城县| 商南县| 岑溪市| 都江堰市| 苗栗市| 琼结县| 泰顺县| 庆城县| 余干县| 华容县| 合作市| 河东区| 济宁市| 田东县| 定结县| 梁河县| 宁夏| 承德县| 大洼县| 泗水县| 丹巴县| 喜德县| 鲁山县| 襄樊市| 龙江县| 广平县| 威远县| 沾化县| 积石山| 绍兴市| 吴江市| 尤溪县| 莎车县| 旬邑县| 深水埗区|