国产一区欧美一区,亲子乱对白乱都乱了

梁文鋒論文登上《自然》封面，正面回應(yīng)DeepSeek-R1蒸餾質(zhì)疑快訊

TechWeb.com.cn 2025-09-18 09:52

分享到：

導(dǎo)讀

DeepSeek為DeepSeek-R1新增了一份全面的安全報(bào)告，《自然》雜志還公布了同行評審報(bào)告，DeepSeek-R1也成為全球首個(gè)經(jīng)過同行評審的主流大語言模型。

【TechWeb】9月17日消息，由DeepSeek團(tuán)隊(duì)共同完成、梁文鋒擔(dān)任通訊作者的DeepSeek-R1推理模型研究論文，登上了國際權(quán)威期刊《自然（Nature）》的封面?！蹲匀弧冯s志還公布了同行評審報(bào)告，DeepSeek-R1也成為全球首個(gè)經(jīng)過同行評審的主流大語言模型。

發(fā)表在《自然》雜志的新版DeepSeek-R1論文，與今年1月未經(jīng)同行評審的初版有較大差異，披露了更多模型訓(xùn)練的細(xì)節(jié)，并正面回應(yīng)了模型發(fā)布之初的蒸餾質(zhì)疑。

DeepSeek-R1發(fā)布之初，曾有傳聞稱該模型使用了OpenAI的模型進(jìn)行蒸餾。在同行評審文件中，DeepSeek介紹，DeepSeek-R1的基座模型DeepSeek-V3 Base使用的數(shù)據(jù)全部來自互聯(lián)網(wǎng)，可能包含GPT-4生成的結(jié)果，但絕非有意而為之，DeepSeek-V3-Base并沒有引入在合成數(shù)據(jù)集上進(jìn)行大規(guī)模監(jiān)督蒸餾的“冷卻”階段。。

DeepSeek-V3-Base的數(shù)據(jù)截止時(shí)間為2024年7月，當(dāng)時(shí)尚未發(fā)布任何公開的先進(jìn)推理模型，這進(jìn)一步降低了從現(xiàn)有推理模型中無意蒸餾的可能性。

DeepSeek為DeepSeek-R1新增了一份全面的安全報(bào)告，對DeepSeek-R1的安全性進(jìn)行了全面評估，證明其安全性領(lǐng)先同期發(fā)布的前沿模型。

報(bào)告提到，DeepSeek-R1在服務(wù)部署中引入了外部風(fēng)險(xiǎn)控制系統(tǒng)，不僅可以基于關(guān)鍵詞匹配識別不安全對話，還使用DeepSeek-V3直接進(jìn)行風(fēng)險(xiǎn)審查，判斷是否應(yīng)拒絕響應(yīng)。DeepSeek建議開發(fā)者在使用DeepSeek-R1時(shí)，部署類似的風(fēng)險(xiǎn)控制系統(tǒng)。

在公開安全基準(zhǔn)測試和內(nèi)部安全研究中，DeepSeek-R1在大多數(shù)基準(zhǔn)上超過了Claude-3.7-Sonnet、GPT-4o等前沿模型。開源部署版本的安全性雖不及具備外部風(fēng)險(xiǎn)控制系統(tǒng)的版本，但仍擁有中等水平的安全保障。

《自然》雜志評價(jià)道：目前幾乎所有主流的大模型都還沒有經(jīng)過獨(dú)立同行評審，這一空白“終于被DeepSeek打破”。隨著AI技術(shù)日漸普及，大模型廠商們無法驗(yàn)證的宣傳可能對社會帶來真實(shí)風(fēng)險(xiǎn)。依靠獨(dú)立研究人員進(jìn)行的同行評審，是抑制AI行業(yè)過度炒作的一種有效方式。（宜月）

模型 DeepSeek-R 評審 DeepSeek 風(fēng)險(xiǎn)

分享到：

1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范，任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源；
2.TMT觀察網(wǎng)的原創(chuàng)文章，請轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源：TMT觀察網(wǎng)"，不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任；
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。