梁文鋒論文登上《自然》封面,正面回應(yīng)DeepSeek-R1蒸餾質(zhì)疑快訊
DeepSeek為DeepSeek-R1新增了一份全面的安全報(bào)告,《自然》雜志還公布了同行評審報(bào)告,DeepSeek-R1也成為全球首個(gè)經(jīng)過同行評審的主流大語言模型。
【TechWeb】9月17日消息,由DeepSeek團(tuán)隊(duì)共同完成、梁文鋒擔(dān)任通訊作者的DeepSeek-R1推理模型研究論文,登上了國際權(quán)威期刊《自然(Nature)》的封面?!蹲匀弧冯s志還公布了同行評審報(bào)告,DeepSeek-R1也成為全球首個(gè)經(jīng)過同行評審的主流大語言模型。
發(fā)表在《自然》雜志的新版DeepSeek-R1論文,與今年1月未經(jīng)同行評審的初版有較大差異,披露了更多模型訓(xùn)練的細(xì)節(jié),并正面回應(yīng)了模型發(fā)布之初的蒸餾質(zhì)疑。
DeepSeek-R1發(fā)布之初,曾有傳聞稱該模型使用了OpenAI的模型進(jìn)行蒸餾。在同行評審文件中,DeepSeek介紹,DeepSeek-R1的基座模型DeepSeek-V3 Base使用的數(shù)據(jù)全部來自互聯(lián)網(wǎng),可能包含GPT-4生成的結(jié)果,但絕非有意而為之,DeepSeek-V3-Base并沒有引入在合成數(shù)據(jù)集上進(jìn)行大規(guī)模監(jiān)督蒸餾的“冷卻”階段。。
DeepSeek-V3-Base的數(shù)據(jù)截止時(shí)間為2024年7月,當(dāng)時(shí)尚未發(fā)布任何公開的先進(jìn)推理模型,這進(jìn)一步降低了從現(xiàn)有推理模型中無意蒸餾的可能性。
DeepSeek為DeepSeek-R1新增了一份全面的安全報(bào)告,對DeepSeek-R1的安全性進(jìn)行了全面評估,證明其安全性領(lǐng)先同期發(fā)布的前沿模型。
報(bào)告提到,DeepSeek-R1在服務(wù)部署中引入了外部風(fēng)險(xiǎn)控制系統(tǒng),不僅可以基于關(guān)鍵詞匹配識別不安全對話,還使用DeepSeek-V3直接進(jìn)行風(fēng)險(xiǎn)審查,判斷是否應(yīng)拒絕響應(yīng)。DeepSeek建議開發(fā)者在使用DeepSeek-R1時(shí),部署類似的風(fēng)險(xiǎn)控制系統(tǒng)。
在公開安全基準(zhǔn)測試和內(nèi)部安全研究中,DeepSeek-R1在大多數(shù)基準(zhǔn)上超過了Claude-3.7-Sonnet、GPT-4o等前沿模型。開源部署版本的安全性雖不及具備外部風(fēng)險(xiǎn)控制系統(tǒng)的版本,但仍擁有中等水平的安全保障。
《自然》雜志評價(jià)道:目前幾乎所有主流的大模型都還沒有經(jīng)過獨(dú)立同行評審,這一空白“終于被DeepSeek打破”。隨著AI技術(shù)日漸普及,大模型廠商們無法驗(yàn)證的宣傳可能對社會帶來真實(shí)風(fēng)險(xiǎn)。依靠獨(dú)立研究人員進(jìn)行的同行評審,是抑制AI行業(yè)過度炒作的一種有效方式。(宜月)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。