證監(jiān)會科技監(jiān)管局局長姚前:建議構(gòu)建大模型訓(xùn)練數(shù)據(jù)的監(jiān)管體系
中證網(wǎng)訊(記者 昝秀麗)證監(jiān)會科技監(jiān)管局局長姚前3月7日在《中國金融》撰文稱,建議構(gòu)建大模型訓(xùn)練數(shù)據(jù)的監(jiān)管體系。
姚前表示,數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的關(guān)鍵是數(shù)據(jù),抓住高質(zhì)量數(shù)據(jù)這一“牛鼻子”,就能有效應(yīng)對以數(shù)據(jù)為核心的科技創(chuàng)新和產(chǎn)業(yè)變革。當(dāng)前AIGC(AI Generated Content,人工智能自動生成內(nèi)容)和ChatGPT充分展現(xiàn)了高質(zhì)量訓(xùn)練數(shù)據(jù)在產(chǎn)業(yè)價值創(chuàng)造中疊加倍增作用,大模型訓(xùn)練數(shù)據(jù)及其輸出結(jié)果將會是未來社會和生產(chǎn)中的一種重要的數(shù)據(jù)資產(chǎn),其有序流轉(zhuǎn)并合規(guī)使用也是發(fā)展數(shù)字經(jīng)濟(jì)的應(yīng)有之義。通過合理的機(jī)制理順市場中各參與方的數(shù)據(jù)權(quán)益關(guān)系和分配格局,并加強(qiáng)訓(xùn)練數(shù)據(jù)的依法合規(guī)監(jiān)管,是促進(jìn)大模型人工智能產(chǎn)業(yè)健康發(fā)展的關(guān)鍵。為此,姚前擬提出以下政策建議。
一是重點發(fā)展基于AIGC技術(shù)的合成數(shù)據(jù)產(chǎn)業(yè)。以更高效率、更低成本、更高質(zhì)量為數(shù)據(jù)要素市場“增量擴(kuò)容”,助力打造面向人工智能未來發(fā)展的數(shù)據(jù)優(yōu)勢。在強(qiáng)化數(shù)據(jù)要素優(yōu)質(zhì)供給方面,應(yīng)統(tǒng)籌兼顧自立自強(qiáng)和對外開放。可考慮對Wikipedia、Reddit等特定數(shù)據(jù)源建立過濾后的境內(nèi)鏡像站點,供國內(nèi)數(shù)據(jù)處理者使用。
二是構(gòu)建大模型訓(xùn)練數(shù)據(jù)的監(jiān)管體系。國家相關(guān)部門應(yīng)對大模型訓(xùn)練數(shù)據(jù)的處理和使用標(biāo)準(zhǔn)進(jìn)行統(tǒng)一規(guī)范;建立數(shù)據(jù)托管機(jī)制,對數(shù)據(jù)托管方進(jìn)行約束,要求數(shù)據(jù)托管方按照監(jiān)管機(jī)構(gòu)的規(guī)定對數(shù)據(jù)來源、處理結(jié)果以及使用去向等進(jìn)行監(jiān)測,從而使得模型的輸入、輸出結(jié)果符合監(jiān)管要求。
三是探索基于可信機(jī)構(gòu)或基于可信技術(shù)的數(shù)據(jù)托管方式。數(shù)據(jù)托管機(jī)構(gòu)可以由相關(guān)機(jī)構(gòu)組建數(shù)據(jù)托管行業(yè)聯(lián)盟,以共建共享的方式建設(shè);亦可利用區(qū)塊鏈技術(shù),基于聯(lián)盟鏈或有管理的公鏈,完善源端數(shù)據(jù)治理機(jī)制,實現(xiàn)數(shù)據(jù)的鏈上托管、確權(quán)、交易、流轉(zhuǎn)與權(quán)益分配。