8月19日,據(jù)2024北京人工智能生態(tài)大會發(fā)布的消息,高價值語料可信流通基礎設施啟動建設。在區(qū)塊鏈、隱私計算等前沿信息技術的護航下,支撐人工智能大模型高質(zhì)量成長的語料數(shù)據(jù)將告別無序流通,轉(zhuǎn)入規(guī)范運行的“高速公路”,這對于加快形成人工智能大模型訓練高地,推動我國人工智能實現(xiàn)“彎道超車”和跨越式發(fā)展具有重要意義。
據(jù)悉,高價值語料可信流通基礎設施,是由新華社國家重點實驗室、人民網(wǎng)、高等教育出版社、中國通用技術集團等10余家我國語料數(shù)據(jù)重點單位共同打造。以區(qū)塊鏈、隱私計算為代表的新一代信息技術,憑借可信存證、不可篡改、易確權、充分保護數(shù)據(jù)隱私安全等特點,可以保障語料數(shù)據(jù)可信安全地流通、使用和管理,有效破解上述難題。
相關負責人介紹,高價值語料可信流通基礎設施將運用我國自主可控、性能領先的區(qū)塊鏈軟硬件技術,搭建起覆蓋全國的分布式語料數(shù)據(jù)互聯(lián)互通橋梁,鏈接語料供給方、加工方、需求方,實現(xiàn)全國分布式語料數(shù)據(jù)可信接入,跨地域可發(fā)現(xiàn)、可訪問,形成高質(zhì)量語料數(shù)據(jù)集。同時,運用創(chuàng)新隱私計算技術,通過“數(shù)據(jù)不出域、可用不可見”的方式,保障大模型高價值語料數(shù)據(jù)在處理加工和模型訓練過程中無法二次非授權傳播。此外,該基礎設施還將通過智能合約開展鏈上激勵,為語料資源供給與流轉(zhuǎn)提供持續(xù)性的內(nèi)生動力。
據(jù)了解,在高價值語料可信流通基礎設施的支撐下,國家語料數(shù)據(jù)的重點單位還將開展基于區(qū)塊鏈與隱私計算的語料數(shù)據(jù)可信安全流通規(guī)范制定,形成高價值語料數(shù)據(jù)流通與增值的可持續(xù)生態(tài)。
來源:人民郵電報記者 伍樹
評論