未來的商業(yè)競爭,是數據的競爭。
隨著數字經濟在全球的加速推進以及 5G、人工智能、物聯(lián)網等相關技術的快速發(fā)展,數據影響商業(yè)競爭的關鍵戰(zhàn)略性資源地位的觀點,已經獲得普遍認可。只有獲取和掌握更多的數據資源,才能在新一輪的全球商業(yè)競爭中占據主導地位。
2014年3月,“大數據”一詞首次被寫入政府工作報告,大數據開始成為國內社會各界的熱點。2016年3月,《十三五規(guī)劃綱要》正式提出“實施國家大數據戰(zhàn)略”,國內大數據產業(yè)開始全面、快速發(fā)展。隨著國內大數據相關產業(yè)體系日漸完善,各類行業(yè)融合應用逐步深入,國家大數據戰(zhàn)略走向深化階段。
2020年,數據正式成為生產要素,數據要素市場化配置上升為國家戰(zhàn)略??梢姡?ldquo;大數據”已經不僅是大量的數據,更進化成一種全新的思維方式和時代標志。從數據到“大數據”,數據之大,究竟何為?
從體量之大到價值之大
大數據,顧名思義,可以解釋為大量的數據。大數據技術,則是通過獲取、存儲、分析,從大容量數據中挖掘價值的一種全新的技術架構。
從數據的體量來看,傳統(tǒng)的個人電腦、處理的數據,是GB/TB級別的數據。其中,1 KB = 1024 B (KB - kilobyte) ;1 MB = 1024 KB (MB - megabyte) ;1 GB = 1024 MB (GB - gigabyte) ;1 TB = 1024 GB (TB - terabyte) 。比如,硬盤就通常是1TB/2TB/4TB的容量。
而大數據則處理的是PB/EB/ZB級別的數據體量。其中,1 PB = 1024 TB (PB - petabyte) ;1 EB = 1024 PB (EB - exabyte) ;1 ZB = 1024 EB (ZB - zettabyte)。
如果說一塊1TB的硬盤可以存儲大約20萬張的照片或20萬首MP3音樂,那么1PB的大數據,則需要大約2個機柜的存儲設備,儲存約為2億張照片或2億首MP3音樂。1EB,則需要大約2000個機柜的存儲設備。
當前,全球數據量仍在飛速增長的階段。根據國際機構 Statista的統(tǒng)計和預測,2020年全球數據產生量預計達到 47ZB,而到2035年,這一數字將達到2142ZB,全球數據量即將迎來更大規(guī)模的爆發(fā)。換言之,大數據時代已真正降臨。
除了體量之大,大數據真正的“大”還在于其發(fā)揮的價值之大。早在1980年,著名未來學家阿爾文·托夫勒在他的著作《第三次浪潮》中,就明確提出“數據就是財富”這一論斷,大數據的核心本質,就是價值。
事實上,社會各界之所以對大數據抱以極大的熱情,認為引入大數據能夠提高自身的競爭力,是因為通過大數據處理與分析,人們能夠洞悉客戶、友商、產品、渠道在各個維度的信息情報和知識洞見,借此為創(chuàng)新應用模式及商業(yè)模式的設計提供研判線索和技術基礎。
以芝麻信用為例,其從身份特質、行為偏好、人脈關系、信用歷史、履約能力等多個角度對一個自然人的相關數據進行搜集和匯聚,在此基礎上對個人進行信用研判。根據信用評級就可以進一步進行信用騎行、便利交通、基礎通信、信用借還、信用回收等一系列產品的設計和運維。
此外,作為一種商品,數據可以買賣,可以增值,這也是大數據時代的一個基本特征。
國外數據交易大致開始于2008年,一些前瞻性的企業(yè)開始加大對數據業(yè)務的投入。初見端倪的數據應用新業(yè)態(tài)包括“數據市場”、“數據銀行”、“數據交易公約”等,知名數據服務商則有Microsoft數據市場、Amazon公共數據集、Oracle在線數據交易等。
國內數據交易則起步于2010年左右。2015年9月,我國發(fā)布的《促進大數據發(fā)展行動綱要》中明確提出要引導培育大數據交易市場,開展面向應用的數據交易市場試點,探索開展大數據衍生產品交易,建立健全數據資源交易機制和定價機制。
可以說,不同利益主體迥異的價值期望都是大數據價值實現(xiàn)的目標,也正因為大數據的“大價值”,才引發(fā)了社會各界對大數據的普遍關注。
在向好里審慎大數據的未來
大數據的價值在2020年疫情的強壓力測試下得以彰顯。
比如,通過大數據可以對疫情監(jiān)測追蹤和防控救治。在疫情趨勢研判、流行病學調查、輿情信息動態(tài)、人員遷徙和車輛流動、資源調配和物流運輸等方面,通過政企合作開發(fā)大數據分析產品或服務,為政府、企業(yè)和公眾提供實時動態(tài)的信息以輔助決策。
諸多大數據企業(yè)和互聯(lián)網平臺發(fā)揮了大數據技術的優(yōu)勢,為人們提供線上教育、在線醫(yī)療、遠程辦公、無接觸外送、在線娛樂等服務,大批中小微企業(yè)開啟數字化轉型。
在大數據技術一片利好的景況下,大數據實現(xiàn)狂飆突進。但也正因為如此,我們才更應認真審視大數據的發(fā)展和未來。
其中,數據的品質——數據的準確性、完整性、可追溯性、持續(xù)性、真實性和共享性,決定了大數據價值實現(xiàn)的最終成果。針對特定領域的數據集越龐大、越真實、越準確、越可追溯、維度越豐富、越協(xié)同共享,越能得出最佳算法并帶來競爭優(yōu)勢。
然而,從準確度來看,盡管用戶源源不斷地產生數據,對于企業(yè)來說,數據的收集和存儲能力并不構成障礙,但90%的數據沒有被真正利用起來,成了“廢數據”。
數據的準確性,特別要強調與特定場景的相關度。比如,傳媒、金融、醫(yī)療等各行業(yè)需要的細分數據不同,具體到同一行業(yè)的子領域也不同。比如,在醫(yī)療領域,心血管疾病和癌癥診斷所要的細分數據就不一樣。但現(xiàn)下,大部分人工智能的應用場景,都是針對一個具體的任務。
就融通和共享來看,數據的品質也并不理想。政府服務方面,來自各個部門、各個渠道的數據口徑不規(guī)范、標準不統(tǒng)一、時間不準確、可信度不高等問題較為普遍。并且,數據質量堪憂,數據資源統(tǒng)籌管理不足,導致數據散而不聚、聚而不通、通而難用。
而促進政務數據、公共數據共享開放的制度規(guī)章和政策措施也還不健全,限制數據有序安全流動的體制機制障礙仍然存在,信息孤島、數據壁壘問題突出。分級分類、權責清晰的數據管理制度體系還未建立。數據要素市場培育發(fā)展滯后,數據交易流通體系建設尚處探索初期,企業(yè)間、行業(yè)間數據共享開放不理想。
除了數據的品質外,大數據的最大挑戰(zhàn),就是安全。數據是資產,也是隱私。沒有人愿意自己的隱私被暴露。所以,人們對自己的隱私保護越來越重視。對數據安全和個人隱私的保護,是大數據行穩(wěn)致遠的重要因素。
然而,現(xiàn)階段,卻尚未建立起適用于大數據環(huán)境下的數據分類分級安全保護制度。個人信息保護和數據安全管理跟不上快速發(fā)展的形勢需要,存在個人隱私泄漏、數據泄露以及數據濫采濫用、不當使用和違規(guī)違法交易數據等風險。而即使企業(yè)合法獲取數據,也要擔心是否會被惡意攻擊和竊取。
最后,數據監(jiān)管仍相對滯后。行業(yè)、企業(yè)及機構數據龐雜分散和集中集聚現(xiàn)象并存,互聯(lián)網巨頭存在利用數據不公平競爭、限制競爭的壟斷風險,針對大數據“殺熟”、平臺“二選一”等問題的數據和算法監(jiān)管相對空白。
近年來,大數據技術的內涵伴隨著大數據時代的發(fā)展產生了一定的演進和拓展,從基本的面向海量數據的存儲、處理、分析等需求的核心技術延展到相關的管理、流通、安全等其他需求的周邊技術,逐漸形成了一整套大數據技術體系,成為數據能力建設的基礎設施。
如今,大數據已進入一個新的發(fā)展階段,一個需要技術、產業(yè)和制度、標準協(xié)同推進的新階段。大數據作為一個時代熱詞,更代表了一種全新的思維方式和時代標簽。時代誕生了大數據技術,大數據技術也正重塑著時代。
評論