互聯網數據處于“無主”壟斷的混亂狀態,數據隱私將是未來的最“痛點”。據BM Security和Ponemon Institute此前發布的《2018數據泄露損失研究》評估顯示,2018年全球數據泄露的平均成本為386萬美元,比2017年的報告高出6.4%。該研究還首次計算了與“超大型泄露(超過100萬條記錄)行為相關”的成本。評估顯示,大型數據泄露代價高昂,百萬條記錄可致損失4000萬美元,5000萬條記錄可致損失3.5億美元。互聯網帶來各種便利的同時人們不應該忘記自身數據處于泄露風險之中,同時數據還在“喂養”互聯網公司的AI機器人。
數據隱私的真諦是確權和使用權的交付,
區塊鏈的機制提供了數據市場的治理規則。移動時代數據隱私的保護呼聲愈烈,一方面是人們對數據作為一種潛力巨大的價值資源的認識越來越清晰,另一方面大量數據天然跟移動端的行為關聯,用戶越來越注意數據隱私的保護。過去的互聯網模式,數據主要存儲在互聯網公司的云端,用戶很難聲明對數據的所有權;另外,互聯網不斷產生的龐雜數據的確權也是出于模糊的“無主”狀態,但所有數據實際上都是掌控在互聯網公司手中——無論他們如何聲明不會泄露數據,不泄露數據不代表我們享有所有權。越來越多的智能服務背后都是來自于互聯網公司AI機器人利用個人隱私數據進行機器學習的結果,這個過程中,用戶是被動的,利益上存在受損的嫌疑。
我們認為,數據隱私的真諦是確權和授權——即用代碼合約明確數據的所有權,通過代碼合約完成數據使用權的授權和支付交易。區塊鏈天然就是去中心化和分布式的賬本機制,具有數據加密、不可篡改、來源可溯的特點。大量移動端的數據,將由過去“無主”壟斷狀態,被區塊鏈網絡確權給用戶,而AI所需要的個人數據,可以由用戶向使用方授權完成,相關費用用
token完成支付。在數據領域,AI與區塊鏈的結合,一方面是數據層,兩者可以互相滲透,完全數據確權;另一方面是從應用層面入手,兩者各司其職,AI負責自動化的業務處理和智能化的決策,區塊鏈負責在數據層提供可信的授權。
移動端分布式學習技術的推廣將成為打破數據壟斷的關鍵一環。今年2月谷歌宣布實現了全球首個產品級的超大規模移動端分布式機器學習系統,目前已經能夠在數千萬部手機上運行。此產品利用聯合學習(FL,Federated Learning)方法,可以對保存在移動電話等設備上的大量分散數據進行訓練,是“將代碼引入數據,而不是將數據引入代碼”的更加通用化的一個實現。用戶的設備會下載一個當前模型,這個模型會從手機數據中學習不斷得到改善,然后將變化總結為一個小的關鍵更新。只有這個關鍵更新會以加密的方式被傳到云端,之后這一更新會在云端迅速被其他用戶對共享模型提交的更新平均化(averaged)。簡單說,所有的訓練數據都留在用戶的設備上,而且上傳到云端的個別更新也不會存儲到云端。新方法將機器學習與云端存儲數據的需求脫鉤,讓模型更聰明、延遲更低、更節能,而且保護用戶隱私不受威脅。聯合學習方法將使得移動終端數據的隱私得到充分的保護,互聯網公司云端服務器并不需要上傳用戶本地數據,將成為打破數據壟斷的關鍵一環。
版權申明:本內容來自于互聯網,屬第三方匯集推薦平臺。本文的版權歸原作者所有,文章言論不代表鏈門戶的觀點,鏈門戶不承擔任何法律責任。如有侵權請聯系QQ:3341927519進行反饋。