(1)
百度百科內容正確性的現存風險 百度百科是由網民共同參與編輯的網絡百科全書平臺。截止 2018 年 6 月,累計 654萬名用戶參與詞條編輯,共形成 1542 萬個詞條,1.4 億個版本。百度百科詞條的內容均 是以多人協作、版本迭代的方式逐步編寫而成。用戶的每次操作,如創建新詞條或修改 詞條內容,均會形成一個新的版本。通過版本的不斷迭代,一個詞條才逐步趨向完善。
為了保證詞條內容的正確性,百度百科把單個詞條所有審核通過的版本按照時間順 序排列,形成該詞條完整的編輯記錄,實現編輯者、編輯時間、編輯內容可追溯。詞條 編輯記錄供全體網民公開查閱,當發現詞條內容存在爭議、錯誤和風險時,就可以“順 藤摸瓜”追溯到內容的源頭版本及其編輯者。
可見,詞條編輯過程可追溯是百科詞條內容正確性的基礎保障設施。然而,當前詞 條編輯記錄的公正透明性還無法得到各方的共同認同。因為,目前詞條的編輯記錄均存 儲在百度的服務器上,這是一種中心化的存儲方式,很多人因為自身的利益惡意攻擊百 度隨意修改詞條。在信任缺乏的情況下,這份數據不能作為信息溯源的有效依據。
區塊鏈技術是把數據在多個節點存儲副本,由于其通過共識機制實現節點信任,數據變更需要經過其他節點確認,因此能夠有效地應對數據篡改、數據偽造的風險。 百度百科啟動詞條編輯記錄區塊鏈化的項目,運用區塊鏈技術“不可篡改”的特性,形成各方共同認可的、可信的詞條編輯記錄。再借助詞條編輯記錄的溯源能力,監督詞 條的編輯行為,追蹤風險內容,維護詞條的正確性。
區塊鏈能力賦能下的百度百科相比同類百科類產品,最大的優勢在于:修改歷史能 夠被可信地溯源——通過歷史版本記錄及區塊鏈信息,可以準確可信地確認詞條中每一 個事實、每一句描述的編輯者。
(3)百度百科與區塊鏈結合的技術實現方法
百度百科區塊鏈業務邏輯如圖 13 所示,藍色部分表示百科內容編輯的業務流程, 紅色部分表示區塊鏈相關業務流程。
整個業務邏輯在現有百科內容編輯的流程下,實現了區塊鏈功能:在用戶提交詞條 版本后,將版本內容的簽名信息寫入百度區塊鏈,以提供對用戶版本內容的認證能力。 在歷史版本頁面新增“區塊鏈信息”入口,用戶可以主動發起對區塊鏈信息的查詢和鑒 別。
(4)百度百科詞條編輯記錄功能介紹
每當用戶提交的新版本被審核通過時,詞條會被更新,同時會自動生成一條編輯記 錄,包括:更新時間、更新內容、貢獻者、修改原因等。新增功能如圖 14 所示,該條 編輯記錄的特征信息同時被存儲到區塊鏈上。用戶點擊區塊鏈信息列的“查看”鏈接, 就可以查閱存儲在區塊鏈上的信息。
存儲到區塊鏈上的編輯記錄,分布式存儲在多個節點。多個節點的數據通過區塊鏈 的共識機制相互印證,避免了百度單方面篡改區塊鏈上的版本特征信息的風險,并且可 以通過版本內容重新計算版本特征信息,與區塊鏈上的數據進行比對,保證編輯記錄數 據的公正透明性。
版權申明:本內容來自于互聯網,屬第三方匯集推薦平臺。本文的版權歸原作者所有,文章言論不代表鏈門戶的觀點,鏈門戶不承擔任何法律責任。如有侵權請聯系QQ:3341927519進行反饋。