1、 區塊鏈技術與云計算的關系
由于互聯網的普及,大量的多媒體信息(圖文音視頻等)造就了海量數據,這些數據大多是非結構化的。
分布式計算與并行計算:分布式計算是一種采用地理上不同的多個主機(集群)協同完成大量計算任務,從而替代巨型計算機的解決方案。并行計算是指多CPU并行處理,并行計算能夠提高計算效率,但是前提是程序算法要盡可能并行設計。
虛擬化:虛擬化是為了實現云計算而劃分資源的一種方法,包括兩個層面:物理資源池化和資源池管理。虛擬化有兩種,一種是將多個物理資源虛擬化成一個“大”的邏輯資源,另一種是在一個物理資源上劃分出多個“小”的邏輯資源。
目前云計算采用第一種虛擬化方式較多,部署方式上使用分布式集群,并行計算并沒有太多涉及(并行計算學術上還在研究中),然后可以處理海量數據,為龐大的接入終端群按需提供IT服務。可以簡單的理解為,分布式這種解決方案是為了快速地處理海量數據而提出的,而該方案最終的目的或表現形式就是為了實現“用硬件換時間”,將數據分布在多臺計算機上,同時處理(并行處理)帶某種屬性的數據集。從現實來看,很多微小型互聯網公司沒有能力或必要構建自己的分布式系統,會借助于本地資源外的云服務提供商,這樣可以使公司專注于產品和業務實現。
結合靈活的開發工具,DCC平臺可以幫助開發者發布軟件并賺錢,進而改變算力任務的組織和執行方式。此類平臺通過實現去中心微服務和異步任務執行,成為建設未來互聯網的基?。得益于計算價格的大幅降低,復雜的應用(如CGI渲染,科學計算,機器學習等)將惠及每個。
通過P2P網絡連接電腦,使應用所有者和個體用戶(算力“請求方”)可以從其他用戶租用算力(算力“供應商”)。這些算力資源可以完成對計算時間和計算能?有?定要求的計算任務。在當下,算力資源被中心化云服務商把控,受制于封閉網絡,外部?付系統和死板的運營模式。去中心化云算力設施可以做到基于以太坊(或同類公鏈)的?付轉賬系統,可以實現算力買家(請求方),賣家(供應商)及軟件開發者之間的直接支付。
2、DCC的優勢
1.除了自由的服務器、帶寬等資源外,還將計算需求分布到系統中的眾多節點中去,把用戶的先知資源利用起來,創造價值。
2.通過整合社會閑置的計算資源,來為企業或個人提供去中心化算力服務,基于token經濟,構建計算機算力買賣方市場。
3.相比傳統的云計算服務,其降低了云計算服務的門檻和使用費用,有利于云計算的普及。
3、商業模式
(1) Token經濟模型
雖然市面上的分布式算力平臺項目眾多,但是總的技術框架卻是大同小異,下面就以一個大概的框架來大概的描述這個Token經濟模型。
請求節點
這個節點一般由一些有計算需求的商家或是科學研究所來充當,一般實驗室或是自有的計算機數量已經不太符合他們目前的計算需求了,需要通過超算或是其他性價比較高的計算資源如全球分布式算力來達到目的。請求節點可能會被按照要求先將自己的需求文件(數據)按照規格先model好在進入網絡(ELastic)或是有其他節點來做做這個簡單歸類的工作。
以下為需要貢獻計算資源的節點
歸類節點
這個節點由CPU算力貢獻用戶來參與,通過分布式算力平臺針對對某種計算目的項目進行分類來設定一些比較簡單的分類算法來達到將數據歸類和model的效果,這樣子的目的是能夠將這些原本不規則的數據能夠更好處理同時能夠傳輸到專門處理該類數據的處理節點去。
處理節點
這個節點專門用于對特定類別數據的處理。由于從歸類節點或是從請求節點過來的數據的類別有千百種,對于特定的數據應該處理的方式或者說應該使用的model也不同,對于一些較為復雜的項目,對于能參與到這個項目中的機器和人要求較高。以下舉兩個例子:
在醫藥領域,如一些醫藥方面的數據如影像數據,對于這類數據的處理一般需要至少具備一定醫學知識的人員才可對這部分的數據進行處理計算得到合要求的數據。
AI和機器學習領域,這類別的數據訓練和處理更多的需要是大學的科研設備或者是有編程經驗的開發者們來當這個節點,因為需要使用特定的數據處理模型如KNN或是decision tree等,這些普通的CPU或是GPU貢獻者已無法滿足這類別數據的處理需求。
驗證節點
這個節點對于從多個處理節點傳輸過來的對于相同數據的處理結果進行判斷和篩選,一般只需要設備CPU貢獻即可。一般會將同一份數據處理任務下達到多個數據處理節點,這樣就可以在之后進行投票做判斷哪個數據才是符合要求的。這樣做雖然會造成數據冗余但是為最后結果的正確性得到了極高的保障同時配合榮譽機制等可以有效的解決數據造假問題。
(2)榮譽系統
由于這個平臺將不再是通過志愿的形式進行分布式貢獻算力,那么如何衡量每個人的算力貢獻便是一個新的問題。積分制和成員的段位可以是一個較好的方法來衡量一個用戶的貢獻多少。
有一種可能是按照完成的任務單元的數量來進行積分,但是因為在未來可以在分布式算力平臺上運行的項目可能目的或是運行方面的差異會很大,如當某一個數據包在某臺機器需要大概一個小時的時間完成,而另外一種數據包在同臺機器上運行則需要20倍的時間才能完成,這樣便會造成同一個任務單元所得到的獎勵相同但是工作量卻不一樣的事情發生,這樣顯然,用完成的任務數目來計量用戶的貢獻計算量是不可行的。同樣的,用完成處理一個任務所需要用到的cpu時間來衡量貢獻也是不可行的。既然通過一些特定的參數來概括一個用戶所產生的貢獻是不可行的,那么就需要使用一些算法來達到準確記錄每個用戶所實際完成的計算量以期達到公平準確的分發獎勵。因此,對于貢獻量的考量便應該從多個角度來參考。
(3)積分系統
比較可行的積分系統應該綜合考量一下幾個方面來對一個節點的貢獻進行計算:
設備的性能指數
不同性能的設備在運行處理同一個數據包時所造成的資源使用以及成本不同,應當針對不同的設備進行一個標準化的性能測試來得到一個合理的性能分數來進行進行加權。
提交結果的正確次數
在一個分布式算力平臺中需求方最在意的便是獲得的結果的質量如何,如果設備得到的結果是不符合要求或是由惡意用戶產生的無效結果那么對平臺的名譽損失是巨大的。那么可以做的便是按照提交正確結果的次數來進行評級,正確的應該進行獎賞升級,而錯誤的結果則應該基于懲罰降級。
可能會出現的問題:
性能測試不準
尤其是當跨操作系統平臺時,比如同一臺計算機分別安裝 Windows 版本客戶端和 Linux 版本的客戶端,做出的基準測試結果可能就相差比較大。
容易導致作弊
由于平臺需要開放服務端和客戶端的全部源代碼,如果用戶下載了客戶端的源代碼,自行編譯的過程中修改或優化原有的基準測試代碼,就可能導致他自制的客戶端的基準測試成績大幅偏高。
版權申明:本內容來自于互聯網,屬第三方匯集推薦平臺。本文的版權歸原作者所有,文章言論不代表鏈門戶的觀點,鏈門戶不承擔任何法律責任。如有侵權請聯系QQ:3341927519進行反饋。