APP
關注小程序

關注小程序

微信公眾號
二維碼 無錫不銹鋼網

「火星公開課」第133期|Allan Zhang:用區塊鏈驅動人工智能

火星財經 ·

08月23日

熱度:

區塊鏈會帶來高質量數據的爆發,這是中小項目和公司的機會。

「火星公開課」第133期|Allan Zhang:用區塊鏈驅動人工智能

人工智能、區塊鏈無疑是當下最為熱門的技術。前者代表先進的生產力,后者代表新的生產關系。

那么,當人工智能遇上區塊鏈,究竟會碰撞出什么樣的火花呢?

7月28日22:00,應「火星財經創始學習群」輪值群主向亞貞、副群主徐英凱邀請,DxChain創始人Allan Zhang結合自己的項目分享了如何用區塊鏈驅動人工智能的發展。

他認為目前區塊鏈最大的瓶頸之一是在存儲和計算領域,缺少一個真正好的提供和存儲和計算的基礎公鏈。為此,他跟團隊創辦了DxChain,試圖打造以區塊鏈存儲和計算為核心的下一代技術公鏈,通過區塊鏈技術讓算力和存儲共享成為現實,從而降低算力和存儲成本,讓大數據和機器學習等更專注于算法的完善、模型的迭代,加速人工智能的發展。

以下為Allan Zhang分享原文,由火星財經(微信:hxcj24h)整理:

一、區塊鏈和人工智能的關系

我們先談談人工智能和區塊鏈之間的關系。

人工智能的發展離不開數據的喂養,離不開算力和存儲,算法再牛,也需要這些基礎設施的支持。

有趣的是,AI和區塊鏈是對立的,就像PeterThiel和ReidHoffman在最近對話中很好地表達過的觀點那樣。

「火星公開課」第133期|Allan Zhang:用區塊鏈驅動人工智能

AI是非常中心化的,AI僅掌握在少數公司手里,主要是Google、蘋果、Facebook以及Amazon(“GAFA”)以及中國的互聯網巨頭阿里巴巴、騰訊和百度(“BAT”)。

主要原因就是數據壟斷在他們的數據黑盒子中,對于創業公司或項目來說,AI的中心化為各種濫用打開了大門,Facebook的事情我們在這里不做贅述了。

區塊鏈的出現是對壟斷組織問題的強力回應,在技術上提供了可能性。

這個想法大概是這樣:我們所有人都會受到金融激勵來提供個人數據和專業數據。在知道這些數據可以安全保證安全和隱私(通過去中心化和安全計算)的情況下,我們對共享敏感數據(開支、健康信息)會感到更加放心。跟GAFA掌握的那些相比,隨著時間轉移,市場會積累越來越多的大量數據,數據的質量也會越來越高。

而中小人工智能廠商也有機會以更低成本獲得高質量的數據。這是破解傳統互聯網時代數據壟斷的最佳方式。可以說,區塊鏈會帶來高質量數據的爆發,這是中小項目和公司的機會。

除了數據,人工智能還需要算力和存儲。對于財力不雄厚的中小公司來說,這也是一個很高的門檻。

而區塊鏈正好帶來去中心化的算力和存儲共享服務,可以通過激勵算力和存儲礦工貢獻自己的服務,從而降低成本。這讓中小人工智能企業,各個行業也有了以較低成本構建自己的大數據和機器學習平臺和應用的機會。

DxChain項目正是通過區塊鏈技術,為數據需求的雙方搭建數據交易市場,讓對高質量數據有需求的企業可以更低成本、更高效地獲得數據,而用戶也無需擔心自己的隱私泄漏,還可以獲得價值回饋,實現雙贏。

同時,DxChain還努力通過區塊鏈技術讓算力和存儲共享成為現實,從而降低算力和存儲成本,讓大數據和機器學習等更專注于算法的完善,模型的迭代,加速人工智能的發展。

二、詳解DxChain架構

接下來我們詳細解釋DxChain如何將區塊鏈和AI結合在一起。

要在去中心化數據存儲的基礎之上,提供去中心化的大數據分析和機器學習計算,要求很高。為了達成這個目標,我們從基礎架構上做了一些創新,去解決目前的存儲和計算瓶頸。

我們認為,單靠一條主鏈很難同時滿足數據的存儲、計算和隱私需求,從而借鑒了閃電網絡多鏈的思路,添加了存儲鏈、計算鏈兩條側鏈,讓主鏈只負責運行智能合約,管理存儲和計算側鏈,而兩條側鏈各司其職,分別負責存儲和計算。

「火星公開課」第133期|Allan Zhang:用區塊鏈驅動人工智能

DxChain主鏈使用基于賬戶的模型進行交易和資產信息的存儲,包括賬戶狀態、跨賬戶交易和收據。它有常規賬戶和合約賬戶。DxChain兼容以太坊的數據結構,由哈希鏈接的區塊組成。數據存儲在網絡全節點中。

數據側鏈建立在P2P分布式文件存儲系統上,存儲非資產類信息。計算側鏈主要是為了完成計算任務,計算任務是基于真實業務需求的任務。計算單元可以讀取數據側鏈的數據,并把結果寫入數據側鏈。

當任務完成時,最終的狀態會通過智能合約存儲在主鏈上。中間狀態或任務級交易信息保存在側鏈中。數據側鏈和計算側鏈通過鏈上鏈微服務實現互操作,可以進行數據和消息互通。側鏈則通過智能合約跟主鏈進行溝通。

我們把這種架構稱為“三鏈合一”模式。這種設計有助于實現它為大數據和機器學習提供計算和存儲服務的目標,這跟比特幣主要用于實現金融交易的目的不同。設計側鏈架構的核心目的是為了高效、擴展性以及滿足具體的業務場景需求。

DxChain主鏈保持低成本,側鏈實現計算和數據存儲的高效,并通過智能合約實現主鏈和側鏈溝通,最終形成一個整體的服務架構。因為要實現去中心化,存儲側鏈和計算側鏈都有自己的共識算法。

另外,通過把側鏈的有效交易寫入主鏈,可支持主鏈和側鏈之間的資產轉移,側鏈和主鏈使用相同Token,側鏈也可以定義自己的Token。

三、去中心化的算力服務

計算能力上面,AI很多最近的進展都是在計算能力的大規模提升的促進下取得的,這既是更好利用現有硬件的結果,也是因為開發出了特別針對AI的新的高性能硬件(比如Google的TPU)。

DxChain要為大數據和機器學習提供算力服務。它通過去中心化的方式來解決這個問題,一是可以把空余算力共享出來,二是算力也會因為基于特定任務而被高效利用。

DxChain的算力跟比特幣的算力不同,它不僅是為了網絡安全,同時也解決實際業務需求。而DxChain不是要提供一種數字貨幣,而是提供一個去中心化的計算環境。

為了驗證計算的正確性,需要共識機制來確保。DxChain提出了兩個共識算法:一是驗證博弈(Verification game),一是可證明數據計算(Provable Data Computation)。

驗證博弈用來驗證計算過程的正確性。可證明數據計算可以從一組不被信任的節點中找到一個小概率被攻擊的正確答案。

驗證博弈的核心角色是求解者、挑戰者以及法官。求解者是礦工,負責完成計算任務,提供解決方案;挑戰者則不同意求解者的解決方案;法官則提供正確的計算。

驗證博弈并不關心參與者的聲譽或系統中的任何受信方。它有一個懲罰機制,求解者和挑戰者執行任務都需要押金。任何犯錯的參與角色,都會失去押金。這樣會讓不受信任玩家被淘汰。

可證明數據計算中,一個計算任務通過網絡進行廣播,N個節點執行任務,生成同一答案的最先M個節點答案為有效答案。

DxChain還整合Hadoop實現去中心化的計算。Hadoop的核心組件是作業跟蹤器(jobtracker)、任務跟蹤器(tasktracker)、map-reduce中的工作節點。參考Hadoop,DxChain設計了D-Jobtracker和D-Tasktracker的角色。在DxChain的去中心化系統中,角色需要押金,礦工誠實執行任務,可獲得報酬,否則失去押金。

Map-reduce是中心化的系統。它的作業跟蹤器負責管理集群資源和任務調度。任務跟蹤器管理節點中的任務,同時跟作業跟蹤器通信。而DxChain是去中心化的系統,在分布式網絡中保持兩個節點的實時通信很不容易。在DxChain中,不需要檢查任務節點的狀態,一個節點或幾個節點離線,不會對最終結果產生影響。而在Hadoop系統中,它會通過心跳來了解節點活躍度,如果節點出現問題,作業跟蹤器需要重新分配任務到新節點。

節點完成計算,作業跟蹤器將結果發送到計算側鏈,驗證博弈或可證明數據計算會進行驗證。計算側鏈保存工作分配信息和結果。任何礦工節點都可以領取任務。

四、去中心化的數據存儲服務

我們認為,出于AI訓練的目的你需要創建自己的數據,DxChain的經濟模型能夠鼓勵用戶上傳數據,解決了AI數據從何而來的問題,這就引出了區塊鏈的存儲問題。

DxChain提供了去中心化的存儲網絡,它把計算結果和計算中間狀態存儲為文件。

數據側鏈會建立在P2P分布式存儲網絡上,比如IPFS、Swarm等。數據側鏈是激勵層,它本身不用做數據存儲。數據和文件被分成小塊,存儲進入P2P網絡。

同時,小塊的元信息和哈希采用類似MerklePatricia Tree結構存儲在側鏈中,表示文件狀態。為了數據跨鏈互通,DxChain為文件設計了跨鏈統一資源標示符。

在側鏈和P2P存儲網絡之間,DxChain還有一個虛擬邏輯層,包括存儲任務發布者、文件導入和導出的礦工、驗證者。

因為是去中心化的方式,提供存儲的礦工需要有一個共識機制來進行激勵和確保網絡安全。

DxChain存儲側鏈的共識機制是時空證明(Proofof Spacetime),用它來驗證存儲貢獻。數據側鏈管理存儲任務,連接到主鏈可以為存儲礦工給到獎勵,連接到計算側鏈可以存儲計算狀態。它具有交易費用低、交易速度快、更好隱私保護等特點。

時空證明改進了“數據持有性證明(ProvableData Possession)”,讓它更適合去中心化的環境。數據持有性證明主要是為了允許客戶在不可信服務器上存儲數據,在不檢索數據的前提下,驗證服務器是否存儲其原始數據。從客戶端持續發送挑戰,驗證服務器是否存儲某文件,確保在一定的連續時間內存儲了某文件。

時空證明則是適用于去中心化網絡的,它通過算法能夠預防女巫攻擊,確保系統的完備和安全。任何誠實的節點存儲了文件,它能夠產生有效證明并說服驗證者,同時它也能阻止各種惡意攻擊行為。

時空證明共識也是可以公開驗證的。為了保護隱私和防止其他惡意行為,時空證明還通過零知識證明等實現驗證,可以向驗證者證明自己,同時不揭示具體內容。

五、隱私保護

去中心化的AI市場要想見效,你需要能夠保證個人和公司所提供的任何數據都是以完全私密的方式進行處理的,這就不得不談到隱私問題。

對于隱私問題,業界公鏈采用了幾種形式,比如同態加密(Homomorphicencryption),還有多方計算(Multi-PartyComputation),這兩種都是通過計算去加密保護隱私,目前常見的還有SGX,這是通過硬件去加密。

DxChain采用的是一種更實際的解決方案——對關鍵數據信息加密,從而做到隱私保護。

由于我們能夠做到對數據細密度的操作,數據入鏈時都是有結構的,比如數據形成一個表格,有一列是人的姓名,我們就對人名這一列關鍵信息加密,但是其他的信息公開,不是把整個文件都加密,這種叫做數據模型支持的數據加密。

除此之外,DxChain還用到差分隱私。差分隱私可以降低一個用戶傾斜查詢結果的概率,也就是降低讓信息可以追溯到某個用戶的概率。如果只是為統計分析提供數據,比如平均值,DxChain可以有工具方便用戶在提交文件到網絡之前運行差分隱私。

三是礦工存儲加密。每個本地節點使用存儲礦工的公鑰對數據塊進行加密??梢员Wo網絡免遭入侵。

四是把文件進行切分。一個大文件根據不同策略切分成小塊,只獲取其中一個部分不會泄漏整體信息。最后是在文件傳輸過程中加密。文件復制到存儲礦工之前,使用礦工的公鑰加密。

六、商業化

下面我們來談談AI和區塊鏈結合的市場前景。

一個去中心化的市場也許是創建AI的一個非常新穎的手段,但從中出來的任何東西仍然需要實現產品/市場匹配并且解決真正的問題,才能取得商業上的成功。從這個角度來說,垂直化的方向(工業、基因組、金融等)尤其有趣。

對于AI的發展來說,DxChain一旦落地,它就是一個AI基礎設施。對中小企業和項目尤其重要。很多中小公司缺乏高質量的數據。大多數高質量的數據都需要從其他大型公司購買,甚至花錢也無法獲得。

從數據共享和交換的角度,DxChain的數據模型對數據進行標準化,數據供應商可以開放API,實現數據的交易和共享。這對于有高質量數據需求的需求方來說,有很大的吸引力,尤其是人工智能廠商。

DxChain也是一個數據交易平臺。用戶可以定義交易哪些數據,以及交易的價格等。這會讓數據需求方和供應方都收益。

不僅如此,由于計算和存儲的成本也很高,DxChain通過構建去中心化的大數據和機器學習網絡,可以讓人工智能廠商降低成本,利用DxChain建立自己的機器學習平臺和應用。它的數據保存在存儲礦工的磁盤上,礦工共享帶寬,可以降低數據存儲和網絡流量成本。

比如醫療保健行業,通過智能設備可以為用戶提供遠程的診斷,讓更多人受益。但這樣的系統依然很貴,醫療保險費用不低,很多低收入人群無法獲益;醫療智能設備碎片化,很難集成;用戶的數據很容易被濫用。

這個時候,DxChain有機會發揮自身的優勢。它本身是一個去中心化的大數據和機器學習網絡。醫療行業的開發者可以利用它來構建自己的大數據和機器學習平臺和應用。

因為DxChain去中心化的方式,可以更高效利用計算和存儲資源,會降低自建人工智能平臺的成本,也會帶來醫療費用的降低,讓更多人能夠獲益。醫療智能設備,比如身體狀況追蹤器、智能手表等上傳的數據會被加密,會安全存儲到區塊鏈上,不會被泄漏和濫用。這些數據的使用,要得到用戶的授權,如果用戶愿意售賣自己的數據,還能獲得經濟收益。

最后,基于醫療設備采集的數據,可以讓醫療保健供應商建立自己的人工智能技術監測病人健康,提前作出預警。

總的來說,基于DxChain,各行業都可以構建自己的大數據和機器學習平臺和應用,可以極大降低人工智能發展的成本,可以幫助不同行業的開發者以更低成本獲取更多高質量數據,同時還能以更低成本獲得算力和存儲。這對于促進人工智能發展有很大的幫助。

七、對于行業未來的討論

AI和去中心化結合能夠帶來很多想象空間。

Fred Ehrsam在最近一篇blog中提到,區塊鏈可以提供一個有趣的組織模型來幫助各種AI機器人以透明的方式協作。

旅游就是機器人協作的例子:你可以讓一個機器人買飛機票,如果出現延誤的話,另一個機器人可以預測誤接的可能性,提議另一條路線,而第一個機器人可以變更預訂。所有這一切都是實時地在后臺自動進行的,完全消除了我們人類可能發生的摩擦。

SingularityNET項目是一個有趣的例子——這是一個非常有野心、非常復雜的項目,由很多部分組成。作為各種AI如何可以協作來創造出單個大腦的展示,他們開發出了Sophia,一個由SingularityNET驅動的Hanlon機器人。其講解視頻非常瘋狂,讓人想到《西部世界》。

Fred Ehrsam在這篇博文中指出,還可以想象AI以完全自治的方式去運行,這正是去中心化自治組織DAO的想法——一個完全由機器運營的去中心化組織,連有限的人為干預都沒有。比方說,展望未來你可以想象一個徹底去中心化版的Uber,車隊全都是由AI駕駛和管理的無人車。這里面將會有一個龐大的反饋回環,系統會不斷學習如何調度車輛,高效地運送人和處理各種物流任務,將許多技能和復雜性結合到一個自運營的體驗上。

不過這種AIDAO有一點比較可怕,那就是如果這樣一個組織真正去中心化和自治化的話,尚不清楚一旦出現紊亂如何才能阻止它繼續運轉。這可不像計算機拔掉插頭就能關機那么簡單。

問答環節:

Q1:目前其他項目是怎么做的?

A1:比較早期的項目比如Morpheo,這是一個用區塊鏈來分析醫學數據的項目。它并不是純粹的去中心化,使用可信的云平臺來存儲數據和計算。區塊鏈在這里是用來作為激勵機制的。

這個平臺里面的機器學習算法是公開的,但是上傳的數據是不公開的。個體可以上傳數據,然后各個算法對于這些數據都運行一次。他們可以因此來確定不同算法的性能。

由于數據的存儲目前還沒有被區塊鏈解決,所以這種雜合的系統被很多區塊鏈項目所采用,并不僅僅是AI的項目。

另外,很多深度學習的平臺和可信硬件的平臺紛紛和區塊鏈結合。

Q2:現在比較流行的深度學習可以在區塊鏈上運行嗎?

A2:由于深度學習在近幾年非常流行,所以一些區塊鏈項目是想做這一塊的。深度學習的開源程序有很多,比如Caffe,MXNet等等。其核心是通過GPU來加速矩陣運算。目前比較流行的區塊鏈做法是把矩陣運算拆解成很小的任務,然后分配給各個不同的計算節點。:

這種做法的問題是這種特殊設計的區塊鏈體系只是適合特定類型的深度學習,擴展性不好。另外深度學習的應用場景比較適合圖像、視頻等處理,這種任務通常對于大公司有實際意義。

Q3.:可信硬件和區塊鏈的結合是不是更好?

A3:可信硬件和區塊鏈的結合比如TEE吸引了很多眼球,目前有些項目是這么做的。這種項目其實更適合比較純粹的隱私保護。我曾經使用SGX嘗試過比較簡單的機器學習算法,比如說K-means算法。當數據小于400M的時候,大約需要5分鐘。一旦數據超過一定的容量,比如1.2G,需要運行2天。目前SGX對于內存的要求比較嚴格,所以性能上并不是特別好。單機運行SGX的時間不可控,另外針對SGX的程序也并不多。所以SGX即使在大公司中adoption也并不是很好。

在去中心化環境中,由于網絡的限制,性能會受到更大程度的限制。

Q4 AI和區塊鏈結合是不是一個偽需求?

A4:這兩個詞都是buzzword,如果簡單的放到一起就是一個偽需求。因為看到了很多不切實際的項目。如果單純的使用區塊鏈去做AI運算就是一個偽需求,因為效率一定是不好的。比如如果使用GPU運算8個小時這樣的操作,通常這樣的運算是使用者會擔負起買個好一點的顯卡。parametertuning不允許花更長的時間。所以modeltraining這樣的操作不應該在區塊鏈上允許。

AI的最大量的需求是使用比較常用的算法來發掘數據的價值。所以applymodel到實際數據會是一個比較實際的用法。這樣使用的前提條件是有數據,所以datacollection是最重要的一部分。DxChain比較適合一個整套的分析流程:datacollection, data cleaning, data anlysis and reporting。

Q5AI和區塊鏈結合什么時候可以看到真正的落地應用?

A5:AI在區塊鏈上的應用由于需要大量的存儲和計算,所以一定是在有了這樣一個系統以后才可以有真正的應用。這樣的應用會出現在數據密集、計算量在合理范圍的環境中。并且傳統的中心化應用并不work的這樣一個場景中。

我認為在醫療領域、IOT行業中,這樣的應用會比較現實并且有巨大的影響力,而且不是一個玩具類型的應用。DxChain目前正在朝著這個方向去努力,同時也希望有其它的項目能一起解決這個系統平臺的問題。

嘉賓簡介

Allan Zhang / DxChain創始人

Trustlook CEO,負責移動安全和網絡漏洞與威脅等方向的研究和開發,十年以上互聯網安全方面的經驗,8年數字貨幣的研究經驗以及五年區塊鏈投資經驗,曾是公司PaloAlto Networks 創始工程師,并在朗訊科技\nCircle網絡安全公司等開展安全方面最先進的研究,是一位充滿能量的連續創業家。

對話發起人

向亞貞/ QuarkChain CMO

上海交大本科,Johns Hopkins碩士,在華爾街與硅谷工作7年,曾先后任職于Argus,LinkedIn, Wish等世界名企,具有專業的金融、咨詢與技術背景。在QuarkChain主要負責市場,運營,公關等事務,對QuarkChain在全球啟動、受到密切關注和好評起了重要作用。

徐英凱Kevin/ BlockVC創始人

QuarkChain顧問,倫敦大學學院(UCL)計算機統計學與機器學習碩士。曾供職于瑞士信貸、閃銀奇異、鼎銘金融等大型金融科技企業;曾參與ETF產品設計和產業基金管理,管理規模超過10億人民幣;目前其區塊鏈資產管理規模超過2億美金,所投資項目包括:QuarkChain,NKN, Celer Network, IoTex, DxChain, VeChain, Republic Protocol, Certik等。


本文為火星財經原創稿件,版權歸作者所有,未經授權不得轉載,轉載須在文章標題后注明“文章來源:火星財經(微信:hxcj24h)”,若違規轉載,火星財經有權追究法律責任。

關鍵字: 火星公開課

(★^O^★)MG热带动物园APP下载 上海快三是真的吗 灰熊vs开拓 云南快乐10分前三组多少钱 易发棋牌苹果下载 篮网拉塞尔壁纸 快三是福利彩票的吗 体彩排三排五开奖结果 福建体彩十一选五开奖走势图 865连连棋牌游戏大厅下载 手机棋牌开挂神器下载 亿客隆 湖北30选5牛彩 海南麻将规则怎么有番 欢乐捕鱼之海底极乐 北京快3开奖手机版 大嘴棋牌游戏官网通化