隱私計算:讓數(shù)據(jù)“可用不可見”
◎本報記者 張 曄
隱私計算又被形象地稱為“可用不可見”的技術,是涵蓋眾多學科的交叉融合技術,目前主流的隱私計算技術主要分為三大類:以多方安全計算為代表的基于密碼學的隱私計算技術,以聯(lián)邦學習為代表的人工智能與隱私保護技術融合衍生的技術,以可信執(zhí)行環(huán)境為代表的基于可信硬件的隱私計算技術。
(資料圖片僅供參考)
4月4日,北京國家金融科技認證中心公布了首批“多方安全計算金融科技產(chǎn)品國推認證”名單,包括螞蟻集團兩項產(chǎn)品在內(nèi)的首批5項產(chǎn)品通過了該認證。
這是國內(nèi)首次對多方安全計算金融領域應用展開認證工作,也是目前國內(nèi)唯一針對該領域的“認證”,此次認證結(jié)果的發(fā)布,意味著數(shù)據(jù)要素市場的相關市場準入標準和監(jiān)管體系迎來進一步完善。
作為隱私計算產(chǎn)品的重要底層技術,多方安全計算技術能夠在保護數(shù)據(jù)隱私的同時,實現(xiàn)不同機構(gòu)之間數(shù)據(jù)的合法合規(guī)融合,實現(xiàn)安全的多方數(shù)據(jù)查詢和分析,進一步打破各方之間的數(shù)據(jù)壁壘,連接數(shù)據(jù)孤島,有效實現(xiàn)數(shù)據(jù)價值的轉(zhuǎn)化與釋放。
為數(shù)據(jù)價值而生的隱私計算
伴隨著云計算、大數(shù)據(jù)、人工智能等新一代信息技術的快速發(fā)展,數(shù)據(jù)已經(jīng)成為基礎性關鍵戰(zhàn)略資源,同時也是數(shù)字經(jīng)濟時代的核心生產(chǎn)要素。
但是,在信息技術蓬勃發(fā)展的同時,數(shù)據(jù)也面臨著一系列嚴峻的安全挑戰(zhàn),不僅包括公民個人信息和隱私的安全隱患,也包括政府和企業(yè)數(shù)據(jù)資產(chǎn)的泄露風險。近年來,數(shù)據(jù)泄露事件層出不窮,出于安全顧慮,數(shù)據(jù)價值鏈不同環(huán)節(jié)之間的流動受阻,分工協(xié)作關系脆弱,很難形成有效閉環(huán)。
大數(shù)據(jù)時代,如何在保障數(shù)據(jù)安全的同時又不影響數(shù)據(jù)要素的使用,是每一個數(shù)據(jù)生產(chǎn)者和獲益者應該考慮的事情。
1982年,著名計算機學家、中國科學院院士姚期智提出了經(jīng)典的“百萬富翁”問題:張三和李四都是富翁,他們想知道誰更富有,但他們都想保護好自己的隱私,不愿意讓對方或者任何第三方知道自己真正擁有多少財富。如何在保護好雙方隱私的情況下,計算出誰更有錢?
在普通人看來,這幾乎是一個無解的悖論。但是姚期智就此提出了“多方安全計算”的概念,即“一組互不信任的參與方在需要保護隱私信息以及沒有可信第三方的前提下進行協(xié)同計算”。
近年來,我國多部與數(shù)據(jù)安全相關的法律法規(guī)落地實施,包括《網(wǎng)絡安全法》《個人信息保護法》《密碼法》《數(shù)據(jù)安全法》以及《民法典》,形成了較為完備的安全法律體系,隱私計算為需求強烈但瓶頸重重的數(shù)據(jù)流通提供了破局思路。
隨著政策落地以及各方關注度的提升,隱私計算已成為當下火熱的新興技術,躋身商業(yè)和資本競爭的熱門賽道,有業(yè)界人士將2020年稱為“隱私計算元年”。顧問咨詢公司高德納(Gartner)發(fā)布的《2021年重要科技戰(zhàn)略趨勢》中,也將隱私計算列為未來幾年科技發(fā)展的九大趨勢之一。
多技術融合保護數(shù)據(jù)安全
隱私計算又被形象地稱為“可用不可見”的技術??床灰姅?shù)據(jù),卻又能實現(xiàn)對數(shù)據(jù)的計算分析,隱私計算是如何做到的?
螞蟻集團隱私智能計算技術部總經(jīng)理王磊告訴科技日報記者,隱私計算是涵蓋眾多學科的交叉融合技術,發(fā)展初期匯聚了多種不同種類的技術,目前主流的隱私計算技術主要分為三大類。
第一類是以多方安全計算為代表的基于密碼學的隱私計算技術;第二類是以聯(lián)邦學習為代表的人工智能與隱私保護技術融合衍生的技術;第三類是以可信執(zhí)行環(huán)境為代表的基于可信硬件的隱私計算技術。
以多方安全計算為例,其主要邏輯是在沒有可靠的第三方(中介)的情況下,各方通過事先約定的密碼學協(xié)議進行交互,完成預定的計算任務,每個參與方無法得知其他方輸入的信息,只能得到計算結(jié)果。
“每一類技術路線都有各自的特點,適用于不同的應用場景?!蓖趵谡f,例如聯(lián)邦學習適用于對性能和規(guī)模要求較高的建模場景,多方安全計算安全性更高,基于可信硬件的隱私計算可以支持更復雜的計算需求。
但是,從近年來的技術發(fā)展趨勢和行業(yè)需求來看,想要通過單一技術“包打天下”幾乎不可能,現(xiàn)實需求往往需要不同的隱私計算技術組合使用,在保證原始數(shù)據(jù)安全和隱私性的同時,完成對數(shù)據(jù)的計算和分析任務。
王磊告訴記者,以螞蟻集團隱私計算的技術路線為例,從最早基于矩陣掩碼的數(shù)據(jù)變換方案,到基于多方安全計算和可信執(zhí)行環(huán)境的兩套技術路線,再到后來的多種技術融合路線,并催生了可信隱私計算開源框架“隱語”和隱語開放平臺。“隱語”提供的是代碼,主要面向開發(fā)者,好比把原材料都準備齊全,就看開發(fā)者怎么做出一桌色香味俱全的大菜;而隱語開放平臺則可以讓用戶直接調(diào)用各項功能,好比平臺提供了預制菜,只要根據(jù)個人需求簡單加熱調(diào)味即可。
金融領域應用最廣泛
當前,隱私計算應用最廣泛的是金融行業(yè)。例如,招商銀行啟動了“慧點隱私計算平臺互聯(lián)互通項目”,交通銀行則啟動了監(jiān)管沙盒項目,中國工商銀行、中國農(nóng)業(yè)銀行也不同程度的在相關業(yè)務中嘗試性地應用了隱私計算工具。
“傳統(tǒng)的金融機構(gòu)風險管理模式,除了調(diào)查走訪外,主要是利用本單位數(shù)據(jù)和征信系統(tǒng)查詢用戶信息,這種方式對用戶的風險判斷不夠全面?!蓖趵诒硎?,基于多方安全計算的金融風控全鏈路解決方案,可以調(diào)用不同機構(gòu)的多個信息渠道對潛在用戶的歷史記錄進行多維度計算分析,各金融機構(gòu)、信息渠道可形成征信系統(tǒng)聯(lián)盟,能為各方提供數(shù)據(jù)分析服務,且數(shù)據(jù)無須離開本地,調(diào)用數(shù)據(jù)的過程中,數(shù)據(jù)不再以明文(即數(shù)據(jù)不加密)形式出現(xiàn),而是通過安全協(xié)議共享,任何人都無法從中窺探到原始信息,這就是隱私計算相較于傳統(tǒng)金融機構(gòu)風險管理模式所帶來的重要改變。
除了金融行業(yè),隱私計算在醫(yī)療行業(yè)、保險理賠、政務信息等領域也有非常大的應用空間。
例如,過去保險機構(gòu)在理賠過程中,會向醫(yī)療機構(gòu)明文查詢被保險人的診療情況,而獲得的原始數(shù)據(jù)往往涉及用戶隱私。2018年,螞蟻集團嘗試將隱私計算技術應用到保險理賠場景,通過設定數(shù)據(jù)邏輯查詢,利用多方安全計算等隱私計算技術,使得保險公司只獲得是否理賠的結(jié)果,不會獲得原始數(shù)據(jù),從而實現(xiàn)數(shù)據(jù)“可用不可見”,保護理賠用戶隱私。
在醫(yī)療行業(yè),全球抗擊新冠疫情數(shù)據(jù)共享也運用到了隱私計算,這使各方可以在不公布詳細數(shù)據(jù)的情況下,聯(lián)合其他科研人員協(xié)同進行病例樣本基因組的聯(lián)合分析并共享結(jié)果,實現(xiàn)了對病毒流行病學情況的實時追蹤和對未來毒株演化的預測,成為抗擊疫情的一把利劍。
王磊表示,自計算機誕生以來,數(shù)據(jù)一直是明文流通和應用,面向數(shù)字經(jīng)濟時代,安全地用好數(shù)據(jù)成為繞不過去的坎。今后,法規(guī)政策和技術進步都將助推數(shù)據(jù)要素告別明文流通,開啟“數(shù)據(jù)密態(tài)時代”的新征程,在數(shù)據(jù)密態(tài)時代最有潛力的支撐性技術非隱私計算莫屬。
關鍵詞: