新聞中心
數(shù)據(jù)庫(kù)里存儲(chǔ)了大量個(gè)人信息,包括一些非常敏感的資料,讓必須管理數(shù)據(jù)庫(kù)的公司十分頭痛。如今,運(yùn)用各種高級(jí)工具和技術(shù),數(shù)據(jù)庫(kù)開(kāi)發(fā)人員可以在保持信息私密的狀態(tài)下放心執(zhí)行各種操作。

專(zhuān)注于為中小企業(yè)提供網(wǎng)站制作、做網(wǎng)站服務(wù),電腦端+手機(jī)端+微信端的三站合一,更高效的管理,為中小企業(yè)織金免費(fèi)做網(wǎng)站提供優(yōu)質(zhì)的服務(wù)。我們立足成都,凝聚了一批互聯(lián)網(wǎng)行業(yè)人才,有力地推動(dòng)了上千多家企業(yè)的穩(wěn)健成長(zhǎng),幫助中小企業(yè)通過(guò)網(wǎng)站建設(shè)實(shí)現(xiàn)規(guī)模擴(kuò)充和轉(zhuǎn)變。
這些解決方案靠的是數(shù)學(xué)的巧妙應(yīng)用。其中一些最簡(jiǎn)單的機(jī)制不過(guò)是密碼的現(xiàn)代版本,本質(zhì)上就是經(jīng)典解碼輪的數(shù)字版。其他方案是更為復(fù)雜的擴(kuò)展,利用數(shù)學(xué)交付更多靈活性與可靠性。大部分解決方案的創(chuàng)意已在實(shí)驗(yàn)室里流傳了幾十年,變得足夠穩(wěn)定,值得信任,最終形成實(shí)用版本。
這些算法正成為鞏固業(yè)務(wù)關(guān)系并確保準(zhǔn)確可信工作流的基礎(chǔ),方便企業(yè)在保護(hù)自身秘密的同時(shí)向客戶(hù)提供個(gè)性化服務(wù)。而且,此類(lèi)方法還能方便公司在不阻礙服務(wù)交付的情況下監(jiān)管數(shù)據(jù)流,實(shí)現(xiàn)更好的合規(guī)。
下面我們就列出便于企業(yè)更放心信任數(shù)據(jù)庫(kù)的11種工具和技術(shù)。
1. 基本加密
有時(shí)候,最簡(jiǎn)單的解決方案就足夠了。現(xiàn)代加密算法用一個(gè)密鑰給數(shù)據(jù)上鎖,只有持有該密鑰的人才能讀取數(shù)據(jù)。很多數(shù)據(jù)庫(kù)都可以采用AES等標(biāo)準(zhǔn)加密數(shù)據(jù)。這些解決方案能夠有效對(duì)抗可能由盜竊等造成硬件遺失情況。沒(méi)拿到正確的加密密鑰,數(shù)據(jù)就依然是不可窺探的黑匣。
不過(guò),這種方法存在局限,對(duì)稱(chēng)加密算法對(duì)攻擊者潛入運(yùn)行中計(jì)算機(jī)的情況防護(hù)有限。攻擊者可能會(huì)找出數(shù)據(jù)庫(kù)用來(lái)處理合法操作的同一密鑰。很多數(shù)據(jù)庫(kù)提供加密“靜態(tài)”信息的選項(xiàng)。比如說(shuō),Oracle就將其此類(lèi)選項(xiàng)稱(chēng)為“透明數(shù)據(jù)加密”,用以強(qiáng)調(diào)數(shù)據(jù)庫(kù)開(kāi)發(fā)人員不用為此多費(fèi)心思。
2. 差分隱私
這項(xiàng)技術(shù)以另一種方式利用數(shù)學(xué),不是將信息鎖在數(shù)字保險(xiǎn)柜里,而是添加精心構(gòu)造的噪聲,讓人難以確定哪條記錄對(duì)應(yīng)哪個(gè)人。只要噪聲添加正確,就不會(huì)導(dǎo)致許多統(tǒng)計(jì)數(shù)據(jù)失真,比如平均值。即使在數(shù)據(jù)集中隨機(jī)抽取記錄給年齡字段增加或減少幾歲,平均年齡也會(huì)保持不變,但就難以通過(guò)年齡來(lái)找到特定的人。
這類(lèi)解決方案的效用各不相同,最適用于向希望通過(guò)計(jì)算平均值和集群大小來(lái)研究數(shù)據(jù)的不可信合作伙伴發(fā)布數(shù)據(jù)集。很多算法都能很好地往數(shù)據(jù)集中添加噪聲,同時(shí)不會(huì)造成太多聚合統(tǒng)計(jì)數(shù)據(jù)失真。業(yè)界目前仍在探索哪種機(jī)器學(xué)習(xí)算法能夠有效處理經(jīng)扭曲的數(shù)據(jù)。
微軟和谷歌推出了將此類(lèi)算法與數(shù)據(jù)存儲(chǔ)和機(jī)器學(xué)習(xí)算法集成的工具。例如,谷歌的Privacy-On-Beam,就將噪聲添加機(jī)制與Apache Beam管道處理整合到了一起。
3. 散列函數(shù)
此類(lèi)計(jì)算有時(shí)候也稱(chēng)為“消息認(rèn)證碼”或“單向函數(shù)”,以基本上無(wú)法逆向的方式將大文件縮減為一個(gè)較小的數(shù)字。給定一個(gè)特定的結(jié)果或認(rèn)證碼,想借此找出生成這個(gè)認(rèn)證碼的文件是很難的,要花費(fèi)大量的時(shí)間。
此類(lèi)函數(shù)是區(qū)塊鏈的重要組成部分,區(qū)塊鏈將這些函數(shù)應(yīng)用到數(shù)據(jù)的所有更改上,以便跟蹤數(shù)據(jù)變更和識(shí)別篡改??梢赃\(yùn)用此類(lèi)技術(shù)防止加密貨幣交易欺詐,或者應(yīng)用到需要保證數(shù)據(jù)一致的其他數(shù)據(jù)庫(kù)上。而且,加入這些函數(shù)還有助于滿(mǎn)足合規(guī)要求。
美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究所(NIST)提出的安全散列算法(SHA)就是廣泛使用的一組標(biāo)準(zhǔn)。早期版本,比如SHA-0和SHA-1,存在已知缺陷;但更新的版本,比如SHA-2和SHA-3,就非常安全了。
4. 數(shù)字簽名
RSA或DSA等數(shù)字簽名算法將散列函數(shù)的酸鈣檢測(cè)屬性與證明此信息的特定人員或機(jī)構(gòu)結(jié)合起來(lái),是更加復(fù)雜的計(jì)算形式。數(shù)字簽名依賴(lài)僅責(zé)任方知曉的秘密密鑰。比如說(shuō),加密貨幣就將財(cái)務(wù)所有權(quán)與知曉正確密鑰的人綁定到一起。跟蹤個(gè)人責(zé)任的數(shù)據(jù)庫(kù)可以納入數(shù)字簽名,以之驗(yàn)證特定交易的有效性。
5. SNARK
簡(jiǎn)潔非交互式知情證明(SNARK)是高級(jí)版數(shù)字簽名,可以在不泄露信息本身的情況下證明復(fù)雜個(gè)人信息。這種手法依賴(lài)名為“零知識(shí)證明”(ZKP)的復(fù)雜數(shù)學(xué)方法。
引入SNARK和其他類(lèi)似證明的數(shù)據(jù)庫(kù)可以保護(hù)用戶(hù)的隱私,同時(shí)確保合規(guī)。舉個(gè)最簡(jiǎn)單的例子,一張數(shù)字駕駛證就能在不透露年齡的情況下,證明某個(gè)人達(dá)到飲酒年齡了。還有人在探索將此技術(shù)應(yīng)用到疫苗護(hù)照上。
SNARK和其他非交互式證明是該領(lǐng)域較活躍的研究方向。多支研究團(tuán)隊(duì)采用不同編程語(yǔ)言形成了此類(lèi)算法的數(shù)十個(gè)實(shí)現(xiàn),為新項(xiàng)目打下了良好基礎(chǔ)。
6. 同態(tài)加密
處理用傳統(tǒng)加密算法鎖定的數(shù)據(jù)只能先解密之,但解密過(guò)程可能將數(shù)據(jù)暴露在能接觸解密計(jì)算機(jī)的任何人面前。同態(tài)加密算法旨在不用解密就能對(duì)加密信息執(zhí)行計(jì)算操作。最簡(jiǎn)單的算法可以執(zhí)行兩數(shù)相加等算術(shù)運(yùn)算。更復(fù)雜一些的算法可以進(jìn)行任意計(jì)算,但速度通常會(huì)非常慢。目前業(yè)界正在找尋特定問(wèn)題的最高效解決辦法。
IBM是該領(lǐng)域的研究先行者,已推出將其同態(tài)加密與iOS和MacOS應(yīng)用集成的工具集。
7. 聯(lián)合處理
一些開(kāi)發(fā)人員會(huì)將數(shù)據(jù)集劃分成小塊,有時(shí)候非常非常小,然后分發(fā)到許多獨(dú)立計(jì)算機(jī)上。這些位置可能很散亂,所以無(wú)法預(yù)測(cè)哪臺(tái)計(jì)算機(jī)持有哪條記錄。此類(lèi)解決方案常依賴(lài)各種軟件包,旨在通過(guò)并行執(zhí)行搜索或分析算法來(lái)加速處理所謂的大數(shù)據(jù)。其初衷是速度,但增強(qiáng)了抗攻擊性倒是個(gè)意外之喜。
8. 完全分布式數(shù)據(jù)庫(kù)
如果將數(shù)據(jù)集劃分成幾塊能夠保護(hù)隱私,那為什么不直接劃分成幾十上百億塊?更常見(jiàn)的解決方案是直接在數(shù)據(jù)創(chuàng)建和使用的地方存儲(chǔ)數(shù)據(jù)。用戶(hù)的智能手機(jī)通常擁有大量額外算力和存儲(chǔ)空間。如果對(duì)集中分析和處理的要求極低,那避免將數(shù)據(jù)傳到云端服務(wù)器的做法就相當(dāng)省時(shí)省力省錢(qián)了。
比如說(shuō),很多瀏覽器都支持本地存儲(chǔ)復(fù)雜數(shù)據(jù)結(jié)構(gòu)。W3C標(biāo)準(zhǔn)包含具有鍵和值的文檔樣式模型的本地存儲(chǔ),以及適用于關(guān)系模型的索引版本。
9. 合成數(shù)據(jù)
一些研究人員正在創(chuàng)建完全合成的數(shù)據(jù)集,這些數(shù)據(jù)集通過(guò)隨機(jī)生成新值構(gòu)建,但遵循相同的模式,且在統(tǒng)計(jì)上基本相同。例如,名為RTI的研究智庫(kù)創(chuàng)建了一版2010年美國(guó)人口普查數(shù)據(jù),其中包含居住地址隨機(jī)的隨機(jī)人員。這些人完全是虛構(gòu)的,但其家庭住址和個(gè)人信息經(jīng)過(guò)挑選,具有與真值相同的基本統(tǒng)計(jì)特征。在許多情況下,研究人員可以測(cè)試算法并生成與處理真實(shí)數(shù)據(jù)一樣精確的解決方案。
10. 中介與代理
一些研究人員構(gòu)建的工具可以限制數(shù)據(jù)集并在存儲(chǔ)前先預(yù)處理數(shù)據(jù)。比如說(shuō),Mozilla的Rally就可為希望研究互聯(lián)網(wǎng)信息流的研究人員跟蹤瀏覽習(xí)慣。該工具會(huì)在研究期間安裝一個(gè)特殊的插件,然后在結(jié)束時(shí)再卸載掉。該工具形式化描述關(guān)系,并強(qiáng)制執(zhí)行有關(guān)收集和聚合的規(guī)則。
11. 無(wú)數(shù)據(jù)
無(wú)狀態(tài)計(jì)算是網(wǎng)上諸多事項(xiàng)的基礎(chǔ),且大多推動(dòng)了盡可能減少記錄保存的效率提升。一些極端案例中,如果合規(guī)要求允許無(wú)狀態(tài)計(jì)算,用戶(hù)也愿意接受不那么個(gè)性化的服務(wù),那么刪除數(shù)據(jù)庫(kù)可以最大限度地保護(hù)隱私。
當(dāng)前文章:改善數(shù)據(jù)庫(kù)安全的十一項(xiàng)技術(shù)
文章位置:http://www.fisionsoft.com.cn/article/cdipecj.html


咨詢(xún)
建站咨詢(xún)
