- +1
如何在人工智能時代利用Tokenization重塑數據安全
沒有強大的數據安全保障,公司無法充分發揮數據的價值。隨著數據泄露事件逐年增多,每家公司都希望應用 AI,這使得對數據進行妥善保護變得尤為重要。缺乏嚴密的數據安全措施,公司不僅有可能在不經意間將敏感數據暴露給 AI 模型,還可能在數據泄露事件中丟失敏感信息,以及面臨其他潛在風險。雖然數據安全一直是重中之重,但在我們所處的 AI 時代,企業必須采用先進的數據保護技術。
為了確保數據得到充分保護,必須構建一個完整的安全方法和控制措施生態系統。在多種數據保護技術中,Tokenization 是一種強有力的方法,它能夠替換真實數據為格式保持不變的 Token,從而在不降低數據使用價值的前提下保護數據中的敏感部分。
Capital One 意識到 Tokenization 的優勢,因此開始了一段多年的 Tokenization 之旅。我們構建了一個能夠以業務所需的速度與規模運行的 Tokenization 引擎,如今在數百個應用中擁有數十億條已 Token 化的記錄。作為一家大規模運營的銀行,我們認為 Tokenization 是進一步保護敏感數據的高杠桿手段。
數據安全始于數據管理
為了有效保護數據,首先必須對數據進行有效管理。這意味著要準確了解你擁有哪些數據,它們存儲在哪里,屬于誰,以及如何被使用。因此,建立一個全面的數據清單是構建安全數據生態系統的首要步驟。數據負責人應首先對信息資產進行編目和分類:識別出“皇冠上的明珠”(最敏感或最有價值的數據),了解誰在使用這些數據以及具體如何使用。
數據安全與保護團隊可以利用這些信息,根據每個數據集的敏感程度和使用場景定制防護措施。例如,某些數據可能只需要嚴格的訪問控制和監控,而高度敏感的信息則需要更強的防御措施,如 Tokenization。這一基礎工作對于確保數據既能得到充分保護,又能讓有權限的人便捷地查找和使用至關重要。
Tokenization 如何增強數據安全
Tokenization 在保持數據結構和一定統計特性的同時,確保了數據的實用性,從而幫助降低敏感數據泄露的風險。該技術用一個與原數據格式相同的隨機 Token 替換敏感數據元素 —— 例如信用卡號碼或社會保障號碼。這種方法可以縮小潛在網絡攻擊的影響范圍,因為它降低了對不法分子而言,已 Token 化敏感數據的價值。授權用戶仍然可以在其環境中傳遞 Token 化的數據 —— 甚至管理與第三方的數據共享 —— 從而實現業務價值。
Token 在特定上下文之外沒有任何意義,并且在沒有原始映射訪問權限的情況下無法逆向還原。這意味著 Tokenization 還可以幫助確保敏感數據不被暴露給 AI 模型。隨著 AI 模型越來越依賴大型、復雜的數據集,這一措施為數據泄露提供了關鍵防護。
有人擔心更嚴格的安全措施會減緩創新步伐。而實際上,現代數據保護方法如 Tokenization 加上智能流程自動化設計,旨在將摩擦降到最低。在 Capital One,我們發現對部分數據進行 Tokenization 后,開發者能夠更自由地協作,因為敏感細節已經得到了有效屏蔽。當措施得當時,數據安全不僅不會抑制創新,反而能使數據在確保強有力防護的前提下變得更有價值。
數據安全作為創新的杠桿
要實現數據的充分保護沒有單一的解決方案,但 Tokenization 對于希望在大規模保護敏感數據的企業來說,仍是一種寶貴的方法。它與細粒度訪問控制、恰當應用的加密和持續監控等其他措施協同作用效果最佳。但作為分層防御的一部分,Tokenization 是一枚強有力的關鍵環節,即使在新威脅出現時也能保持有效。
歸根結底,在不犧牲安全前提下推動數據創新是釋放業務價值的關鍵。受到我們自身歷程的啟發,我們正在通過 Capital One Databolt —— 一種無保險庫的 Tokenization 解決方案,幫助公司利用 Tokenization 的強大優勢,在大規模場景下保護敏感數據。借助 Databolt,企業可以在建立應用及 AI 模型時確信其敏感數據已通過 Tokenization 得到更好的防護,避免潛在泄露風險。
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司