Token hóa đang nổi lên như một nền tảng của bảo mật dữ liệu hiện đại, giúp các doanh nghiệp tách biệt giá trị dữ liệu của họ khỏi rủi ro. Trong cuộc trò chuyện VB này, Ravi Raghu, chủ tịch Capital One Software, nói về cách mã thông báo có thể giúp giảm giá trị của dữ liệu bị vi phạm và duy trì định dạng và khả năng sử dụng dữ liệu cơ bản, bao gồm cả trải nghiệm của chính Capital One khi tận dụng mã thông báo trên quy mô lớn.
Raghu khẳng định token hóa là một công nghệ vượt trội hơn nhiều. Nó chuyển đổi dữ liệu nhạy cảm thành một dữ liệu thay thế kỹ thuật số không nhạy cảm, được gọi là mã thông báo, ánh xạ trở lại bản gốc và được bảo mật trong kho kỹ thuật số. Trình giữ chỗ mã thông báo bảo toàn cả định dạng và tiện ích của dữ liệu nhạy cảm, đồng thời có thể được sử dụng trên các ứng dụng — bao gồm cả mô hình AI. Ông nói thêm rằng vì quá trình mã hóa loại bỏ nhu cầu quản lý khóa mã hóa hoặc dành khả năng tính toán cho việc mã hóa và giải mã liên tục nên nó cung cấp một trong những cách có thể mở rộng nhất để các công ty bảo vệ dữ liệu nhạy cảm nhất của họ.
Ông giải thích: “Phần sát thủ, từ quan điểm bảo mật, khi bạn nghĩ về nó so với các phương pháp khác, nếu kẻ xấu nắm giữ dữ liệu, họ sẽ nắm giữ các mã thông báo”. “Dữ liệu thực tế không nằm cùng với mã thông báo, không giống như các phương pháp khác như mã hóa, trong đó dữ liệu thực tế nằm ở đó, chỉ chờ ai đó lấy được chìa khóa hoặc sử dụng vũ lực để lấy dữ liệu thực. Từ mọi góc độ, đây là cách lý tưởng mà người ta nên thực hiện để bảo vệ dữ liệu nhạy cảm.”
Điểm khác biệt về mã thông báo
Hầu hết các tổ chức chỉ mới bắt đầu bảo mật dữ liệu, bổ sung bảo mật ở khâu cuối cùng khi dữ liệu được đọc để ngăn người dùng cuối truy cập vào dữ liệu đó. Tối thiểu, các tổ chức nên tập trung vào việc bảo mật dữ liệu khi ghi vì nó đang được lưu trữ. Nhưng các tổ chức tốt nhất còn tiến xa hơn nữa, bảo vệ dữ liệu ngay từ đầu, ngay thời điểm dữ liệu được tạo ra.
Ở một đầu của phạm vi an toàn là phương pháp khóa và chìa khóa đơn giản nhằm hạn chế quyền truy cập nhưng vẫn giữ nguyên dữ liệu cơ bản. Các phương pháp nâng cao hơn, như che giấu hoặc sửa đổi dữ liệu, sẽ thay đổi vĩnh viễn ý nghĩa của dữ liệu — điều này có thể ảnh hưởng đến tính hữu dụng của dữ liệu. Mã hóa cấp độ tệp cung cấp khả năng bảo vệ rộng hơn cho khối lượng lớn dữ liệu được lưu trữ, nhưng khi bạn chuyển sang mã hóa cấp trường (ví dụ: số An sinh xã hội), nó sẽ trở thành một thách thức lớn hơn. Phải mất rất nhiều công sức tính toán để mã hóa một trường đơn lẻ và sau đó giải mã nó tại thời điểm sử dụng. Và nó vẫn có một lỗ hổng chết người: dữ liệu gốc vẫn còn nguyên, chỉ cần chìa khóa là có thể truy cập.
Mã thông báo tránh những cạm bẫy này bằng cách thay thế dữ liệu gốc bằng dữ liệu thay thế không có giá trị nội tại. Nếu mã thông báo bị chặn – dù là do nhầm người hay nhầm máy – thì bản thân dữ liệu vẫn được bảo mật.
Giá trị kinh doanh của token hóa
Raghu nói: “Về cơ bản, bạn đang bảo vệ dữ liệu và điều đó là vô giá”. “Một thứ khác vô giá – sau này bạn có thể sử dụng nó cho mục đích mô hình hóa không? Một mặt, đó là thứ bảo vệ và mặt khác, nó là thứ hỗ trợ kinh doanh.”
Vì mã thông báo bảo toàn cấu trúc và thứ tự của dữ liệu gốc nên nó vẫn có thể được sử dụng để lập mô hình và phân tích, biến biện pháp bảo vệ thành một công cụ hỗ trợ kinh doanh. Lấy dữ liệu sức khỏe cá nhân do HIPAA quản lý làm ví dụ: mã thông báo có nghĩa là dữ liệu có thể được sử dụng để xây dựng mô hình định giá hoặc nghiên cứu liệu pháp gen trong khi vẫn tuân thủ.
Raghu nói: “Nếu dữ liệu của bạn đã được bảo vệ, thì bạn có thể tăng cường sử dụng dữ liệu trên toàn bộ doanh nghiệp và giúp mọi người ngày càng tạo ra nhiều giá trị hơn từ dữ liệu”. “Ngược lại, nếu bạn không có điều đó, các doanh nghiệp ngày nay rất thận trọng trong việc có nhiều người truy cập hơn hoặc ngày càng có nhiều tác nhân AI truy cập vào dữ liệu của họ. Trớ trêu thay, họ đang hạn chế phạm vi bùng nổ của sự đổi mới. Tác động của token hóa là rất lớn và có nhiều số liệu bạn có thể sử dụng để đo lường điều đó – tác động hoạt động, tác động doanh thu và rõ ràng là sự an tâm từ quan điểm bảo mật.”
Phá vỡ các rào cản áp dụng
Cho đến nay, thách thức cơ bản với token hóa truyền thống là hiệu suất. AI đòi hỏi quy mô và tốc độ chưa từng có. Đó là một trong những thách thức lớn mà Capital One giải quyết với Databolt, giải pháp mã hóa không cần kho tiền, có thể tạo ra tới 4 triệu mã thông báo mỗi giây.
Raghu nói: “Capital One đã trải qua quá trình mã hóa trong hơn một thập kỷ. Chúng tôi bắt đầu thực hiện việc đó vì chúng tôi đang phục vụ 100 triệu khách hàng ngân hàng của mình. Chúng tôi muốn bảo vệ dữ liệu nhạy cảm đó”. “Chúng tôi đã ăn thức ăn dành cho chó của chính mình với khả năng mã hóa nội bộ của mình, hơn 100 tỷ lần một tháng. Chúng tôi đã sử dụng bí quyết và khả năng, quy mô và tốc độ đó, đồng thời đổi mới để thế giới có thể tận dụng nó, để nó trở thành một sản phẩm thương mại.”
Mã thông báo không có Vault là một hình thức mã thông báo nâng cao không yêu cầu cơ sở dữ liệu trung tâm (vault) để lưu trữ ánh xạ mã thông báo. Thay vào đó, nó sử dụng các thuật toán toán học, kỹ thuật mã hóa và ánh xạ xác định để tạo mã thông báo một cách linh hoạt. Cách tiếp cận này nhanh hơn, có khả năng mở rộng hơn và loại bỏ rủi ro bảo mật liên quan đến việc quản lý kho tiền.
Raghu nói: “Chúng tôi nhận ra rằng đối với nhu cầu về quy mô và tốc độ mà chúng tôi có, chúng tôi cần phải tự mình xây dựng khả năng đó”. “Chúng tôi đã liên tục lặp đi lặp lại để đảm bảo rằng nó có thể mở rộng quy mô lên tới hàng trăm tỷ hoạt động mỗi tháng. Tất cả sự đổi mới của chúng tôi đều xoay quanh việc xây dựng IP và khả năng thực hiện điều đó ở quy mô đã được thử nghiệm trong doanh nghiệp của chúng tôi, nhằm mục đích phục vụ khách hàng của chúng tôi.”
Mặc dù các phương pháp mã thông báo thông thường có thể liên quan đến một số hoạt động phức tạp và làm chậm, Databolt tích hợp liền mạch với kho dữ liệu được mã hóa, cho phép doanh nghiệp duy trì bảo mật mạnh mẽ mà không làm chậm hiệu suất hoặc hoạt động. Quá trình mã hóa diễn ra trong môi trường của khách hàng, loại bỏ nhu cầu giao tiếp với mạng bên ngoài để thực hiện các hoạt động mã hóa, điều này cũng có thể làm chậm hiệu suất.
Raghu nói: “Chúng tôi tin rằng về cơ bản, token hóa sẽ dễ dàng được áp dụng”. “Bạn sẽ có thể bảo mật dữ liệu của mình rất nhanh chóng và hoạt động ở tốc độ, quy mô cũng như nhu cầu về chi phí mà các tổ chức có. Tôi nghĩ đó là một rào cản quan trọng cho đến nay đối với việc áp dụng mã thông báo trên quy mô lớn. Trong thế giới AI, điều đó sẽ trở thành một yếu tố hỗ trợ to lớn.”

