OpenAI ra mắt Privacy Filter để phát hiện và ẩn thông tin nhận dạng cá nhân (PII)
Caroline Bishop 24/04/2026 22:27 (Giờ VN)
OpenAI ra mắt Privacy Filter, một mô hình phát hiện và ẩn thông tin nhận dạng cá nhân (PII) với độ chính xác hàng đầu. Hiện đã có sẵn cho các nhà phát triển.
OpenAI vừa giới thiệu Privacy Filter, một mô hình AI open-weight mới được thiết kế để phát hiện và ẩn thông tin nhận dạng cá nhân (PII) trong văn bản. Được phát hành vào ngày 23/04/2026, công cụ này cung cấp độ chính xác hàng đầu cho các quy trình bảo mật dữ liệu, thiết lập tiêu chuẩn mới trong việc bảo vệ dữ liệu nhạy cảm.
Privacy Filter nhằm giải quyết những thách thức lâu dài trong việc phát hiện PII bằng cách vượt ra ngoài các hệ thống dựa trên quy tắc truyền thống. Khác với các công cụ cũ dựa vào các mẫu xác định cho các định dạng như số điện thoại hoặc địa chỉ Email, mô hình này sử dụng khả năng hiểu ngôn ngữ nâng cao để phân tích văn bản phi cấu trúc và đưa ra các quyết định nhận thức ngữ cảnh. Ví dụ, nó có thể phân biệt giữa thông tin công khai và thông tin riêng tư, một khả năng quan trọng trong các tình huống bảo mật phức tạp.
Một trong những tính năng nổi bật của nó là khả năng hoạt động cục bộ, nghĩa là dữ liệu nhạy cảm có thể được xử lý trực tiếp trên máy của người dùng mà không cần gửi đến các máy chủ bên ngoài. Thiết kế này giúp giảm nguy cơ lộ dữ liệu và đặc biệt có giá trị đối với các ứng dụng nhạy cảm về quyền riêng tư trong các ngành như chăm sóc sức khỏe, tài chính và dịch vụ pháp lý.
Mô hình được tối ưu hóa cho môi trường sản xuất, với hiệu quả là cốt lõi. Nó có thể xử lý lên đến 128,000 token ngữ cảnh trong một lần chạy trong khi vẫn duy trì tỷ lệ precision và recall cao. Trên benchmark PII-Masking-300k được sử dụng rộng rãi, Privacy Filter đạt điểm F1 là 96%, tăng lên 97,43% trên phiên bản đã được chỉnh sửa của tập dữ liệu. Các điểm số này làm nổi bật khả năng phát hiện các vi phạm quyền riêng tư tinh tế và phức tạp trong khi giảm thiểu các kết quả dương tính giả.
OpenAI đã cung cấp mô hình theo giấy phép Apache 2.0 thông qua các nền tảng như Hugging Face và GitHub, khuyến khích các nhà phát triển thử nghiệm, tinh chỉnh và triển khai theo nhu cầu cụ thể của họ. Mô hình hỗ trợ tám danh mục PII, bao gồm private_person, private_address, private_email và account_number. Nó có thể cấu hình cho các quy trình làm việc khác nhau, cho phép người dùng cân bằng giữa precision và recall dựa trên các ưu tiên hoạt động của họ.
Mặc dù có những khả năng đó, OpenAI thừa nhận rằng Privacy Filter không phải là giải pháp độc lập cho việc tuân thủ quy định hay xem xét chính sách. Đây là công cụ được thiết kế để bổ sung cho các chiến lược privacy-by-design rộng hơn. Mô hình có thể cần đánh giá hoặc tinh chỉnh thêm theo từng lĩnh vực cụ thể để thích nghi với các ngành nghề, ngôn ngữ và quy ước đặt tên khác nhau.
Bản phát hành này là một phần trong nỗ lực rộng lớn hơn của OpenAI nhằm tăng cường các biện pháp bảo vệ quyền riêng tư hỗ trợ bởi AI. Công ty đã nhấn mạnh rằng mục tiêu là để các hệ thống AI học từ dữ liệu mà không ảnh hưởng đến quyền riêng tư cá nhân. Bằng cách mã nguồn mở Privacy Filter, OpenAI hướng đến việc trao quyền cho các nhà phát triển và tổ chức để tích hợp các biện pháp bảo vệ quyền riêng tư mạnh mẽ vào quy trình làm việc của họ.
Privacy Filter đại diện cho một bước tiến đáng kể trong công nghệ bảo mật, đặc biệt khi ngành AI ngày càng đối mặt với sự giám sát chặt chẽ hơn xung quanh bảo mật dữ liệu và các thực hành đạo đức. Đối với các nhà phát triển và doanh nghiệp muốn tăng cường khả năng xử lý PII, sự ra mắt của mô hình này đánh dấu một cơ hội quan trọng để áp dụng các công cụ tiên tiến ưu tiên quyền riêng tư của người dùng.
Nguồn ảnh: Shutterstock- ai
- privacy
- openai
- pii
- data security








