Từ trước tới nay, chúng ta thường làm mờ, hay còn được gọi là censor, để che dấu những thông tin nhạy cảm trên internet. Tuy nhiên, phương thức này sắp trở nên vô dụng.
Các nhà nghiên cứu từ Đại học Texas ở Austin, Mỹ và Cornell Tech vừa phát triển thành công một hệ thống máy học có thể nhận diện khuôn mặt và văn bản trong hình ảnh đã được làm mờ với độ chính xác cao. Và quan trọng hơn, hệ thống này có thể được xây dựng qua mã nguồn mở.
Các phương thức censor hình ảnh như làm mờ hoặc pixelation xuất phát từ ý nghĩ chủ quan của con người. Chúng ta cho rằng bức ảnh được đảm bảo an toàn nếu chúng ta không thể nhìn thấy chi tiết nhạy cảm đã được làm mờ. Tuy nhiên không phải vậy bởi con người không còn vô địch trong lĩnh vực nhận dạng.
Các nhà nghiên cứ đã đào tạo một mạng lưới thần kinh nhân tạo bằng hình ảnh của khuôn mặt và văn bản sau đó hệ thống có thể xác định một cách chính xác những hình ảnh này dù chúng đã bị censor bằng ba phương thức khác nhau. Các phương thức censor được thử nghiệm bao gồm công cụ censor độc quyền của YouTube, pixelation tiêu chuẩn và thuật toán censor P3. Hệ thống này không loại bỏ censor cho người xem nhưng nó có thể xác định nội dung của hình ảnh bằng cách kết hợp với bản gốc.
Điều đáng chú ý là phương pháp này khá đơn giản. Các nhà nghiên cứu đã sử dụng Torch, một framework máy học mã nguồn mở để xây dựng hệ thống. Dữ liệu huấn luyện của các khuôn mặt và văn bản cũng đã được đăng tải công khai. Nhóm nghiên cứu đưa các hình ảnh vào hệ thống mạng thần kinh nhân tạo cho tới khi nó có thể nhận ra chúng với độ chính xác lên tới 90%, sau đó các hình ảnh này sẽ được censor với ba phương thức kể trên.
Kết quả là hệ thống nhận dạng các hình ảnh đã được censor bằng công cụ của YouTube với độ chính xác lên tới 80 hoặc 90%. Với pixelation, độ chính xác của hệ thống giảm xuống còn 50 tới 75%. Hệ thống gần như chưa xác định được các hình ảnh đã censor bởi thuật toán P3 khi độ chính xác chỉ đạt 17%.
Hiện tại, bạn chưa cần lo lắng về các hình ảnh có censor mà mình đã đăng trên mạng bởi hệ thống chưa thể giải mã được hết những bức ảnh này. Dẫu vậy, điều đáng lo là những cá nhân hoặc tổ chức có nguồn lực hoàn toàn có thể phát triển hệ thống này một cách hoàn thiện hơn. Nếu muốn đảm loại bỏ các thông tin nhạy cảm khỏi hình ảnh bạn hãy censor nó bằng một dải băng đen bởi điều này sẽ làm khó hệ thống nhận dạng, ít nhất là ở thời điểm hiện tại.
Theo Geek
NỔI BẬT TRANG CHỦ
Tại sao nhân loại lại cần đến máy tính lượng tử, chúng được dùng để làm gì?
Điện toán lượng tử hiện tại vẫn còn cách xa khả năng ứng dụng rộng rãi, nhưng tiềm năng mà nó mang lại là không thể phủ nhận.
Huawei xác nhận ra mắt Mate 70: Dòng smartphone đầu tiên "đoạt tuyệt" hoàn toàn với Android