Từ trước tới nay, chúng ta thường làm mờ, hay còn được gọi là censor, để che dấu những thông tin nhạy cảm trên internet. Tuy nhiên, phương thức này sắp trở nên vô dụng.
Các nhà nghiên cứu từ Đại học Texas ở Austin, Mỹ và Cornell Tech vừa phát triển thành công một hệ thống máy học có thể nhận diện khuôn mặt và văn bản trong hình ảnh đã được làm mờ với độ chính xác cao. Và quan trọng hơn, hệ thống này có thể được xây dựng qua mã nguồn mở.
Các phương thức censor hình ảnh như làm mờ hoặc pixelation xuất phát từ ý nghĩ chủ quan của con người. Chúng ta cho rằng bức ảnh được đảm bảo an toàn nếu chúng ta không thể nhìn thấy chi tiết nhạy cảm đã được làm mờ. Tuy nhiên không phải vậy bởi con người không còn vô địch trong lĩnh vực nhận dạng.
Các nhà nghiên cứ đã đào tạo một mạng lưới thần kinh nhân tạo bằng hình ảnh của khuôn mặt và văn bản sau đó hệ thống có thể xác định một cách chính xác những hình ảnh này dù chúng đã bị censor bằng ba phương thức khác nhau. Các phương thức censor được thử nghiệm bao gồm công cụ censor độc quyền của YouTube, pixelation tiêu chuẩn và thuật toán censor P3. Hệ thống này không loại bỏ censor cho người xem nhưng nó có thể xác định nội dung của hình ảnh bằng cách kết hợp với bản gốc.
Điều đáng chú ý là phương pháp này khá đơn giản. Các nhà nghiên cứu đã sử dụng Torch, một framework máy học mã nguồn mở để xây dựng hệ thống. Dữ liệu huấn luyện của các khuôn mặt và văn bản cũng đã được đăng tải công khai. Nhóm nghiên cứu đưa các hình ảnh vào hệ thống mạng thần kinh nhân tạo cho tới khi nó có thể nhận ra chúng với độ chính xác lên tới 90%, sau đó các hình ảnh này sẽ được censor với ba phương thức kể trên.
Kết quả là hệ thống nhận dạng các hình ảnh đã được censor bằng công cụ của YouTube với độ chính xác lên tới 80 hoặc 90%. Với pixelation, độ chính xác của hệ thống giảm xuống còn 50 tới 75%. Hệ thống gần như chưa xác định được các hình ảnh đã censor bởi thuật toán P3 khi độ chính xác chỉ đạt 17%.
Hiện tại, bạn chưa cần lo lắng về các hình ảnh có censor mà mình đã đăng trên mạng bởi hệ thống chưa thể giải mã được hết những bức ảnh này. Dẫu vậy, điều đáng lo là những cá nhân hoặc tổ chức có nguồn lực hoàn toàn có thể phát triển hệ thống này một cách hoàn thiện hơn. Nếu muốn đảm loại bỏ các thông tin nhạy cảm khỏi hình ảnh bạn hãy censor nó bằng một dải băng đen bởi điều này sẽ làm khó hệ thống nhận dạng, ít nhất là ở thời điểm hiện tại.
Theo Geek
NỔI BẬT TRANG CHỦ
Nhà sáng lập TSMC nhận định về Intel: Sẽ tốt hơn nếu không cố chen chân vào mảng sản xuất chip, đáng lẽ nên tập trung vào AI
Morris Chang, nhà sáng lập TSMC, đã thẳng thắn nhận định chiến lược kinh doanh của Intel, cho rằng "Đội Xanh" đáng lẽ không nên bước chân vào lĩnh vực sản xuất chip và thay vào đó nên tập trung vào thị trường AI.
Nửa đêm, Facebook sập trên toàn cầu, Instagram, Threads cũng không thể truy cập