CAPTCHA cũ đã trở thành quá khứ, Google vừa ra mắt CAPTCHA tàng hình, biết bạn là robot hay người mà chẳng cần hỏi câu nào

Dink , Theo Trí Thức Trẻ

CAPTCHA khó đọc như chữ bác sĩ? Không còn nữa rồi!

Bạn không lạ lùng gì với CAPTCHA – những câu hỏi “đầy thử thách” phân định ta có phải robot hay không và reCAPTCHA của Google – thứ dịch vụ CAPTCHA hàng đầu hiện nay. Giải ngố chút, CAPTCHA có nghĩa là Completely Automated Public Turing test to tell Computers and Humans Apart – Bài thử Turing Chung Hoàn toàn tự động để Phân biệt Máy tính và Con người. Cảm ơn, CAPTCHA là đủ rồi.

Nếu bạn sử dụng Internet thường xuyên và liên tục (một sự thật mà chắc hẳn bạn không muốn thừa nhận), chắc hẳn bạn đối mặt với những bài-thử-Turing-bất-đắc-dĩ này trên dưới 10 lần/ngày: nào là điền vào ô trống vài con số, một dòng chữ loằng ngoằng như chữ bác sĩ cho tới chọn hình ảnh khác nhau theo yêu cầu hay đơn giản hơn, dấu dấu vào ô “Tôi không phải robot”.

Và nếu bạn sử dụng Internet thường xuyên và liên tục như vậy, chắc chắn bạn có để ý rằng CAPTCHA đang dần ít đi. Không phải là Google loại bỏ hoàn toàn dịch vụ này đâu, mà là Google đang dần biến chúng trở nên vô hình.

Hệ thống CAPTCHA vô hình mới sẽ khiến bạn không gặp phiền phức với chúng nhiều như trước nữa.

Như đã mô tả ở trên, hệ thống reCAPTCHA cũ khá đơn giản (trừ mấy dòng chữ loằng ngoằng khó coi). Hệ thống mới này còn đơn giản hơn nhiều, không còn sử dụng những câu hỏi chọn hình hay đánh dấu tick nữa. Nó hoạt động ngầm bên dưới nền tảng web, và bằng một cách nào đó, nó vẫn phân biệt được bot với người.

Google không nói rõ ràng cách thức họ thực hiện điều đó, chỉ đơn giản là “một sự kết hợp của machine learning với phân tích rủi ro cao cấp có thể thích nghi được với những mối đe dọa mới cũng như đang nhen nhúm”. Cũng chẳng đổ lỗi cho Google được, nếu họ nói ra chi tiết cách thức vận hành của hệ thống mới này, chẳng phải đó sẽ là “vẽ đường cho bot chạy” sao?

reCAPTCHA được mua bởi Google vào năm 2009 và hệ thống này được sử dụng như một công cụ khiến những người sử dụng dịch vụ web ... làm việc cho Google.

Hiện một số hệ thống CAPTCHA tạo nên những vấn đề ngẫu nghiên cho người sử dụng giải đáp nhưng ngày xưa, những thử thách cũ của reCAPTCHA chính là những thử thách mà máy tính của Google không giải ra được. Có vẻ họ cho rằng “máy tính nhà mình không giải được thì máy tính nhà hàng xóm cũng vậy”.


Giờ sao?

Giờ sao?

Để làm được điều đó, Google đã số hóa hàng triệu đầu sách, nhưng thỉnh thoảng khi mà hệ thống quang học nhận dạng kí tự (optical character recognition – OCR) không đọc ra được một từ nào đó, thì từ ấy sẽ được gửi lên hệ thống reCAPTCHA để con người đọc (nhiều từ mà nhiều lúc ta cũng chịu).

Nếu như bạn phải giải CAPTCHA là một dãy số ngắn, thì những số ấy chính là những gì mà một chiếc xe Street View ghi lại, từ các số nhà và số đường mà nó thấy. Nếu như OCR của xe mà không đọc được số kia, nó cũng lại được chuyển hóa thành CAPTCHA để người dùng giải đáp. Cái bảng thử thách để bạn tìm ra một hình ảnh nhất định được sử dụng để huấn luyện thuật toán nhận dạng hình ảnh của máy tính đó.

Khi mà các trang web đổi sang hệ thống CAPTCHA ẩn này, đa số người dùng sẽ không còn thấy chúng hiện diện nữa đâu, thậm chí là những thứ đơn giản nhất như hộp thoại yêu cầu xác nhận “Tôi không phải robot”. Nếu như bạn bị hệ thống đánh dấu “khả nghi”, bạn sẽ mới thấy những bảng CAPTCHA thân thương của ngày xưa.

Tham khảo arstechnica

Bình luận