Được thiết kế dựa trên não người, AI đã có thể vượt qua mã CAPTCHA, độ chính xác lên đến 94%
Một bước đột phá lớn trong nghiên cứu trí tuệ nhân tạo, nhưng chặng đường vẫn còn dài.
- Công cụ AI giúp kiểm tra các hình ảnh quét y tế và chẩn đoán bệnh với giá chỉ 1 USD
- Chip mới nhất của Nvidia có chứa vũ khí bí mật để cạnh tranh trong lĩnh vực AI
- Đồng sáng lập Siri nêu lý do vì sao nghề giáo viên không bao giờ bị AI thay thế
- AI của Google đã có thể tự tạo ra AI, và nó còn hiệu quả hơn cả con người làm thủ công
- AI 'StarCraft' của Facebook đã bị đánh bại bởi một người chơi duy nhất
Thuật toán máy tính đang ngày một giỏi hơn: chúng nhận dạng được hình khối dễ dàng, như một con vật hay một khuôn mặt người nào đó. Nhờ thế, các phần mềm ta có có thể tự động phân loại một kho dữ liệu hình ảnh khổng lồ. Tuy vậy, nó chưa giỏi đến thế, mà ta đã lại dựa dẫm nhiều vào công nghệ này rồi.
Thuật toán vẫn chưa thể ghép hình ảnh vào với ngữ nghĩa của chính hình ảnh ấy, đó chính là lý do vì sao mấy bài thử xem "bạn có phải robot không" vẫn phải có người ngồi đó để chọn ra biển hiệu cửa hàng hay biển báo ven đường. Thêm nữa là thuật toán vẫn chưa nhận dạng được những hình ảnh quen thuộc nhưng lại bị "nhiễu" bởi những yếu tố khác, ấy là lý do mà ta dựa trên việc gõ CAPTCHA để bảo mật.
Nhưng có lẽ mọi chuyện sắp thay đổi. Trên tạp chí khoa học uy tín Science, xuất hiện một startp mang tên Vicarious AI, được mô tả là một thuật toán có thể được huấn luyện đơn giản nhưng vẫn "xử lý" được CAPTCHA: nó có thể nhận dạng được chữ thông thường. Tại sao nó lại làm được điều đó? Cấu trúc của Vicarious AI được thiết kế dựa trên những thông tin ta có được thông qua việc nghiên cứu cách thức vỏ não của loài có vú xử lý hình ảnh.
Tư duy bằng hình ảnh
Ở phần võ não xử lý hình ảnh ấy, những phần neuron giữ trách nhiệm khác nhau, ví dụ như có phần nhận dạng mép và bề mặt của vật thể mà có phần thì xác định chuyển động của vật thể. Những phần neuron ấy sẽ liên lạc với nhau, xác định xem phần mình đang xử lý là phần nào của vật thể. Não bộ sẽ ghép các thông tin ấy lại, dựng hình và xác định hình khối chung. Ta đã có được một vật thể hoàn chỉnh xuất hiện trong não của mình.
Một khi ta đã dựng được hình nguyên mẫu của một vật thể, ta sẽ nhận ra được nó dù vật thể đó có bị biến dạng, chuyển đổi như thế nào. Đó là lý do ta nhìn ra được chữ dù cho nó bị đảo ngược, xoay chiều này chiều khác hay phông nền viết chữ ấy có rất nhiều thứ "nhiễu" – những hình loằng ngoằng có thể làm máy móc rối trí.
Để bắt chước được cách não bộ chúng ta xử lý hình ảnh, đội ngũ nghiên cứu tạo ra Mạng lưới Vỏ não Đệ quy – Recursive Cortical Network (RCN).
Phương pháp đệ quy được dùng nhiều trong toán học và khoa học máy tính, trong đó có chứa một hàm có khả năng gọi chính nó.
Chẳng hạn, định nghĩa sau là định nghĩa đệ quy của tổ tiên:
Bố mẹ của một người là tổ tiên của người ấy (trường hợp cơ bản);
Bố mẹ của tổ tiên một người bất kỳ là tổ tiên của người ấy (bước đệ quy).
(Nguồn Wikipedia).
Tam giác Sierpinski, hình ảnh thường thấy mỗi khi nhắc tới phương pháp đệ quy.
Đây chính là bước trọng yếu để hệ thống nhận ra đường viền của vật thể, từ đó suy ra hình dáng của toàn bộ vật thể. Một bộ phận khác giữ trách nhiệm nhận dạng bề mặt của vật thể cũng dựa trên những đường viền bao quanh vật thể đó. Toàn bộ dữ liệu sẽ được xử lý để tạo một ước lượng chung, chứa trong một bể dữ liệu. Các bể chứa ước lượng này được kết nối với nhau, truyền dữ liệu cho nhau và tạo nên một nhóm liên kết chặt chẽ, dựng nên hình của vật thể.
Kết quả hình ảnh cuối cùng sẽ được đưa ra, được đánh giá xem cái nào là chính xác nhất. Sau khi đã có được hình ảnh gần chính xác nhất, thì trong những thử nghiệm sau này, đa phần là hệ thống thần kinh máy này có thể nhận ra chính xác được vật thể là gì, kể cả khi nhìn vào một vật thể mới có kích cỡ hay hướng xoay khác.
Đây là sơ đồ hoạt động của hệ thống RCN.
Hiệu quả cao chính là thứ đáng được nói tới trong thử nghiệm này. Khi các nhà nghiên cứu quyết định thử nghiệm hệ thống với reCAPTCHA, họ đưa vào hệ thống nhận dạng bộ font chữ Georgia để nó tự "học" – đưa cho nó 5 ví dụ khác nhau với các chữ viết hoa và viết thường. Từng đó là đã đủ để hệ thống đọc được CAPTCHA với độ chính xác lên tới 94%.
Và không chỉ reCAPTCHA bị đánh bại, hệ thống còn vượt qua được bài thử của BotDetect cũng với độ chính xác 94%, vượt qua hệ thống của Yahoo và PayPal với độ chính xác 57%. Các hệ thống neural network tương tự khác phải cần tới 50.000 ví dụ về CAPTCHA đã được giải mã để thành công, trong khi đó RCN chỉ cần 260 hình ảnh của từng kí tự riêng biệt để hoàn thành bài thử.
Để sẵn sàng đưa RCN vào thử với những hình ảnh của thế giới thực, các nhà nghiên cứu đưa vào hệ thống thông tin về cách sắp xếp từ ngữ thành chữ và thành câu, tần số xuất hiện của một từ trong đời sống cũng với khả năng phân tích hình học. Tất cả những khả năng đó đã cho phép nó vượt mặt hệ thống chính xác nhất hiện nay với 1,9% chính xác hơn. Không nhiều, nhưng vẫn rất ấn tượng bởi lượng thông tin đưa vào RCN là rất ít, so với các hệ thống trước đây.
Kẻ dẫn đầu trong lĩnh vực này cần tới 7,9 triệu hình ảnh để học, trong khi đó RCN chỉ cần 1.406 hình. Đó chính là sức mạnh não bộ trong một cỗ máy mà ta cần tới.
Đây sẽ là bước tiến lớn cho trí thông minh nhân tạo, và đây cũng không phải là một trí tuệ nhân tạo thông thường. Tuy thế, tuy là nó giỏi việc xác định kí tự đấy, nhưng nó vẫn chưa biết kí tự ấy có nghĩa gì, nó không thể dịch kí tự ra ngôn ngữ khác và chưa biết phải làm gì với việc xác định mà mình làm được – hiện nó mới như bộ não non nớt của đứa trẻ, chỉ biết học vẹt thôi vậy.
Nhưng thành công này chứng minh cho ta thấy rằng việc nghiên cứu não bộ có thể được áp dụng vào đây, để tạo ra những hệ thống AI tiên tiến và có khả năng làm được nhiều thứ. Ta sẽ phải dạy cho bộ não non nớt này thêm, nếu muốn nó có được chút thông minh trong tương lai.
NỔI BẬT TRANG CHỦ
Tại sao nhân loại lại cần đến máy tính lượng tử, chúng được dùng để làm gì?
Điện toán lượng tử hiện tại vẫn còn cách xa khả năng ứng dụng rộng rãi, nhưng tiềm năng mà nó mang lại là không thể phủ nhận.
Huawei xác nhận ra mắt Mate 70: Dòng smartphone đầu tiên "đoạt tuyệt" hoàn toàn với Android