Xây dựng AI rất khó vì thế Facebook chọn cách tạo nên các AI có thể tự xây dựng AI
Nghĩ ra ý tưởng cho AI là một công việc thú vị, nhưng thử nghiệm những ý tưởng đó là một công việc mang tính "tay chân". Và các công việc "tay chân" thì nên để cho AI đảmn hiệm.
Các mạng nơ-ron sâu đang thay đổi hoàn toàn Internet. Với khả năng học các tác vụ tưởng chừng chỉ dành cho con người bằng cách phân tích những khối lượng dữ liệu khổng lồ, các hệ thống trí tuệ nhân tạo đang mang đến sức mạnh tính toán chưa từng có trong nhiều năm trước đấy. Các AI mới có thể nhận diện khuôn mặt trong các bức ảnh, hiểu rõ thông tin có trong những câu lệnh bằng ngôn ngữ người và thậm chí có thể dịch đầy đủ các đoạn hội thoại, các hình ảnh quay từ camera theo thời gian thực. Đến cả Google cũng phải nhờ tới AI để sắp xếp các kết quả tìm kiếm.
Song, với tất cả những thành tựu do AI mang tới, ít ai biết những gã khổng lồ Internet đã xây dựng các cỗ máy trí thông minh nhân tạo như thế nào.
Thành phần quan trọng đầu tiên trong công thức của Google và Facebook là bỏ ra một đống tiền để chiêu mộ những người có đầu óc siêu phàm. Chỉ có khoảng vài trăm người trong số 7 tỷ người sống trên Trái đất có đủ tài năng và được giáo dục đầy đủ để đưa AI tiến về phía trước, do đó những người này sẽ được săn đón và trả lương hậu hĩnh như các siêu sao bóng đá.
Đây chỉ là một trong những khó khăn đầu tiên của công cuộc phát triển AI. Ngay cả những bộ óc siêu phàm nhất cũng không thể tạo ra các AI siêu việt mà không mắc phải những sai sót mang tầm vóc khổng lồ. Để tạo ra một con AI có thể giải quyết được một bài toán lớn, các chuyên gia phần mềm sẽ phải thử nghiệm hàng chục, hàng trăm hướng đi thất bại. Mỗi giải pháp, bất kể là đúng đắn hay sai lầm, đều phải được chạy qua hàng trăm siêu máy tính tại trung tâm dữ liệu.
Demis Hassabis, nhà sáng lập của DeepMind, công ty sau này đã được Google mua lại để tạo ra bộ AI đầu tiên đánh bại con người trên bàn cờ vây khẳng định: "Vai trò của chúng tôi giống như là huấn luyện viên thay vì làm cầu thủ. Bạn đang đào tạo cho các AI này thay vì yêu cầu trực tiếp chúng làm gì đó".
Đến bây giờ, nhiều công ty lại cố gắng tự động hóa khâu thử nghiệm và mắc sai lầm của AI (hoặc ít nhất là một phần trong đó). Nếu như bạn có thể tự động hóa các phần khó nhằn nhất, bạn có thể đẩy nhanh thời gian đưa công nghệ máy học tới các kỹ sư bình thường, và rồi bạn có thể để các nhà khoa học hàng đầu của mình dành trí óc suy nghĩ về những vấn đề có tầm vóc to lớn hơn nữa. Điều này sẽ giúp tăng đáng kể tốc độ tiến hóa của "trí thông minh" bên trong các dịch vụ Internet đang được sử dụng hàng ngày.
Nói cách khác, để máy móc trở nên thông minh hơn, chính chúng sẽ phải đảm nhiệm các khâu "học gạo" nặng nề trong quá trình đào tạo. Bởi vậy, các gã khổng lồ Internet đang tạo ra các cỗ máy phức tạp có thể thử nghiệm hàng loạt các thuật toán máy học để thế chỗ cho các kỹ sư hàng đầu của họ. Kinh khủng hơn, các công ty này có thể tạo ra các thuật toán AI có thể tạo ra các... thuật toán AI. Tại Facebook, các kỹ sư đang thiết kế ra thứ họ gọi là "một kỹ sư máy học tự động hóa". Đây là một hệ thống AI có thể tạo ra các hệ thống AI khác.
Mô hình của Facebook vẫn sẽ mất nhiều thời gian để trở nên hoàn thiện. Nhưng mục đích là hết sức rõ ràng: giảm tối đa các khâu thử nghiệm nhàm chán cho con người trong quá trình chế tạo AI.
Chế tạo và thử nghiệm
Sau màn lên sàn kỷ lục với trị giá 104 tỷ USD của Facebook vào năm 2012, Hussein Mehanna và nhiều kỹ sư tài năng của Facebook bắt đầu cảm thấy áp lực phải cải thiện khả năng xác định đối tượng quảng cáo. Mạng xã hội này sống nhờ quảng cáo: càng hiển thị các mẩu quảng cáo phù hợp với sở thích người dùng thì Facebook càng thu được nhiều tiền. Điều này cũng có nghĩa rằng các kỹ sư cần phải tạo ra các mạng nơ-ron sâu và các thuật toán máy học có thể xử lý hiệu quả lượng thông tin cá nhân khổng lồ mà Facebook thu lại hàng ngày từ 1,5 tỷ người dùng của mình.
Theo Mehanna, các kỹ sư của Facebook hoàn toàn không gặp vấn đề gì trong việc phát triển các ý tưởng mới cho AI, nhưng việc thử nghiệm các ý tưởng này lại là chuyện khác. Do đó, ông cùng các cộng sự tạo ra một công cụ mới có tên Flow: "Chúng tôi muốn tạo ra một dây chuyền phát triển máy học mà tất cả các kỹ sư Facebook đều có thể sử dụng". Flow được thiết kế để giúp các kỹ sư phát triển, thử nghiệm và thực thi các thuật toán AI trên phạm vi khổng lồ - bao gồm toàn bộ các hình thức máy học cho phép các dịch vụ của Facebook có thể tự học các tác vụ thay vì cần tới sự dạy dỗ của con người.
Nếu Flow thành công, các kỹ sư của Facebook có thể dễ dàng thử nghiệm vô số ý tưởng trên hệ thống trung tâm dữ liệu của Facebook. Họ có thể chạy vô số các loại thuật toán, không chỉ gồm học sâu mà còn cả các loại AI như hồi quy logistic hay cây quyết định tăng cường. Kết quả từ các thuật toán này có thể được sử dụng để phát triển các ý tưởng mới. “Bạn càng thử nghiệm nhiều ý tưởng càng tốt. Bạn càng thử nghiệm nhiều dữ liệu càng tốt”, Mehanna khẳng định. Các kỹ sư cũng có thể sử dụng lại các thuật toán do người khác tạo ra, thay đổi chúng cho phù hợp với tác vụ của mình.
Facebook cũng đã nhanh chóng mở rộng Flow trên phạm vi toàn bộ công ty. Với các đội ngũ phát triển khác của Facebook, công cụ này có thể được sử dụng để lựa chọn các đường dẫn hiển thị lên News Feed của bạn, nhận diện khuôn mặt trong các bức ảnh hay thậm chí là mô tả nội dung ảnh bằng giọng nói cho người mù. Cũng bằng thuật toán, Facebook có thể quyết định triển khai kết nối Internet tại vùng nào trên toàn cầu.
Nhờ có Flow, Facebook hiện đang “đào tạo” và thử nghiệm 300.000 mô hình máy học mỗi tháng. Trong khi trước đây mạng xã hội này phải mất 60 ngày để ra mắt một mô hình thuật toán mới tới người dùng, khoảng thời gian này đã được rút xuống còn 7 ngày.
Giới hạn tiếp theo
Ý tưởng “AI xây dựng AI” có ý nghĩa vượt ra ngoài khuôn khổ của Facebook: toàn bộ thế giới AI đã bắt đầu theo đuổi ý tưởng này. Năm ngoái, Twitter đã mua lại một startup có tên WhetLab để xây dựng AI và gần đây Microsoft cũng đã hé lộ về cách các nhà nghiên cứu của họ sử dụng một hệ thống khổng lồ để thử nghiệm vô số mô hình AI. Chuyên gia Jian Sun của Microsoft gọi cách thực thi này là “tìm kiếm có sự hỗ trợ của con người”.
Mehanna và Facebook muốn đẩy nhanh tốc độ của trào lưu mới. Mạng xã hội số 1 hành tinh hiện đang lên kế hoạch đưa Flow thành mã nguồn mở, chia sẻ với toàn bộ thế giới. Theo Mehanna, hiện tại LinkedIn, Uber và Twitter đều đã bày tỏ sự hứng thú với Flow. Đội ngũ Facebook hiện cũng đã xây dựng một công cụ có tên AutoML cho phép tiết kiệm hơn nữa công sức của các nhà nghiên cứu. chạy trên nền tảng Flow, AutoML có thể “làm sạch” dữ liệu cần thiết để đào tạo các mạng nơ-ron sâu và các thuật toán máy học khác, hay nói cách khác là chuẩn bị cho khâu kiểm thử các thuật toán mà không đòi hỏi bàn tay của con người. Nhà nghiên cứu của Facebook thậm chí còn vẽ ra kịch bản sử dụng thuật toán có thể tự thu thập dữ liệu để đưa vào phân tích. Ý nghĩa của AutoML là vô cùng to lớn: đây là công cụ sử dụng AI để tạo ra AI.
Như đã hé lộ, số lượng mô hình AI được Facebook kiểm thử hàng tháng lên tới 300.000. AutoML có thể dùng kết quả của các thử nghiệm này nhằm đào tạo các mô hình AI có khả năng tối ưu quá trình “đào tạo” các AI mới. Phương hướng phát triển AI mang đậm màu sắc Inception này hiện đang hoạt động rất tốt tại Facebook khi hệ thống của Mehanna có thể tự động chọn các thuật toán và các tham số có khả năng thành công. “Nó gần như dự đoán được kết quả trước khi nghiên cứu vậy”, Mehanna cho biết.
Đằng sau thứ tự hiển thị của News Feed quen thuộc là cả một bộ não "ảo" khổng lồ.
Một công cụ khác cũng đang dần trở nên phổ biến tại Facebook là Asimo. Trong nhiều trường hợp, Asimo có thể tự động tạo ra các AI cải tiến tối ưu dựa trên các mô hình AI cũ, cho phép các kỹ sư có thể triển khai tới người dùng trong thời gian ngắn. “Nó không thể sáng tạo ra thuật toán AI mới. Nhưng ai biết được, sẽ có lúc”, Mehanna khẳng định.
Đây là một ý tưởng cực kỳ thú vị, một ý tưởng từ trước tới nay mới chỉ xuất hiện trong văn học và phim ảnh. Dĩ nhiên, đây sẽ là một bước tiến đến gần hơn kịch bản máy móc hủy diệt con người. Nhưng ít ra một vài kỹ sư tại Facebook sẽ không còn mất thời gian để thử nghiệm hàng trăm nghìn mô hình AI mỗi tháng nữa.
NỔI BẬT TRANG CHỦ
iPhone 14 Pro Max phát nổ khiến người dùng bị thương
Vụ việc đang tiếp tục được điều tra, làm rõ.
Tại sao nhân loại lại cần đến máy tính lượng tử, chúng được dùng để làm gì?