AI của Google vượt qua cả những hệ thống từng đánh bại con người trong bộ môn cờ vua và cờ shogi
Không chỉ "bá đạo" trong cờ vây, AlphaZero - phiên bản tiếp theo của AlphaGo còn sở hữu khả năng chơi cờ vua và cờ shogi cực kỳ xuất sắc.
Mới đây, công ty chuyên nghiên cứu trong lĩnh vực trí tuệ nhân tạo (AI) DeepMind (thuộc Google) cho biết họ đã áp dụng công nghệ machine learning dùng trong AlphaGo trước đó và xây dựng thành công một hệ thống mới có tên AlphaZero.
Không nhắm vào bộ môn cờ vây như những người tiền nhiệm, AlphaZero được lập trình để đánh bại các chương trình cờ vua và cờ shogi (một loại cờ của Nhật Bản) hàng đầu khác. Và dĩ nhiên nó cũng qua mặt luôn cả người “đàn anh” AlphaGo Zero của mình.
AlphaZero đã vượt qua nhiều hệ thống AI khác, trong đó có cả người tiền nhiệm AlphaGo Zero.
Đây có thể coi là một bước đi khôn ngoan và cực kỳ hợp lý của DeepMind. Xét về cờ vua và shogi, AI đã có những sản phẩm vượt qua cả những kiện tướng xuất sắc nhất thế giới từ khá lâu rồi, trong đó tiêu biểu là Stockfish - AI hàng đầu về cờ vua và Elmo - AI hàng đầu về cờ shogi.
Vì vậy, nếu DeepMind đánh bại được các chương trình đó, vị thế của họ trong lĩnh vực AI sẽ được nâng lên một tầm cao mới. Và đúng như họ kỳ vọng, AlphaZero đã dễ dàng hạ gục hoàn toàn “cặp đôi hoàn hảo” trên.
Giống như các chương trình trước đó của DeepMind, AlphaZero đạt được thành tựu đáng nể này là nhờ quá trình “tự học” mà không hề có sự can thiệp nào từ con người. Ngoài những kiến thức cơ bản như luật chơi, cách di chuyển cụ thể của từng quân cờ, cơ sở dữ liệu đầu vào cho AlphaZero gần như là con số 0.
Tuy nhiên, nếu AlphaGo Zero được thiết kế với mục đích chinh phục bộ môn cờ vây thì AlphaZero lại có khả năng ứng dụng rộng rãi hơn rất nhiều. Mục đích cao nhất của DeepMind với sản phẩm này là tạo ra nền tảng cũng như kế hoạch chi tiết để phát triển các hệ thống AI tương lai. Ngoài ra, họ cũng hi vọng có thể giải quyết các vấn đề còn tồn tại hiện nay trên nhiều lĩnh vực, bao gồm cả thiết kế của các loại thuốc.
Mục đích của DeepMind là ứng dụng AI vào nhiều lĩnh vực hơn chứ không chỉ dừng lại ở các trò chơi.
Được biết, DeepMind đã tiến hành “đào tạo” ba phiên bản AlphaZero riêng biệt nhắm vào ba mục tiêu khác nhau: cờ vây (AlphaGo Zero), cờ vua và cờ shogi. Trong đó, hệ thống cờ vua đã tự chơi 44 triệu ván với chính mình. Con số này đối với cờ shogi và cờ vây lần lượt là 24 triệu và 21 triệu.
Tuy nhiên, sự thống trị của AlphaZero cũng không thực sự tuyệt đối và ấn tượng bởi có rất nhiều điểm khác biệt quan trọng giữa cờ vây với hai bộ môn còn lại. Luật chơi của cờ vua và cờ shogi rất chặt chẽ và luôn có những giới hạn trong cách di chuyển của mỗi loại quân cờ riêng biệt. Còn với cờ vây, các quân cờ đều bình đẳng với nhau và thế trận hoàn toàn do người chơi thiết lập ngay từ đầu.
Ngoài ra, bàn cờ vua hay cờ shogi cũng được thiết kế cố định chứ không thể tùy biến như cờ vây. Trong cờ shogi còn có thêm điều luật khi “ăn” được quân của đối phương, người chơi có thể đưa quân đó trở lại bàn cờ và sử dụng như quân của mình.
Chính những khác biệt này đã buộc hệ thống thuật toán của AlphaZero phải thay đổi. Vì cờ vây hiện đại không tính kết quả hòa nữa nên AlphaZero không những phải nhanh chóng thích ứng và tối ưu hóa khả năng giành chiến thắng của mình mà còn phải mở rộng cũng như tiếp nhận thêm những khả năng hòa trong bộ môn cờ vua.
Sự khác biệt giữa cờ vây và cờ vua khiến AlphaZero phải thay đổi rất nhiều so với người tiền nhiệm.
Tuy nhiên, trong quá trình “tự học” và trải qua rất nhiều lần thử nghiệm, AlphaZero đã cho ra những kết quả khá ấn tượng: Bất bại khi đối đầu với Stockfish trong 100 ván cờ vua. Khi lựa chọn quân trắng (quân được đi trước), AlphaZero thắng 25 và hòa 25 trong khi lựa chọn quân đen, nó thắng 3 và hòa 47 trận. Điều này cũng không có gì khó hiểu bởi trong cờ vua, người đi trước sẽ luôn nắm trong tay một lợi thế nhất định.
Bên cạnh đó, AlphaZero cũng đã học được một số nước đi mở màn phổ biến nhất trên thế giới. Điều này dù không thực sự nổi bật bởi số lượng nước đi đầu tiên không quá nhiều nhưng nó đã phần nào cho thấy AI có tốc độ tiếp nhận kiến thức do con người khám phá và tích lũy hàng trăm năm qua nhanh đến thế nào.
Còn đối với cờ shogi, AlphaZero đã để lộ một số điểm yếu khi đối đầu với hệ thống “siêu cao thủ” Elmo. Cụ thể, AI của DeepMind đã để thua 5 trận khi chọn quân trắng và 3 trận khi chọn quân đen. Tuy nhiên, cần phải lưu ý rằng cách chơi của shogi khó hơn rất nhiều so với cờ vua vì diện tích bàn cờ lớn hơn, đồng nghĩa với việc độ phức tạp về mặt chiến thuật cũng cao hơn.
Cờ vây có lẽ vẫn là thế mạnh tuyệt đối của hệ thống này. AlphaGo Zero đang là “độc cô cầu bại” với 19 trận thắng khi là người đi trước và 21 trận thắng khi đi sau. Đối với hai bộ môn kia, việc đi trước hay sau cũng đã ít nhiều ảnh hưởng đến kết quả mà AlphaZero mang lại.
Câu hỏi đặt ra lúc này là liệu AlphaZero có thể đánh bại con người như các "đàn anh" của mình hay không?
Cuộc chiến giữa máy với máy đã ngã ngũ khi AI của DeepMind đang trội hơn hẳn so với các đối thủ còn lại. Tuy nhiên, khả năng của AlphaZero khi đối đầu với con người sẽ như thế nào vẫn còn là một ẩn số. Nhưng hãy nhớ rằng ngay cả các kiện tướng dày dạn kinh nghiệm cũng đã phải chịu thất bại trước hai bại tướng của AlphaZero là Elmo và Stockfish. Sẽ không quá khi nói rằng hệ thống này đang sở hữu sức mạnh siêu nhiên vượt quá giới hạn của nhân loại.
Bên cạnh đó, hồi đầu năm nay DeepMind đã tiết lộ họ sẽ để AlphaGo nghỉ ngơi một thời gian sau khi hệ thống AI này dễ dàng đánh bại các đối thủ khác của mình.
Theo VentureBeat
NỔI BẬT TRANG CHỦ
Google: Giải được bài toán 10 triệu tỷ tỷ năm chỉ trong 5 phút, chip lượng tử mới là bằng chứng về đa vũ trụ
Điều đáng ngạc nhiên hơn cả là nhiều người trên cộng đồng mạng thế giới lại đang đồng tình với kết luận của Google.
Gần 2025 rồi mà vẫn dùng USB để lưu công việc thì quả là lỗi thời