Ván đấu thứ 3: Sự tuyệt vọng của kỳ thủ cờ vây số một thế giới

    Nguyễn Hải,  

    Một điều mà trước trận đấu này, hầu hết cộng đồng cờ vây và các chuyên gia trên thế giới đều không tin giờ đã thành sự thật. Giờ người ta sẽ quan tâm hơn đến lĩnh vực nào tiếp theo mà máy móc sẽ vượt qua con người.

    Hệ thống máy tính trí tuệ nhân tạo của Google, AlphaGo đã tuyên bố chiến thắng trong trận đấu lịch sử với kỳ thủ cờ vây người Hàn Quốc, anh Lee Sedol, sau chiến thắng tại ván đấu thứ ba liên tiếp trong một trận đấu năm ván. Tuy nhiên, trong phòng họp báo sau trận đấu, Lee Sedol cho biết anh hy vọng mọi người sẽ tiếp tục theo dõi hai ván còn lại của trận đấu này.

    Trong 25 năm gần đây, máy móc đã chiến thắng những người hàng đầu trong các môn cờ đam, cờ vua, Othello và Jeopardy. Nhưng đây là lần đầu tiên một hệ thống trí tuệ nhân tạo vươn lên đứng đầu trong môn cờ vây, một trò chơi với độ phức tạp vượt xa cờ vua. Google cho biết những khả năng có thể xảy ra trong cờ vây còn nhiều hơn số nguyên tử trong vũ trụ.

    Chiến thắng này là một cột mốc quan trọng đối với AI – trí tuệ nhân tạo – với ý nghĩa vượt xa chiến thắng trong một trò chơi thông thường. Với nhiều công nghệ máy học ở trung tâm của AlphaGo, vốn đang dùng để vận hành nhiều dịch vụ trực tuyến bên trong các công ty Internet lớn nhất thế giới, chiến thắng này cho thấy AI tiến bộ nhanh như thế nào trong những năm gần đây.

    Chỉ hai năm trước, hầu hết các chuyên gia đều tin rằng sẽ phải mất hàng thập kỷ đến máy móc có thể giành được chiến thắng này. Nhưng các nhà nghiên cứu tại DeepMind, một phòng thí nghiệm ở London được Google mua lại, thay đổi phương trình trong các công thức của máy học, để máy móc có thể tự học chơi môn này. Lee Sedol được coi là kỳ thủ cờ vây giỏi nhất thế giới trong thập kỷ gần đây, nhưng anh đã bị đánh bại bởi cỗ máy tự dậy chính mình trong môn này.

    Một trận đấu ý nghĩa

    Mặc dù AlphaGo đã thắng hai ván đầu của trận đấu, nhưng kết quả của ván thứ ba vẫn chưa chắc chắn, khi nó được bao quanh bởi một loạt sự thay đổi thú vị. Không giống như ván thứ hai, trong ván thứ ba, Lee Sedol chơi quân đen – được coi là một lợi thế khi đi trước. Và anh cũng có kinh nghiệm từ hai ván đấu trước – đây được xem như một lợi thế do nhóm Google không được tinh chỉnh AlphaGo giữa trận đấu.

     Đồng sáng lập Google, Sergey Brin (bên phải) và Lee Sedol (ở giữa).

    Đồng sáng lập Google, Sergey Brin (bên phải) và Lee Sedol (ở giữa).

    Nếu như ván đấu đầu tiên có sự góp mặt của chủ tịch Google ông Eric Schmidt và Jeff Dean, một trong những kỹ sư quan trọng nhất của công ty, ở hàng ghế khán giả, thì ván đấu thứ ba, người đồng sáng lập Google, ông Sergey Brin đã âm thầm đến Seoul để chứng kiến. Trận đấu này không chỉ là một sự kiện thể thao nữa, nó còn đại diện cho tương lai của Google.

    Vì những lý do khác nhau, trận đấu này cũng quan trọng với Lee Sedol. Trước khi ván đấu thứ ba bắt đầu, anh phải chịu áp lực về việc giành chiến thắng tại ít nhất một ván đấu. Khi trọng tài bắt đầu ván đấu, anh hơi nghiêng người về phía trước, và dường như đang cố kiềm chế bản thân khi nhắm mắt lại trong vài giây.

     Khoảnh khắc suy tư của Lee Sedol trước trận đấu.

    Khoảnh khắc suy tư của Lee Sedol trước trận đấu.

    Khai cuộc tấn công

    Ngay từ đầu, Lee Sedol đã chơi nhanh và rõ ràng không có ý định giữ an toàn. Theo Michael Redmond, một trong những nhà bình luận tiếng Anh của trận đấu, kỳ thủ người Hàn Quốc khai cuộc khá bất thường, có lẽ anh nhắm đến việc đẩy AlphaGo theo hướng mới. Quả thật, trong vòng 45 phút đầu tiên, Redmond cảm thấy trò chơi đã bước vào một lãnh thổ hoàn toàn mới. “Nó đã ở vị trí mà chúng ta có thể chưa bao giờ thấy trong một trận đấu chuyên nghiệp.” Ông nói.

     Minh họa lựa chọn của AlphaGo.

    Minh họa lựa chọn của AlphaGo.

    Không chỉ bởi cách khai cuộc của Lee Sedol, sự kịch tính còn nằm ở cách AlphaGo tiếp cận trận đấu. Cỗ máy này không chơi theo cách của con người. Sử dụng mạng lưới thần kinh – một mạng khổng lồ của phần cứng và phần mềm bắt chước mạng nơ ron thần kinh trong bộ não người, AlphaGo học trò chơi bằng cách phân tích hàng ngàn bước đi từ các cao thủ cờ vây ngoài đời thực. Nhưng sau đó, sử dụng một công nghệ khác gọi là học tăng cường, nó đạt đến một cấp độ chơi cao hơn sau khi tự chơi với chính mình, với mục đích là đạt được chiến thắng với xác suất cao nhất. Kết quả là máy tính thường có những bước đi không giống với cách của con người.

    Trong ván đấu thứ hai, ở nước đi thứ 19 của mình, AlphaGo đã làm bất ngờ mọi người, kể cả các nhà bình luận và Lee Sedol. Ba giờ sau đó, nước đi đó chứng minh hiệu quả của mình bằng việc AlphaGo chiến thắng ván đấu.

    Phong cách Lee Sedol

    Ván đấu thứ ba rất khác biệt với hai ván trước. Sau 1h 24 phút, Redmond đã gọi ván đấu này có phong cách “rất giống của Lee Sedol”, đặc trưng bởi cách tiếp cận tấn công và nhanh chóng của mình. Nhưng AlphaGo cũng chơi tấn công đối kháng, và Redmond cũng không thể biết ai đang dẫn trước và ai đang theo sau.

    Đó là điều rõ ràng trong suy nghĩ của Redmond về trận đấu. Cả hai người chơi đều đang tập trung ở phía trên bên trái bàn cờ, và Redmond cho rằng Lee Sedol đã đưa mình vào một tình thế “đáng sợ”. “Tôi sẽ lo lắng nếu tôi là quân đen,” ông nói, đề cập đến tình thế hiện tại của kỳ thủ Hàn Quốc. Nói cách khác, áp lực cho Lee Sedol phải thoát ra khỏi góc trên cùng bên trái đó và mở rộng vào trung tâm của bàn cờ. Trong khi đó, AlphaGo chỉ đơn giản kết nối các quân trắng với nhau, thay vì các nước đi có tính chiến lược hơn – và Redmond bắt đầu băn tự hỏi, liệu có phải AlphaGo nghĩ “mình đang dẫn trước”.

    Nhà nghiên cứu của Google, ông Thore Graepel giải thích vào đầu tuần này, vì AlphaGo chỉ tối đa hóa khả năng chiến thắng ván đấu, nó không cần thiết tối đa hóa giới hạn của chiến thắng. Vì vậy, ông Graepel cho rằng những nước đi không hợp lý hay lỏng lẻo có thể là một dấu hiệu cho thấy cỗ máy tin rằng khả năng chiến thắng của nó là khá cao. Như Redmond đã thấy, các nước đi mới nhất của AlphaGo đang lỏng lẻo.

    Lúc đó trận đấu cũng còn khá sớm. “Nó chỉ như mới bắt đầu,” Redmond nói. “Nói chung, đó là điều nguy hiểm khi bạn nghĩ bạn đang dẫn trước ở thời điểm này của trận đấu. Vẫn còn quá nhiều diện tích trên bàn cờ cần được lấp đầy.”

    Quy tắc Kiếp

    Trong trận đấu, Lee Sedol đã có cơ hội để đem lại tình trạng “ko” (kiếp). Về cơ bản, đó là tình huống mà trò chơi có thể rơi vào vòng lặp khi hai đấu thủ bắt đi bắt lại quân của nhau tại một vị trí. Vì vậy, có một quy tắc để tránh rơi vào tình trạng lặp này, quy tắc đó gọi là Kiếp. Nhưng với trận đấu này, những người theo dõi cho rằng AlphaGo – cũng như các chương trình chơi cờ vây khác – khá yếu để xử lý một tình huống như vậy.

    Trong ván đấu một và hai, AlphaGo dường như tránh rơi vào tình thế ko. Nhưng Redmond không cho là như vậy. Trong trận đấu với Fan Hui vào tháng Mười, cỗ máy vẫn thành công khi nắm lấy tình huống ko. “Tôi nghi ngờ đó sẽ là một vấn đề lớn.” Ông nói.

    Cuối cùng, trong ván đấu thứ ba, tình huống ko đã không diễn ra. Thay vào đó, Lee Sedol chống đỡ vị trí của mình ở phía bên trái bàn cờ khi AlphaGo tiếp tục các bước đi mà Redmond và một nhà bình luận khác, Chris Garlock mô tả là lỏng lẻo.

    Thời gian khó khăn

    Sau 2h 40 phút, hai đối thủ đã gần đến lúc tàn cuộc. Nhưng lúc đó, vẫn còn quá sớm để nói ai đang dẫn trước. Nhưng Lee Sedol bắt đầu đi gần đến lúc khó khăn, như anh đã gặp phải ở ván thứ hai. Bởi vì anh thấy mình đã rơi vào vị trí chật chội của bên trái bàn cờ, mà kỳ thủ Hàn Quốc đã dùng phần lớn thời gian ở đầu ván đấu, thời gian chơi của anh chỉ còn chưa đầy 20 phút. AlphaGo vẫn còn đến một giờ. Khi thời gian chơi đã hết, người chơi phải thực hiện nước đi trong vòng dưới 60 giây.

    Khi trận đấu được ba tiếng, Garlock nói “Dường như Lee Sedol đang gặp khó khăn.” Và Redmond cũng đồng ý với điều đó. Lee Sedol đang có nguy cơ mất một mảng lớn lãnh thổ ở nửa dưới bàn cờ trong khi anh chỉ còn 10 phút nữa. Khi thời gian đã hết, Redmond cho rằng kỳ thủ người Hàn Quốc chỉ còn rất ít lựa chọn trừ khi anh làm gì đó quyết liệt. Sau đó, Lee Sedol hai lần mắc lỗi khi ra nước đi trong vòng 60 giây. Một lần mắc lỗi nữa, thời gian đi một nước của anh sẽ chỉ còn 30 giây. Redmond ngày càng chắc chắn chiến thắng cho AlphaGo, nhưng Lee Sedol vẫn tiếp tục chiến đấu.

    Các nhà bình luận lại quay về khả năng của một ko – lý thuyết cho rằng đây có thể là một yếu điểm của AlphaGo, và là hy vọng duy nhất cho Lee Sedol. Trong khi đó, AlphaGo tiếp tục sử dụng ngày càng nhiều thời gian trong mỗi lần chơi. Lúc này, nó chơi như một con người, tương tự như một người chơi hàng đầu trong nỗ lực để kết thúc trận đấu.

    Nhưng sau đó, AlphaGo chơi một ko. Đến lúc này, Redmond bác bỏ suy nghĩ cho rằng AlphaGo không thể xử lý một ko. “Tôi nghĩ chúng ta đã có câu trả lời cho câu hỏi của mình về ko,” ông nói. Nhưng Lee Sedol vẫn tiếp tục chiến đấu. Tuy nhiên, chỉ sau đó một chút, khi trận đấu kéo dài hơn 4h, Lee Sedol tuyên bố đầu hàng.

    AlphaGo có một lần thắng với quân đen, và hai lần thắng với quân trắng. Chỉ vài ngày trước đó, hầu hết cộng đồng cờ vây trên thế giới cho rằng điều đó là không thể. Nhưng giờ máy móc đã giành chiến thắng cuối cùng.

    Tham khảo Wired

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ