Coder đánh bại AI trong cuộc thi lập trình, nhưng điều đáng nói là AI đã đánh bại 12 đối thủ con người khác
Mô hình AI tiên tiến của OpenAI đã đạt được thành tích lớn.
Trong một cuộc đua kéo dài 10 tiếng đồng hồ đầy căng thẳng, lập trình viên người Ba Lan Przemysław Dębiak đã đánh bại một mô hình AI tiên tiến của OpenAI trong một cuộc thi lập trình trực tiếp. Tuy nhiên, những người trong và ngoài cuộc tin rằng việc AI vượt mặt con người chỉ còn là điều sớm muộn.

Przemysław Dębiak (bên phải) nhận giải thưởng cho chiến thắng tại cuộc thi Heuristic thuộc vòng chung kết AtCoder World Finals 2025 - Ảnh: Przemysław Dębiak.
Tại vòng chung kết AtCoder World Tour Finals 2025 diễn ra ở Tokyo, Dębiak, với biệt danh “Psyho” và từng là cựu nhân viên của chính OpenAI, đã giành chiến thắng sít sao trước đối thủ silicon trong phần thi Heuristic. Cuộc thi do AtCoder tổ chức, một nền tảng lập trình danh giá của Nhật Bản, là lần đầu tiên một mô hình AI tham gia tranh tài trực tiếp cùng những lập trình viên hàng đầu thế giới tại một giải đấu quy mô toàn cầu.
OpenAI vừa là nhà tài trợ, vừa đưa một mô hình AI đã được tùy chỉnh vào thi đấu trong trận biểu diễn đặc biệt mang tên “Con người vs AI”.
Kết quả cuối cùng cho thấy Psyho dẫn đầu với hơn 1.812 tỷ điểm, vượt qua mô hình AI của OpenAI khoảng 9,5%. Mặc dù không biết mệt như con người, cỗ máy AI vẫn phải chấp nhận vị trí á quân. Dębiak chia sẻ trên X rằng anh gần như không ngủ trong ba ngày thi đấu liên tiếp và mô tả bản thân là “hoàn toàn kiệt sức”. Những nỗ lực này đã mang về cho lập trình viên người Ba Lan chiến thắng chung cuộc.

Kết quả bảng xếp hạng cuối cùng của cuộc thi Heuristic tại vòng chung kết AtCoder World Tour Finals 2025, cho thấy Dębiak (với biệt danh "Psyho") đứng ở vị trí đầu tiên - Ảnh: AtCoder.
Cuộc thi yêu cầu các thí sinh giải một bài toán tối ưu phức tạp trong vòng 600 phút, và chỉ có 12 lập trình viên được mời tham dự vòng chung kết này, dựa trên thành tích cả năm của họ. Nhánh thi Heuristic tập trung vào các bài toán NP-khó, yêu cầu các giải pháp tối ưu tương đối chứ không có lời giải hoàn hảo. Thí sinh được phép sử dụng bất kỳ ngôn ngữ lập trình nào trên AtCoder, với phần cứng giống nhau và quy tắc nghiêm ngặt: không phạt khi nộp lại bài, nhưng phải chờ 5 phút giữa mỗi lần.
Mô hình AI của OpenAI, với biệt danh “OpenAIAHC”, đạt hơn 1.654 tỷ điểm và xếp thứ hai chung cuộc, vượt qua 11 lập trình viên “bằng xương bằng thịt” khác. OpenAI cho biết đây là lần đầu tiên một mô hình AI lọt vào top 3 trong một cuộc thi lập trình hoặc toán học đỉnh cao, đánh dấu một cột mốc quan trọng cho khả năng suy luận, lập kế hoạch và tối ưu dần lời giải của mô hình theo phong cách con người.
Khả năng lập trình của AI đang phát triển chóng mặt. Theo báo cáo AI Index 2025 của Đại học Stanford, các mô hình AI chỉ giải được 4,4 phần trăm bài trong chuẩn SWE-bench vào năm 2023, nhưng đã tăng vọt lên 71,7 phần trăm vào năm 2024. Khảo sát năm 2024 của GitHub cho thấy hơn 90 phần trăm lập trình viên chuyên nghiệp đã sử dụng công cụ AI trong quy trình làm việc, dù nghiên cứu gần đây cảnh báo rằng AI không phải lúc nào cũng giúp tiết kiệm thời gian như kỳ vọng.
Dù vậy, chiến thắng của Dębiak vẫn mang tính biểu tượng. Anh không chỉ vượt qua một cỗ máy được tối ưu để giải các bài toán logic phức tạp mà còn cho thấy rằng trực giác con người, khả năng phát hiện các lối đi không ngờ tới, vẫn là lợi thế độc nhất. Tuy nhiên, như chính Dębiak đã nói trên X, “nhân loại chiến thắng, ít nhất là hiện tại”, và điều đó có thể không kéo dài lâu.
Trong tương lai, các cuộc thi như AtCoder có thể không còn là nơi con người thi đấu với AI, mà là nơi con người thi đấu cùng AI. Hoặc thậm chí, không còn thi đấu gì cả.

NỔI BẬT TRANG CHỦ
Tiết lộ bất ngờ: Xiaomi YU7 Max "chạy thật" chưa được 500km đường trường, thua xa quảng cáo 750km CLTC!
Chiếc xe chỉ đi được gần 500 km trước khi cạn pin, một con số chênh lệch đáng kể so với mức đánh giá chính thức CLTC (Chu kỳ Kiểm tra Xe Hạng nhẹ Trung Quốc) 750 km mà Xiaomi công bố.
Không đùa đâu: MacBook Pro chơi Cyberpunk 2077 cả trăm FPS, còn hai mẫu Mac "quốc dân" cũng chạy vèo vèo