Tại cuộc gặp mặt bí mật với 30 nhà toán học, AI đang chứng minh khả năng giải toán tiệm cận thiên tài
VTV.vn - Các mô hình suy luận đang có những bước tiến vượt bậc và nhanh chóng.
- AI của Google phạm sai lầm nghiêm trọng, nhầm lẫn giữa Airbus và Boeing trong vụ tai nạn hàng không tại Ấn Độ
- AMD ra mắt Instinct MI350: GPU chuyên AI với 185 tỷ bóng bán dẫn và bộ nhớ HBM3E 288 GB
- Cận cảnh thế hệ máy giặt sấy LG AI DD 2.0: Nhiều tính năng AI, có thể mô phỏng thao tác giặt tay
- Có ai còn nhớ DeepSeek của Trung Quốc: 5 tháng trước còn gây "chấn động địa cầu", sao giờ mất tăm hơi?
- Indonesia mở rộng sử dụng AI giảm tắc nghẽn giao thông
Giữa tháng 5, một hội nghị toán học bí mật quy tụ 30 nhà toán học lừng danh thế giới tại Berkeley, California. Họ đến không phải để thảo luận hay giảng dạy, mà để so tài với một đối thủ kỳ lạ: mô hình chatbot AI o4-mini của OpenAI, một mô hình ngôn ngữ lớn được thiết kế để suy luận cấp cao trong toán học.
Trong hai ngày, các học giả liên tục đưa ra những bài toán hóc búa ở cấp độ nghiên cứu sinh, thậm chí mở rộng, nhằm khiến chatbot lộ điểm yếu. Nhưng điều họ nhận lại là một sự sửng sốt: o4-mini không chỉ giải đúng nhiều câu hỏi khó nhất thế giới mà còn đưa ra lập luận sắc bén đến mức nhiều người phải thốt lên rằng nó “đang tiệm cận với thiên tài toán học”.

Tại buổi gặp mặt kín, mô hình o4-mini cho thấy khả năng giải toán siêu việt - Ảnh: ThisisEngineering/Unsplash.
Tương tự các LLM từng hỗ trợ những phiên bản trước của ChatGPT, o4-mini học bằng cách dự đoán từ kế tiếp trong chuỗi văn bản. Tuy nhiên, so với các thế hệ trước, o4-mini nhẹ hơn, linh hoạt hơn và được huấn luyện bằng dữ liệu chuyên sâu cùng cơ chế tăng cường từ con người mạnh mẽ hơn. Nhờ đó, chatbot này có thể đào sâu vào các vấn đề toán học phức tạp hơn nhiều so với các LLM truyền thống.
Để theo dõi tiến độ của o4-mini, OpenAI trước đó đã giao cho Epoch AI – một tổ chức phi lợi nhuận chuyên đánh giá các LLM – xây dựng bộ câu hỏi gồm 300 bài toán chưa từng được công bố lời giải. Trong khi những mô hình giỏi nhất cũng chỉ giải được chưa tới 2%, o4-mini lại cho thấy điều ngược lại.
Epoch AI đã mời Elliot Glazer, một tiến sĩ toán học vừa tốt nghiệp, tham gia vào dự án đánh giá năng lực có tên FrontierMath vào tháng 9 năm 2024. Dự án thu thập các câu hỏi mới ở nhiều cấp độ khó khác nhau, từ bậc đại học, sau đại học đến cấp nghiên cứu.
Đến tháng 4 năm 2025, Glazer phát hiện o4-mini có thể giải khoảng 20% số câu hỏi. Anh tiếp tục mở rộng sang cấp độ thứ tư - gồm các bài toán thử thách ngay cả với những nhà toán học chuyên nghiệp. Những câu hỏi này chỉ có một nhóm rất nhỏ trên thế giới có thể nghĩ ra chứ chưa nói đến việc giải được. Các nhà toán học tham gia buộc phải ký cam kết bảo mật, chỉ liên lạc qua ứng dụng Signal. Họ không được dùng email hay phương tiện khác vì sợ mô hình học lén thông tin và làm ô nhiễm dữ liệu đánh giá.
Khi yêu cầu o4-mini giải bài toán này, trong vòng 10 phút, ông chứng kiến chatbot trình bày lời giải theo thời gian thực, đồng thời hiển thị quá trình suy luận. Nó mất hai phút đầu để đọc và hiểu tài liệu chuyên ngành liên quan. Sau đó, nó thông báo sẽ thử giải một phiên bản đơn giản hơn để học. Chỉ vài phút sau, nó cho biết đã sẵn sàng giải bài toán gốc. Năm phút tiếp theo, o4-mini đưa ra lời giải đúng với phong cách tự tin và dí dỏm.
“Nó bắt đầu cho ra những câu trả lời láu lỉnh”, Ken Ono, một nhà toán học tại Đại học Virginia, đồng thời là trưởng ban tổ chức và giám khảo cuộc gặp, chia sẻ. Ông kể rằng mô hình o4-mini đã tuyên bố: “Không cần trích nguồn vì con số bí ẩn này do tôi tự tính ra!”

Các nhà toán học rời hội nghị với cảm xúc pha trộn giữa kinh ngạc và lo âu. o4-mini không chỉ nhanh hơn mà còn nói với độ tự tin dễ khiến người ta tin ngay cả khi chưa xác minh. “Đây chính là những gì mà một nghiên cứu sinh xuất sắc sẽ làm, thậm chí còn hơn cả thế”, nhà toán học Yang Hui He nhận xét.
“Tôi từng nói với đồng nghiệp rằng thật sai lầm nếu cứ khăng khăng cho rằng trí tuệ nhân tạo tổng quát sẽ không bao giờ đến, rằng đó chỉ là một cái máy tính”, Ono chia sẻ. “Tôi không muốn góp phần gây hoảng loạn, nhưng ở một số phương diện, các LLM hiện nay đã vượt mặt phần lớn nghiên cứu sinh giỏi nhất thế giới”.
Cuộc đấu trí bí mật này khép lại với một câu hỏi mở: Khi AI bắt đầu giải được những bài toán mà ngay cả con người giỏi nhất cũng bó tay, vai trò của nhà toán học sẽ thay đổi ra sao? Có lẽ, từ những người đi tìm lời giải, họ sẽ trở thành người khơi gợi câu hỏi – một vị trí không kém phần sáng tạo và trọng yếu trong kỷ nguyên AI sắp tới.
Cuối buổi họp, nhóm các nhà toán học bắt đầu suy nghĩ về viễn cảnh tương lai cho ngành nghề đặc thù này. Cuộc thảo luận bắt đầu nhắc tới những bài toán cấp độ năm, những vấn đề hóc búa tới mức những nhà toán học giỏi nhất cũng khó lòng giải được.
Họ cho rằng nếu AI đạt được đến trình độ này, vai trò của người làm toán sẽ thay đổi mạnh mẽ: thay vì trực tiếp giải toán, họ có thể chuyển sang đặt câu hỏi và tương tác với AI suy luận để khám phá sự thật toán học mới, giống như cách giáo sư đã đang làm với các nghiên cứu sinh. Ono cho rằng giáo dục đại học cần chú trọng phát triển tư duy sáng tạo để ngành toán tiếp tục phát triển trong tương lai.
Theo Scientific American
NỔI BẬT TRANG CHỦ
Bên trong "phòng tra tấn iPhone": Tôi đã tận mắt thấy Apple hành hạ sản phẩm của mình như thế nào
Đằng sau lớp vỏ bóng bẩy của Apple là những bài kiểm tra tàn khố, mà những người yêu sản phẩm 'Táo' như tôi chỉ biết xót xa!
Lần đầu tiên trong lịch sử, các nhà khoa học tạo ra được carbon lỏng, mở đường cho nguồn năng lượng nhiệt hạch vô hạn trong tương lai