Học nhiều quá hóa 'loạn trí', mô hình AI của OpenAI tự suy nghĩ bằng tiếng Trung Quốc mà không ai biết tại sao

    Nguyễn Hải,  

    Cho đến nay vẫn chưa có thông báo chính thức nào của OpenAI về lý do cho sự cố này.

    OpenAI, công ty nghiên cứu và phát triển trí tuệ nhân tạo (AI) hàng đầu thế giới, gần đây đã giới thiệu mô hình AI có khả năng "lý luận" mang tên o1. Tuy nhiên, không lâu sau khi ra mắt, nhiều người đã nhận thấy một hiện tượng kỳ lạ từ o1 - mô hình này đôi khi tự "suy nghĩ" bằng tiếng Trung Quốc, tiếng Ba Tư hoặc một số ngôn ngữ khác, ngay cả khi câu hỏi được đặt ra bằng tiếng Anh.

    Khi được giao một bài toán để giải quyết, chẳng hạn như "Có bao nhiêu chữ 'R' trong từ 'strawberry'?", o1 sẽ bắt đầu quá trình "suy nghĩ", đi đến câu trả lời bằng cách thực hiện một chuỗi các bước lý luận. Nếu câu hỏi được viết bằng tiếng Anh, câu trả lời cuối cùng của o1 cũng sẽ bằng tiếng Anh. Tuy nhiên, mô hình này lại thực hiện một số bước bằng ngôn ngữ khác trước khi đưa ra kết luận.

    Học nhiều quá hóa 'loạn trí', mô hình AI của OpenAI tự suy nghĩ bằng tiếng Trung Quốc mà không ai biết tại sao- Ảnh 1.

    Ảnh chụp màn hình cho thấy o1 của OpenAI đang dùng tiếng Trung Quốc để lý luận

    Một người dùng trên Reddit nhận xét: "[o1] đột nhiên bắt đầu suy nghĩ bằng tiếng Trung Quốc khi đang thực hiện bài toán." Trong khi đó, một người dùng khác trên nền tảng X đặt câu hỏi: "Tại sao [o1] lại ngẫu nhiên chuyển sang suy nghĩ bằng tiếng Trung Quốc? Không có phần nào trong cuộc trò chuyện (hơn 5 tin nhắn) là bằng tiếng Trung cả."

    Đến nay, OpenAI vẫn chưa đưa ra lời giải thích cho hành vi kỳ lạ của o1, thậm chí còn không thừa nhận việc này. Vậy điều gì đang xảy ra?

    Các chuyên gia AI cũng không chắc chắn, nhưng họ đưa ra một số giả thuyết. Nhiều người trên X, bao gồm cả CEO của Hugging Face - Clément Delangue, ám chỉ rằng các mô hình lý luận như o1 được huấn luyện trên các bộ dữ liệu chứa nhiều ký tự tiếng Trung Quốc. Ted Xiao, một nhà nghiên cứu tại Google DeepMind, cho rằng các công ty như OpenAI sử dụng dịch vụ gán nhãn dữ liệu của bên thứ ba từ Trung Quốc và việc o1 chuyển sang tiếng Trung Quốc là một ví dụ về "ảnh hưởng ngôn ngữ Trung Quốc trong quá trình lý luận".

    Học nhiều quá hóa 'loạn trí', mô hình AI của OpenAI tự suy nghĩ bằng tiếng Trung Quốc mà không ai biết tại sao- Ảnh 2.

    Tuy nhiên, một số chuyên gia khác không đồng tình với giả thuyết về việc gán nhãn dữ liệu tiếng Trung Quốc cho o1. Họ chỉ ra rằng o1 cũng có thể chuyển sang tiếng Hindi, tiếng Thái hoặc một ngôn ngữ khác ngoài tiếng Trung Quốc khi đang tìm ra giải pháp, nhưng nó lại không làm như vậy.

    Thay vào đó, các chuyên gia này cho rằng o1 và các mô hình lý luận khác có thể đơn giản là sử dụng ngôn ngữ mà chúng thấy hiệu quả nhất để đạt được mục tiêu. Matthew Guzdial, một nhà nghiên cứu AI và giáo sư tại Đại học Alberta, giải thích: "Mô hình không biết ngôn ngữ là gì, hay các ngôn ngữ khác nhau như thế nào. Với nó, tất cả chỉ là văn bản."

    Luca Soldaini, nhà khoa học nghiên cứu tại Viện AI phi lợi nhuận Allen, cũng cảnh báo rằng chúng ta không thể chắc chắn vì sao o1 lại hoạt động như vậy do tính chất "đen hộp" của các mô hình này. "Đây là một trong nhiều lý do tại sao tính minh bạch trong cách xây dựng hệ thống AI lại vô cùng quan trọng", họ nhấn mạnh.

    Nếu không có câu trả lời chính thức từ OpenAI, chúng ta chỉ còn cách tự suy đoán xem tại sao o1 lại nghĩ về bài hát bằng tiếng Pháp, nhưng lại suy nghĩ về sinh học tổng hợp bằng tiếng Quan Thoại.


    Tin cùng chuyên mục
    Xem theo ngày