Sao chép công nghệ lõi của DeepSeek, các nhà nghiên cứu Mỹ tạo ra mô hình AI mới với giá "rẻ như cho"

    Nguyễn Hải,  

    Thành công của DeepSeek và mô hình AI mới càng khiến cộng đồng AI đặt câu hỏi về tính hiệu quả trong ngân sách dành cho nghiên cứu AI của Thung lũng Silicon.

    Nhiều ngày nay, startup AI DeepSeek đã gây sóng gió khi giới thiệu R1, một mô hình AI có hiệu năng tương đương của ChatGPT và những hệ thống đắt đỏ khác với chi phí huấn luyện chỉ bằng một phần nhỏ so với mức điển hình ở Thung lũng Silicon. Điều này trở thành hiện thực nhờ vào hàng loạt đột phá về tối ưu phần cứng cũng như phần mềm để việc huấn luyện cũng như vận hành trở nên tiết kiệm hơn.

    Nhưng một nhóm các nhà nghiên cứu tại Đại học California, Berkeley cho biết, họ có thể làm điều đó với giá rẻ hơn nữa – chỉ với 30 USD. Dưới sự dẫn dắt của nghiên cứu sinh Jiayi Pan, các nhà nghiên cứu đã sao chép thành công công nghệ lõi của DeepSeek để tạo ra một phiên bản quy mô nhỏ hơn, được gọi là "TinyZero", và phát hành nó trên GitHub để thử nghiệm công khai.

    Dù chỉ sở hữu quy mô khiêm tốn so với mô hình gốc 671 tỷ tham số, TinyZero được cho là mô phỏng chính xác hành vi cốt lõi của DeepSeek nhờ phương pháp học tăng cường (reinforcement learning).

    Sao chép công nghệ lõi của DeepSeek, các nhà nghiên cứu Mỹ tạo ra mô hình AI mới với giá "rẻ như cho"- Ảnh 1.

    Mô hình TinyZero được phát triển dựa trên các công nghệ cốt lõi của DeepSeek với chi phí siêu rẻ

    Cách tiếp cận của Pan tập trung vào học tăng cường (reinforcement learning), một kỹ thuật trong đó AI, bắt đầu với những phỏng đoán gần như ngẫu nhiên, dần dần tinh chỉnh câu trả lời bằng cách sửa đổi và tìm kiếm các giải pháp khả thi. Trong một bài đăng mô tả dự án, anh đã nêu bật trò chơi Countdown, một câu đố truyền hình của Anh nơi người chơi kết hợp các con số đã cho để đạt được giá trị mục tiêu. "Sau nhiều lần thử sai, nó tự sửa lỗi và đạt đáp án đúng", Pan chia sẻ.

    Thành công của TinyZero đặt ra câu hỏi lớn: Tại sao các tập đoàn như OpenAI hay Google lại chi hàng tỷ USD cho AI trong khi một nhóm nghiên cứu nhỏ có thể đạt kết quả tương tự với ngân sách "hạt dẻ"? DeepSeek từng gây sốc khi tuyên bố chi phí đào tạo mô hình R1 chỉ vài triệu USD, nhưng TinyZero còn đi xa hơn – chỉ tốn 30 USD cho phiên bản thu nhỏ.

    Sao chép công nghệ lõi của DeepSeek, các nhà nghiên cứu Mỹ tạo ra mô hình AI mới với giá "rẻ như cho"- Ảnh 2.

    Dù có quy mô tham số nhỏ hơn, TinyZero cũng tái tạo được khả năng của DeepSeek khi xử lý tác vụ

    Các con số này đi ngược lại quan niệm thông thường rằng những bước đột phá lớn trong AI đòi hỏi toàn bộ trung tâm dữ liệu, GPU ngốn điện, và hàng triệu thậm chí phải chi tiêu đến hàng tỷ USD.

    Tuy nhiên, nhiều ý kiến vẫn hoài nghi. Họ cho rằng con số DeepSeek công bố chưa phản ánh toàn bộ sự thật, vì có khả năng công ty này đang hưởng lợi từ các nguồn lực hay kỹ thuật khác được giữ kín. Dù TinyZero là minh chứng cho việc học tăng cường hiệu quả có thể triển khai với ngân sách eo hẹp, nó không hoàn toàn tương đương để so sánh năng lực với DeepSeek. TinyZero giống một phiên bản mẫu đơn giản hóa hơn là đối trọng thực sự.

    Dù vậy, thí nghiệm của UC Berkeley hé lộ xu hướng mới: AI mã nguồn mở và tiết kiệm tài nguyên. Nếu các nhà phát triển độc lập có thể tạo ra công nghệ tương tự với ngân sách hạn chế, áp lực cạnh tranh lên các đại gia công nghệ là không nhỏ. "TinyZero cho thấy sáng tạo không nhất thiết phải đắt đỏ. Một sinh viên xuất sắc hoặc startup nhỏ cũng có thể làm nên điều khác biệt", một nhà phân tích nhận định.

    Sao chép công nghệ lõi của DeepSeek, các nhà nghiên cứu Mỹ tạo ra mô hình AI mới với giá "rẻ như cho"- Ảnh 3.

    Thành công của TinyZero và DeepSeek R1 phản ánh nhu cầu ngày càng lớn đối với các mô hình AI gọn nhẹ, tiết kiệm năng lượng. Điều này mở ra cánh cửa cho những quốc gia hoặc tổ chức thiếu ngân sách tiếp cận công nghệ cao, đồng thời thúc đẩy cạnh tranh trong ngành. Tuy nhiên, thách thức vẫn tồn tại. Các mô hình quy mô nhỏ như TinyZero dù ấn tượng nhưng chưa thể xử lý đa nhiệm phức tạp như phiên bản đầy đủ. Hơn nữa, việc sao chép công nghệ có thể dẫn đến rủi ro về bản quyền và chất lượng.

    Theo nhóm nghiên cứu UC Berkeley, mục tiêu của họ là "giải mã xu hướng mở rộng AI dựa trên học tăng cường" và khuyến khích cộng đồng cùng tham gia. Với làn sóng quan tâm từ khắp thế giới, TinyZero đã chứng minh rằng cuộc cách mạng AI không chỉ thuộc về những ai có ví tiền dày, mà còn mở ra cho những ý tưởng táo bạo và sáng tạo không biên giới. Liệu đây có phải bước khởi đầu cho kỷ nguyên AI "bình dân"? Câu trả lời phụ thuộc vào cách ngành công nghiệp này thích ứng với làn sóng mới.

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ