Phát triển DeepSeek chỉ mất 6 triệu USD hóa ra là hiểu nhầm, con số thật khác xa so với tưởng tượng

    Nguyễn Hải,  

    Cho dù chi phí thực của DeepSeek không phải là 6 triệu USD như hiểu nhầm, con số vẫn thấp hơn nhiều so với các hãng công nghệ lớn của Mỹ.

    Khi mô hình AI DeepSeek R1 ra mắt và nhanh chóng thu hút sự chú ý của cộng đồng công nghệ, một con số đã khiến giới chuyên gia bất ngờ: DeepSeek R1 được phát triển chỉ với 5,6 triệu USD. Nhiều người cho rằng đây là minh chứng cho việc Trung Quốc có thể xây dựng một mô hình AI tiên tiến với chi phí thấp đáng kinh ngạc, đặc biệt khi so sánh với khoản đầu tư hàng tỷ USD mà các công ty công nghệ phương Tây như OpenAI và Google đã chi cho các mô hình của mình.

    Tuy nhiên con số này dường như chỉ là một sự hiểu lầm. Trên thực tế, chính tài liệu của DeepSeek cũng cho biết con số 5,6 triệu USD này chỉ là chi phí huấn luyện mô hình V3 của họ tính theo số giờ vận hành trên các GPU NVIDIA H800 – không phải là tổng chi phí thực sự để xây dựng và phát triển toàn bộ mô hình AI của startup này.

    Phát triển DeepSeek chỉ mất 6 triệu USD hóa ra là hiểu nhầm, con số thật khác xa so với tưởng tượng- Ảnh 1.

    5,6 triệu USD chỉ là chi phí huấn luyện mô hình trên các GPU NVIDIA H800

    Để huấn luyện một mô hình AI lớn như R1, công ty cần một lượng tài nguyên tính toán khổng lồ, đòi hỏi hàng chục nghìn GPU mạnh mẽ, các trung tâm dữ liệu, cũng như đội ngũ nghiên cứu hàng trăm người. Nếu xét đến toàn bộ hệ thống phần cứng mà DeepSeek đang vận hành, con số thực sự bỏ ra để phát triển R1 chắc chắn cao hơn nhiều.

    Chi phí để phát triển DeepSeek là bao nhiêu?

    Theo tuyên bố của DeepSeek, mô hình V3 của họ được huấn luyện dựa trên 2048 GPU NVIDIA H800 - phiên bản GPU AI được phát triển cho thị trường Trung Quốc với hiệu năng kém hơn. Ngay cả như vậy, với giá bán lẻ khoảng 32.000 USD cho mỗi GPU H800 (thậm chí còn cao hơn do nguồn cung khan hiếm), chi phí để mua cụm GPU này cũng lên đến hơn 70 triệu USD, chưa kể các chi phí thiết lập cài đặt khác. Nhưng nếu việc huấn luyện được thực hiện trên các nền tảng đám mây, chi phí có thể giảm xuống chỉ còn 5,6 triệu USD như tuyên bố nói trên của DeepSeek. Nhưng vẫn còn nhiều khoản chi phí khác.

    Nhiều bài đăng trên các mạng xã hội Trung Quốc từ trước tháng 11 năm 2024 cho biết, một trong các công ty sở hữu nhiều GPU AI nhất Trung Quốc lại không phải là công ty công nghệ mà là một quỹ đầu tư định lượng khổng lồ có tên High-Flyer. Đều có cùng nhà sáng lập là Liang Wenfeng, quỹ định lượng này được cho là nguồn lực hậu thuẫn khổng lồ cho DeepSeek từ đầu.

    Phát triển DeepSeek chỉ mất 6 triệu USD hóa ra là hiểu nhầm, con số thật khác xa so với tưởng tượng- Ảnh 2.

    Liang Wenfeng, nhà sáng lập của DeepSeek cũng là người đồng sáng lập quỹ định lượng High-Flyer giàu có

    Theo nguồn tin từ trang ZhiShiTang, nhiều năm nay, chính Liang Wenfeng đã rót tiền vào nhiều startup AI khác nhau. Một trong số đó lên kế hoạch thuê 2.000 m2 đất tại vị trí đắc địa ở Bắc Kinh để phát triển một cơ sở nghiên cứu khoa học.

    Trước khi lệnh cấm xuất khẩu chip AI được áp đặt lên Trung Quốc, quỹ High-Flyer đã sở hữu khoảng 1.100 GPU NVIDIA A100 với chi phí khoảng 28 triệu USD. Sau đó theo website công ty và bài đăng trên WeChat, thêm một cụm siêu máy tính AI thứ hai đã được phát triển với khoảng 10.000 GPU NVIDIA A100 có chi phí khoảng 140 triệu USD.

    Việc quỹ này sở hữu số lượng lớn các GPU AI cũng không có gì lạ. Với vai trò là một quỹ đầu cơ định lượng, High-Flyer ban đầu tập trung vào việc sử dụng trí tuệ nhân tạo để tối ưu hóa chiến lược giao dịch tài chính, nhưng sau đó đã chuyển hướng đầu tư mạnh mẽ vào AI tổng quát (AGI) với tham vọng phát triển một hệ thống AI tiên tiến đủ sức cạnh tranh với các tập đoàn công nghệ hàng đầu thế giới.

    Phát triển DeepSeek chỉ mất 6 triệu USD hóa ra là hiểu nhầm, con số thật khác xa so với tưởng tượng- Ảnh 3.

    Trong khi vẫn chưa rõ quỹ định lượng này đầu tư bao nhiêu tiền vào DeepSeek, cũng như số lượng GPU AI mà startup này được tiếp cận khi phát triển mô hình AI của mình – tuy nhiên chắc chắn con số cũng không hề nhỏ. Cho đến nay, DeepSeek chỉ tuyên bố sử dụng chip H800 và H20 có hiệu năng kém hơn nhiều của NVIDIA để đào tạo mô hình DeepSeek-V3 và phiên bản tiền nhiệm DeepSeek-V2 với chi phí thấp hơn nhiều so với các đối thủ phương tây.

    Mặc dù vậy, hàng loạt các khoản đầu tư ban đầu nói trên cho thấy khó có thể nói DeepSeek phát triển được các mô hình AI của mình chỉ với khoản đầu tư nhỏ - chỉ vài triệu USD.

    Điều trớ trêu là nhiều ngày nay, yếu tố chi phí siêu thấp này đang được cộng đồng mạng sử dụng để chỉ trích một tuyên bố khác của CEO OpenAI, Sam Altman, vào năm 2023 khi cho rằng các startup AI với ngân sách dưới 10 triệu USD là "hoàn toàn vô vọng" nếu muốn cạnh tranh với những gã khổng lồ công nghệ. Có vẻ tuyên bố này của ông Altman vẫn đúng.

    Phát triển DeepSeek chỉ mất 6 triệu USD hóa ra là hiểu nhầm, con số thật khác xa so với tưởng tượng- Ảnh 4.

    CEO OpenAI, Sam Altman

    Mặc dù vậy, cũng không thể phủ nhận bước đột phá về tối ưu chi phí mà DeepSeek mang lại cho công nghệ AI toàn cầu.

    Trong khi các công ty công nghệ phương Tây như OpenAI, Google hay Meta chi hàng tỷ USD để phát triển AI, DeepSeek tận dụng lợi thế của mình bằng cách tối ưu hóa thuật toán để huấn luyện mô hình trên các GPU cũ hơn nhưng vẫn hiệu quả. Trong khi OpenAI sử dụng GPU H100 – dòng chip AI mạnh mẽ nhất hiện nay, thì DeepSeek chủ yếu sử dụng GPU A100, vốn bị Mỹ cấm xuất khẩu sang Trung Quốc từ năm 2022.

    Dù vậy, vẫn còn nhiều câu hỏi chưa có lời giải về khả năng mở rộng của DeepSeek R1 trong dài hạn. Trong khi OpenAI và Google liên tục cải tiến các mô hình AI với những đột phá mới, DeepSeek vẫn phải đối mặt với những hạn chế về phần cứng do các lệnh cấm vận từ Mỹ. Ngoài ra, sự kiểm duyệt nội dung tại Trung Quốc có thể khiến mô hình này không thể cạnh tranh về mặt tự do ngôn luận và xử lý thông tin nhạy cảm như các đối thủ phương Tây.

    Tuy nhiên, không thể phủ nhận rằng DeepSeek đã tạo ra một tiền lệ quan trọng trong ngành công nghiệp AI. Nếu các công ty khác có thể học hỏi từ cách tiếp cận này, rất có thể chúng ta sẽ chứng kiến một sự thay đổi lớn trong cách AI được phát triển và thương mại hóa trên toàn cầu. Trong tương lai, AI có thể không còn là sân chơi độc quyền của các tập đoàn công nghệ khổng lồ, mà còn là cơ hội cho những công ty biết cách tối ưu hóa chi phí và tài nguyên một cách thông minh.

    Nguyễn Hải

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ