GPU Trung Quốc đạt bước nhảy vọt về hiệu năng, tuyên bố đánh bại GPU NVIDIA trong huấn luyện AI
Điều đáng ngạc nhiên hơn cả là công ty sản xuất GPU này của Trung Quốc mới chỉ có tuổi đời 5 năm.
- Cận cảnh Bphone gập từ Trung Quốc: Nhiều tính năng mà iPhone, Samsung còn chưa làm được
- "Vũ trụ Weibo": Tên lửa Trung Quốc mang tên mạng xã hội phóng thành công từ biển
- Cú sốc lớn cho Samsung: Lần đầu tiên bị đối thủ Trung Quốc soán ngôi vương trên mặt trận vốn là niềm kiêu hãnh của ông lớn Hàn Quốc, đến Apple cũng chưa bước chân vào
- Bị nghi tuồn thiết bị sản xuất chip cho Trung Quốc, công ty Mỹ bị điều tra
- Chiêu giảm giá phát huy tác dụng, doanh số iPhone tại Trung Quốc bật tăng ngoài sức tưởng tượng
Công ty Moore Threads của Trung Quốc cho biết họ đang đạt được các bước tiến lớn trong phát triển GPU AI của mình, với GPU tăng tốc AI mới nhất S4000 nhanh hơn nhiều so với thế hệ trước.
Theo báo cáo của cnBeta, quá trình đào tạo bằng cụm điện toán Intelligent Computing Cluster Kua'e Qianka dùng GPU S4000 đứng hạng thứ ba về tốc độ trong bài kiểm tra AI, vượt trội hơn một số đối thủ bao gồm cả các cụm GPU AI của NVIDIA.
Kết quả benchmark được lấy từ một bài kiểm tra ổn định cho cụm điện toán Intelligent Computing Cluster Kua'e Qianka. Quá trình đào tạo mất tổng cộng 13,2 ngày và được cho là hoạt động hoàn hảo không gặp sự cố hay gián đoạn nào trong suốt quá trình hoạt động. Mô hình AI được sử dụng để đánh giá cụm máy tính mới là mô hình ngôn ngữ lớn MT-infini-3B.
Cụm máy tính mới được cho là nằm trong số các cụm GPU AI hàng đầu có cùng quy mô (cùng sử dụng số lượng GPU tương đương). Tuy nhiên, bảng xếp hạng trên cũng có nhiều chi tiết không hợp lý.
Ví dụ, cụm GPU MTT S4000 được so sánh với các GPU NVIDIA không xác định – do vậy chúng ta không biết đó là A100, H100 hay H200, nhưng nhiều khả năng có thể là A100. Các tác vụ cũng không giống nhau. Việc đào tạo bằng MT-infini-3B có thể khác đào tạo Llama3-3B chẳng hạn. Nói cách khác, thông tin trong bảng đánh giá này vẫn còn nhiều chi tiết không hoàn toàn hợp lý.
Tuy vậy, vẫn phải thừa nhận rằng việc đào tạo LLM trên GPU Moore Threads vẫn đại diện cho một bước itense quan trọng trong lộ trình nội địa hóa GPU của Trung Quốc. Cụm máy tính Kua'e Qianka ít nhất cũng cho thấy GPU AI MTT S4000 có thể cạnh tranh với kiến trúc GPU A100 thế hệ trước của Nvidia.
Nhận định này cũng được hỗ trợ bởi số liệu hiệu suất thô của S4000 – khi không chỉ vượt trội so với các GPU AI tiền nhiệm S3000 và S2000 của Moore Thread – mà còn cả các bộ gia tốc AI dựa trên kiến trúc Turing của NVIDIA. S4000 có thể không bằng được bộ gia tốc AI A100 của Nvidia, nhưng có lẽ không kém quá xa hiệu suất của dòng Ampere.
Đối với Moore Threads, mức độ hiệu suất của Kua'e Qianka là một chiến thắng lớn bất kể GPU Nvidia hay LLM nào được kiểm tra. Nó thể hiện rằng Moore Threads hiện có khả năng xây dựng GPU AI có thể thực hiện các công việc tương tự các đối thủ GPU AI từ NVIDIA, AMD và Intel. Có thể khả năng không tốt hơn, nhưng đây là bước đệm quan trọng trên con đường đến những siêu máy tính và cụm AI nhanh hơn, mạnh mẽ hơn.
Đây là một thành tựu đáng nể đối với một nhà sản xuất GPU của Trung Quốc được thành lập chưa đầy 5 năm. Nếu Moore Threads có thể tiếp tục đạt được các cải tiến đáng kể về hiệu suất giữa các thế hệ GPU, họ có thể có một bộ gia tốc GPU AI với hiệu năng tương đương với đối thủ Phương Tây trong vài năm tới. Tất nhiên đó là một chữ "NẾU" và với kinh nghiệm lịch sử, nhiều người thấy rằng việc phát triển GPU không phải luôn diễn ra theo kế hoạch.
Thành tích này còn đáng kể hơn nữa trong bối cảnh chính phủ Mỹ đang tìm mọi cách hạn chế xuất khẩu các GPU AI cao cấp sang Trung Quốc. Điều này đồng thời cũng là nỗ lực hạn chế tiềm năng nghiên cứu và phát triển AI của quốc gia này. Do vậy, mỗi bước tiến dù nhỏ về hiệu năng của các linh kiện này đều sẽ được xem như bước tiến quan trọng cho khả năng tự chủ công nghệ cao của Trung Quốc.
Chúng tôi cũng rất mong chờ xem liệu Moore Threads có thể đưa khả năng hiệu suất AI tốt vào lĩnh vực game hay không. Cho đến nay, các GPU MTT vẫn làm tệ trong các bài kiểm tra game, một phần do các driver/tối ưu hóa chưa hoàn thiện. Trong khi AI cần nhiều khả năng tính toán, nó rất khác so với xử lý đồ họa máy tính theo thời gian thực, vì vậy kinh nghiệm trong lĩnh vực này không đồng nghĩa với khả năng tương tự trong lĩnh vực kia.
NỔI BẬT TRANG CHỦ
Google: Giải được bài toán 10 triệu tỷ tỷ năm chỉ trong 5 phút, chip lượng tử mới là bằng chứng về đa vũ trụ
Điều đáng ngạc nhiên hơn cả là nhiều người trên cộng đồng mạng thế giới lại đang đồng tình với kết luận của Google.
Gần 2025 rồi mà vẫn dùng USB để lưu công việc thì quả là lỗi thời