AMD đã hỗ trợ Gemma 4, cả PC thường cũng chạy được

Thế Duyệt, Thanh Niên Việt 

Toàn bộ GPU Instinct, Radeon và bộ xử lý Ryzen AI đều tương thích với các phiên bản Gemma 4 từ 2 tỷ đến 31 tỷ tham số, người dùng cá nhân có thể chạy qua LM Studio hoặc Lemonade Server mà không cần phần cứng chuyên dụng.

AMD vừa công bố hỗ trợ từ ngày đầu ra mắt (Day Zero) cho toàn bộ dòng mô hình AI mã nguồn mở Gemma 4 của Google trên tất cả phần cứng AI của hãng, từ GPU dành cho trung tâm dữ liệu cho đến CPU dành cho máy tính cá nhân.

Gemma 4 là thế hệ mô hình AI mã nguồn mở mới nhất của Google, gồm nhiều phiên bản với kích thước từ 2 tỷ đến 31 tỷ tham số. AMD xác nhận toàn bộ dòng sản phẩm của hãng đều có thể chạy được Gemma 4, bao gồm GPU AMD Instinct dành cho máy chủ doanh nghiệp và điện toán đám mây, GPU AMD Radeon dành cho máy trạm AI, và bộ xử lý AMD Ryzen AI dành cho PC thế hệ mới.

AMD hỗ trợ Gemma 4 từ ngày đầu, cả PC thường cũng chạy được - Ảnh 1.

Với người dùng doanh nghiệp và nhà phát triển, AMD hỗ trợ triển khai Gemma 4 qua nhiều framework phổ biến. Trên vLLM, nền tảng phục vụ mô hình AI tối ưu cho nhiều yêu cầu đồng thời, toàn bộ GPU AMD tương thích đều có thể chạy Gemma 4, từ dòng Instinct lẫn Radeon nhiều thế hệ. Framework SGLang cũng được hỗ trợ trên các GPU AMD MI300X, MI325X và MI35X, cho phép triển khai cả dòng mô hình dày đặc (E2B, E4B, 31B) lẫn biến thể MoE (26B-A4B). Đáng chú ý, toàn bộ mô hình Gemma 4 đều vừa trong một GPU MI300X duy nhất với bộ nhớ 192 GB HBM ở độ dài ngữ cảnh đầy đủ.

Với người dùng phổ thông muốn chạy AI ngay trên máy tính cá nhân, AMD hỗ trợ hai phương án chính. Thứ nhất là LM Studio, ứng dụng phổ biến cho phép tải và chạy các mô hình AI trên máy tính cá nhân. Người dùng có bộ xử lý Ryzen AI, Ryzen AI Max, hoặc card đồ họa Radeon và Radeon PRO chỉ cần tải LM Studio và cài driver AMD Software: Adrenalin Edition mới nhất là có thể dùng được Gemma 4.

AMD hỗ trợ Gemma 4 từ ngày đầu, cả PC thường cũng chạy được - Ảnh 2.

Phương án thứ hai là Lemonade Server, phần mềm máy chủ AI mã nguồn mở với API tương thích OpenAI. Lemonade hỗ trợ tăng tốc qua ROCm trên GPU Radeon và Radeon PRO, đồng thời hỗ trợ NPU XDNA 2 trên các bộ xử lý Ryzen AI. Điều này có nghĩa là Gemma 4 có thể chạy trên cả GPU lẫn chip AI chuyên dụng tích hợp trong CPU, giúp tiết kiệm điện năng trong nhiều kịch bản sử dụng.

Hỗ trợ NPU cho các phiên bản Gemma-4 E2B và E4B sẽ có mặt trong bản cập nhật Ryzen AI SW tiếp theo, sau đó được tích hợp vào Lemonade và cũng cung cấp trực tiếp cho nhà phát triển dưới dạng OnnxRuntime API.

Tin cùng chuyên mục
Xem theo ngày