FPT cho biết đã triển khai hạ tầng AI mới tại FPT AI Factory sử dụng hệ thống NVIDIA HGX B300, hướng tới các bài toán AI suy luận và AI tự vận hành đang ngày càng phổ biến trong doanh nghiệp.
FPT vừa công bố triển khai hạ tầng AI mới tại FPT AI Factory, sử dụng hệ thống GPU NVIDIA HGX B300 – dòng phần cứng được thiết kế cho các trung tâm AI quy mô lớn. Hạ tầng này được xây dựng nhằm phục vụ các bài toán AI thế hệ mới như AI suy luận (reasoning) và AI tự vận hành (agentic AI).
Theo doanh nghiệp, các mô hình AI mới không chỉ dừng ở việc xử lý dữ liệu mà còn có khả năng đưa ra quyết định và thực thi tác vụ. Điều này khiến nhu cầu tính toán trong giai đoạn suy luận tăng đáng kể so với trước đây, đòi hỏi các hệ thống hạ tầng chuyên dụng.
Khác với mô hình máy chủ truyền thống, hạ tầng GPU mới được cung cấp dưới dạng GPU Cloud. Cách tiếp cận này cho phép doanh nghiệp và nhà phát triển AI có thể truy cập năng lực tính toán từ xa, mở rộng tài nguyên linh hoạt để huấn luyện hoặc vận hành mô hình AI mà không cần đầu tư hạ tầng phần cứng riêng.
Theo FPT, hệ thống GPU Cloud này được thiết kế để hỗ trợ các ứng dụng AI quy mô lớn với thời gian triển khai nhanh hơn và chi phí vận hành tối ưu. Các doanh nghiệp có thể tận dụng nền tảng này để xây dựng và triển khai các hệ thống AI trong nhiều lĩnh vực như tài chính, y tế hoặc công nghệ.
Hiện nền tảng FPT AI Factory đang cung cấp khoảng 43 dịch vụ AI Cloud và phục vụ hơn 18.000 người dùng trên toàn cầu. Hệ thống trước đó đã vận hành trên nền tảng NVIDIA HGX H100 và NVIDIA HGX H200 tại Việt Nam và Nhật Bản. Việc bổ sung HGX B300 nhằm đáp ứng nhu cầu xử lý các bài toán AI ngày càng phức tạp, đặc biệt trong giai đoạn suy luận của mô hình.
FPT cho biết hạ tầng AI mới sẽ được tích hợp vào nền tảng FPT AI Factory nhằm hỗ trợ doanh nghiệp mở rộng ứng dụng AI tại các thị trường như Nhật Bản và Đông Nam Á. Nền tảng này cũng cho phép các lập trình viên và doanh nghiệp đăng ký sử dụng sớm dịch vụ GPU Cloud để thử nghiệm và triển khai các hệ thống AI của riêng mình.
Trong chiến lược công nghệ dài hạn, AI được xem là một trong những hướng đầu tư trọng tâm của FPT. Doanh nghiệp hiện tập trung phát triển các công nghệ như Quantum AI, an ninh mạng, UAV, dữ liệu và công nghệ đường sắt, đồng thời đầu tư vào hạ tầng tính toán và nguồn nhân lực phục vụ phát triển AI.
NỔI BẬT TRANG CHỦ
-
Samsung trình làng Exynos 1680: chip 4nm với GPU AMD RDNA 3 nhắm vào phân khúc tầm trung
Samsung ra mắt Exynos 1680 tiến trình 4nm với GPU AMD RDNA 3 và NPU 19,6 TOPS, nhắm vào phân khúc tầm trung trên Galaxy A57.
-
"Thành trì" cuối cùng ngăn cản người dùng iPhone chuyển sang điện thoại Galaxy vừa bị phá vỡ ở Việt Nam