Tập trung phát triển CPU tối ưu cho AI và AI Agent cũng là trọng tâm lớn trong chiến lược sắp tới đây của Intel.
Trong nhiều năm qua, câu chuyện của ngành AI gần như chỉ xoay quanh một loại phần cứng: GPU. Với loại linh kiện này, NVIDIA là người thống trị không phải bàn cãi, và là người hưởng lợi lớn nhất khi các trung tâm dữ liệu đổ hàng tỷ USD mua card đồ họa nhằm huấn luyện mô hình. Trong khi đó, CPU dần bị đẩy xuống vị trí phụ trợ, đóng vai trò điều phối thay vì xử lý chính.
Tại Computex 2026, Intel bước lên sân khấu với một luận điểm hoàn toàn khác: kỷ nguyên huấn luyện đã qua thời đỉnh cao, và kỷ nguyên tiếp theo sẽ đưa CPU trở lại trung tâm.
Luận điểm này không phải lời quảng cáo suông, mà được củng cố bởi một quan sát thực tế từ thị trường. Ben Bajarin, CEO của Creative Strategies, chỉ ra rằng trong giai đoạn huấn luyện, tỷ lệ triển khai phổ biến là 1 CPU cho mỗi 4 GPU, nhưng khi AI chuyển sang giai đoạn suy luận và tác nhân AI, tỷ lệ đó đang dịch chuyển về gần 1:1, thậm chí thấp hơn.
Nói cách khác, càng nhiều Tác nhân AI chạy thực tế trong doanh nghiệp, CPU càng trở nên không thể thiếu, và đây chính xác là giai đoạn mà Intel đang đặt cược toàn bộ chiến lược của mình.
Bằng chứng cụ thể nhất đến từ thỏa thuận ba bên giữa Intel, SambaNova và Foxconn, được công bố trực tiếp tại sự kiện. Ba công ty này sẽ cùng xây dựng hạ tầng AI quy mô rack cho các trung tâm dữ liệu và trung tâm tình báo, kết hợp bộ vi xử lý Xeon của Intel với chip SambaNova SN-50, một loại chip tái cấu hình luồng dữ liệu chuyên biệt cho suy luận AI.
Trong liên minh này, Foxconn đảm nhận vai trò tích hợp hệ thống và sản xuất, bao gồm cả phiên bản rack tập trung CPU dành cho các tác vụ không cần tăng tốc thêm như suy luận tối ưu chi phí và xử lý dữ liệu. Đây là lần đầu tiên cả ba tên tuổi công bố hợp tác ở cấp độ hạ tầng sản xuất thực tế, không dừng lại ở bản ghi nhớ hợp tác thông thường.
Nguồn Serve The Home
Ở cấp độ chip, Intel giới thiệu Xeon 6+, thế hệ CPU trung tâm dữ liệu tiếp theo được xây dựng trên tiến trình Intel 18A, đánh dấu lần đầu tiên công nghệ sản xuất nội bộ thế hệ mới nhất của Intel xuất hiện trong một CPU máy chủ. Xeon 6+ được thiết kế cho mật độ cao và khả năng mở rộng linh hoạt, với cấu hình tối đa cho phép một rack làm mát bằng chất lỏng chứa đến 36.864 nhân trong 32 đơn vị không gian, vận hành ở mức công suất khoảng 100 kilowatt.
Intel định vị đây là nền tảng để chạy tác nhân AI ở mật độ cao nhất hiện có, trong khi vẫn cho phép các trung tâm dữ liệu mở rộng mà không cần thiết kế lại toàn bộ hạ tầng hiện hữu.
Ngoài mảng hạ tầng, Intel cũng công bố loạt hợp tác ngành dọc nhằm đưa chip vào các giải pháp chuyên biệt theo từng lĩnh vực, trong đó Foxconn không chỉ tham gia mảng rack mà còn mở rộng hợp tác sang thiết kế dịch vụ và phát triển silicon tùy chỉnh.
Siemens, đối tác từ năm 2023, mở rộng hợp tác ra toàn bộ chuỗi giá trị từ thiết kế đến sản xuất chip nhúng, hướng đến điện toán biên, HPC và robotics tích hợp trong thiết bị công nghiệp. Hitachi hướng đến công cụ xưởng đúc và điện toán lượng tử, trong khi Echo Neurotechnologies và Intel đang cùng khám phá công nghệ neuromorphic cho giao diện não máy tính và kiến trúc chip thế hệ tiếp theo.
Ở phần cuối bức tranh Computex của Intel, Vector Core Compute, một đơn vị đám mây suy luận mới do Vista Equity Partners và Cambium Capital thành lập, đã trình diễn trực tiếp trên sân khấu hệ thống suy luận phân tán hoàn toàn, chạy đồng thời Xeon 6, SambaNova và NVIDIA Blackwell trên cùng một kiến trúc và đạt tốc độ suy luận nhanh nhất từ trước đến nay trên mô hình MiniMax 2.5.
Trên mảng PC và thiết bị biên, dòng Core Ultra Series 3 trên tiến trình Intel 18A đang được hơn 325 thiết kế máy tính cá nhân sử dụng, đồng thời mở rộng sang máy chơi game cầm tay với chip Arc G-series ra mắt trong tháng này, và hơn 130 khách hàng đã chọn Series 3 cho các thiết kế AI biên và robotics trên toàn cầu.