Còn khoảng 2 tuần nữa, nhà sản xuất (NSX) chip x86 lớn thứ hai thế giới sẽ tung ra thế hệ APU (CPU kèm GPU) mới mà hãng này đã lên kế hoạch từ rất lâu. Sử dụng chung tiến trình bán dẫn 32nm của Global Foundries (GF), Trinity sẽ thay thế dòng chip Llano đóng vai trò chủ đạo trong toàn bộ sản phẩm của AMD suốt 2011.
Riêng về hiệu năng, chúng ta đã có dịp "nghía" qua ở
một bài trước. Nhìn chung Trinity tốt hơn Llano, chủ yếu ở năng lực đồ hoạ. Hiệu năng CPU có cao hơn nhưng không đáng kể. Vậy hết thảy các thứ trên đến từ đâu?
Có khá nhiều yếu tố gây ảnh hưởng ở đây, song tựu chung lại nằm ở 2 món: nhân x86 Piledriver và nhân đồ hoạ VLIW4.
Kiến trúc Bulldozer cho APU
Một trong các chủ đề được bàn nhiều về AMD trong suốt 2011 là nhân điện toán Bulldozer (BD). Đây là kiến trúc x86 mới mà hãng này thai nghén suốt nhiều năm qua, nhằm thay thế kiến trúc K10.5 (nâng cấp từ K8) vốn đã có tuổi. Điều không hay là: các chip BD (32nm) thậm chí không nhanh hơn chip K10.5 (45nm) mà còn tiêu thụ nhiều điện hơn. Dòng chip FX (BD) của AMD bị đánh giá là một trong các thất bại khổng lồ trong giới công nghệ.
Trong khi đó Llano (32nm) được ra mắt cùng lúc với BD nhưng hướng đến phân khúc PC tầm trung, vẫn tiếp tục dùng kiến trúc K10.5, tỏ ra khá tốt nhờ nhân đồ hoạ tích hợp (IGP) mạnh mẽ hơn khá nhiều đối thủ Sandy Bridge (SnB) dù hiệu năng CPU kém xa. Câu hỏi được đặt ra: AMD sẽ không dùng kiến trúc K10.5 nữa thì liệu "lứa" APU tiếp theo có yếu hơn Llano về mặt CPU không?
Trinity sẽ dùng kiến trúc BD, song không như dòng chip FX ra mắt trước đấy. Kiến trúc BD trên Trinity sẽ là bản nâng cấp, được biết đến với tên gọi Piledriver. Piledriver về căn bản vẫn là BD, có thiết kế dựa trên nền tảng "module": cứ 2 nhân số nguyên (INT) và 1 nhân số thực (FPU) gom thành 1 module. Các nhân INT sẽ có bộ đệm L1 Cache riêng nhưng dùng chung bộ đệm L2 Cache. So với kiến trúc K10.5, "hạt nhân" cơ bản của BD / Piledriver sẽ là module thay cho core (nhân). Nói cách khác một con chip BD / Piledriver phải sẽ có số nhân là bội của 2 (2 - 4 - 6 - 8).
AMD cho biết cải thiện của Piledriver so với BD gồm:
- 2 tập lệnh FMA3 và F16C mới.
- Tăng mức IPC, xung nhân.
- Giảm rò rỉ điện năng, lượng CAC.
Kết quả của các thay đổi trên là sức mạnh của Piledriver sẽ cao hơn Husky (K10.5) từ 20 - 30%. Song tuỳ ứng dụng mà các cải thiện này sẽ thể hiện cụ thể ra sao.
Nhân đồ hoạ VLIW4
Nếu so về lượng nhân đồ hoạ (SP), Trinity thậm chí có ít hơn Llano: 384 vs. 400! Song chi tiết thú vị là 384 SP "này" lại cho sức mạnh cao hơn 400 SP "kia". Nguyên nhân? Có 2 yếu tố:
- Kiến trúc VLIW4 tận dụng tài nguyên tốt hơn VLIW5.
- TurboCORE 3.0 dành cho GPU.
VLIW4 là kiến trúc đồ hoạ được AMD áp dụng cho dòng card rời HD 6900, còn VLIW5 là kiến trúc được AMD áp dụng suốt từ HD 2000 cho đến nay. Việc AMD chuyển từ VLIW5 xuống VLIW4 vì các game mới không tận dụng được toàn bộ cụm 5 nhân đồ hoạ cho việc xử lý. Cấu hình các cụm xử lý xuống còn 4 nhân vẫn cho phép đạt hiệu năng tương đương mà tốn ít silicon hơn, hoặc vẫn giữ nguyên số silicon nhưng đem lại hiệu năng cao hơn.
Thực tế 384 / 400 = 96%, trong khi 4 / 5 = 80%. Nói cách khác về lý thuyết 384 SP VLIW4 sẽ mạnh hơn 400 SP VLIW5 ở mức 96% / 80% = 1,2 lần.
Turbo là thuật ngữ khá quen với các CPU x86: tính năng này cho phép các nhân x86 đạt được mức xung cao hơn so với mặc định trong trường hợp chạy các ứng dụng tận dụng kém kiến trúc đa nhân / luồng, nhờ tận dụng lượng điện "thừa" (TDP) nhằm "bồi dưỡng" các nhân xử lý nhiều. AMD gọi đấy là TurboCORE còn Intel là Turbo Boost. Với Trinity, AMD muốn áp dụng điều tương tự cho 384 SP VLIW4 kia.
Các game 3D ngày nay thường yêu cầu năng lực GPU hơn CPU. Do vậy AMD chủ động hạ xung các nhân x86 xuống (từ 2,7 còn 2,3 GHz) và chuyển nguồn điện thừa sang các nhân đồ hoạ, giúp tăng xung của chúng lên (từ 500 thành 685 MHz). Khoảng chênh lệch góp phần đáng kể cho năng lực đồ hoạ của Trinity, giúp nó vượt trội hơn đàn anh Llano.
Các tính năng khác
Ngoài việc cải thiện tốc độ xử lý, AMD còn kèm thêm một số công nghệ mới cho Trinity. Lợi ích từ chúng lại không thể hiện qua vài benchmark đã thấy ở bài trước nên tạm thời chúng ta chưa thấy rõ chúng.
Tiết kiệm điện hơn. Dù cùng dùng chung dây chuyền 32nm của GF, nhưng Trinity ở chế độ nghỉ (idle) chỉ ngốn 1,08W. Điều này giúp con chip mới trở thành mục tiêu lý tưởng cho các thiết kế ultrabook / ultrathin. Song thực tế có như vậy không sẽ phải chờ các sản phẩm chính thức ra mắt.
Bộ tăng tốc giải mã media mới. Việc dùng GPU để giải mã (decode) video thay CPU không còn gì lạ lẫm. Bằng cách decoder chuyên dụng, GPU làm việc này mượt mà hơn trong khi lại tiết kiệm điện hơn CPU (không có decoder). Hiển nhiên với Trinity, HD decoder là chi tiết không thể thiếu. Ngoài ra AMD còn bổ sung thêm cho nó một tính năng mới là Accelerated Video Converter (bộ tăng tốc chuyển đổi video). Tính năng này tương tự với QuickSync của Intel, cho phép tăng tốc đáng kể tốc độ chuyển đổi các định dạng phim.
AMD Eyefinity. Xuất tín hiệu ra 3 màn hình trở lên là một nét độc đáo cho các card đồ hoạ của AMD. Giờ đây thì tính năng này sẽ có trên Trinity. Nhờ áp dụng giao tiếp DisplayPort (DP) 1.2, giờ đây một chiếc laptop dùng Trinity sẽ có khả năng xuất tín hiệu cùng lúc ra 3 màn hình với chỉ 1 cổng cắm duy nhất (cần có adapter chia tín hiệu). Bạn có thể không cần đầu tư một chiếc desktop to lớn với card đồ hoạ rời mà chỉ cần làm việc trên chiếc lap thân yêu nhưng diện tích màn ảnh thì quá... hớp!
Sơ kết
Hiệu năng x86 cải thiện 25% so với Llano có thể chẳng nhằm nhò gì với IvB, thậm chí là SnB. Vì Intel hiện dẫn khá xa về mảng x86 so với AMD. Song với laptop, giờ đây ít ai cảm thấy sự cần thiết phải tăng sức mạnh CPU lên quá cao trong các tác vụ hàng ngày. Bù lại, nhu cầu đồ hoạ lên cao từ xem phim HD, chơi game 3D nhẹ nhàng, hoặc xử lý các nội dung flash khi lướt web. Việc có một GPU mạnh sẽ giúp cải thiện đáng kể tình trạng lag (giật) trong trải nghiệm của người dùng. Đây chính là nơi cho Trinity toả sáng.
Vậy Trinity có đáng mong đợi sau "lời hứa thật nhiều" BD? Câu trả lời là CÓ, nhưng có ở phạm vi một con chip phổ thông, không phải CPU cao cấp có thể lật đổ bất kỳ model nào có mặt trên thị trường.