Gần đây, NVidia đã thông báo chip của hãng đang hỗ trợ siêu máy tính
Tianhe-1A của Trung Quốc đạt được 2.507 petaflops, vượt qua hệ thống của Mĩ đang giữ vị trí đầu trong danh sách những cỗ máy nhanh nhất thế giới tháng 6/2010.
Tianhe-1A là thiết kế lai duy nhất sử dụng khoảng 7.000 chip đồ họa NVidia cùng 14.000 CPU Intel Xeon. Các chip đồ họa tăng cường thêm hiệu suất hệ thống, giúp nó chiếm vị trí dẫn đầu hàng ngũ những siêu máy tính hiện tại.
Dưới đây là những câu hỏi đặt ra và được trả lời bởi Jack Dongarra, một giáo sư khoa Cơ Khí Điện Tử và Khoa Học Máy Tính Đại học Tennessee, đồng thời là thành viên trong dự án về siêu máy tính giữa Đại học Tennessee, Phòng thí nghiệm quốc gia Oak Ridge và Viện công nghệ Georgia. Ngoài ra, Oak Ridge hiện đang là nơi đặt cỗ máy được biết đến dưới tên "Jaguar" từng đứng đầu trong danh sách top 500 tháng 6 vừa qua.
Oak Ridge có hệ thống nào tương tự như hệ thống lai của Trung Quốc không?
Oak Ridge có một phiên bản nhỏ của một máy lai. Máy được mua lại nhờ khoản tài trợ từ Quỹ Khoa học Quốc gia. Việc mua bán diễn ra còn nhờ ngân sách Phòng thí nghiệm quốc gia Oak Ridge, Đại học Tennessee, và Georgia Tech. Nhưng hệ thống này nhỏ hơn rất nhiều so với hệ thống của Trung Quốc, nó vẫn đang được lắp đặt và kiểm tra tại Oak Ridge. Có khoảng 120 node trong hệ thống, mỗi node bao gồm 2 chip Intel Westmere và 3 bảng Nvidia Fermi.
Điều gì khiến cho cỗ máy của Trung Quốc nhanh đến vậy?
Người Trung Quốc tự thiết kế kết nối riêng của họ. Máy tính của Trung Quốc không phải hàng mua về, mà dựa trên các chip, dựa trên một bộ định tuyến, dựa trên một switch do chính họ sản xuất.
Có phải đó là bí quyết thành công của họ?
Cũng tương tự như Cray. Đóng góp của Cray bên cạnh việc tích hợp và phần mềm là mạng kết nối. Cray có một kết nối rất nhanh giúp cho máy hoạt động tốt. Mặc dù dự án của Trung Quốc dựa trên bộ vi xử lý của Mỹ, nó lại sử dụng loại kết nối của Trung Quốc. Đấy là phần thú vị. Họ đã đặt vài thứ với nhau tạo ra băng thông gần gấp đôi băng thông của kết nối InfiniBand (kết nối được sử dụng rộng rãi tại Mỹ).
Liệu hệ thống của Trung Quốc có thực sự đạt được vị trí số 1 trong danh sách Top500 vào tháng 11 tới?
Có. Tôi đã thấy cỗ máy đó. Tôi nhìn thấy kết quả. Đó là sự thực.
Tại sao Oak Ridge không làm những gì người Trung Quốc đang làm?
Oak Ridge không có khả năng hoặc công nghệ để phát triển kết nối hoặc router. Chúng tôi không sản xuất máy tính. Chúng tôi mua và sử dụng máy tính. Phạm vi và nhiệm vụ của chúng tôi không nằm trong chuyên ngành thiết kế máy tính.
Vậy ông có lời khuyên gì?
Hãy nhớ rằng bạn không chỉ đầu tư vào phần cứng. Cũng giống như xe đua vậy. Muốn chạy một chiếc xe đua, cần phải có người lái. Cần sử dụng cỗ máy một cách hiệu quả. Chúng ta cần đầu tư ở nhiều mức khác nhau trong môi trường siêu máy tính. Môi trường đấy được tạo ra từ các phần cứng, hệ điều hành, trình biên dịch, các ứng dụng, các thư viện số... Cần phải duy trì đầu tư trên toàn bộ phần mềm để sử dụng hiệu quả phần cứng. Đó là một khía cạnh mà đôi khi chúng ta quên đi.
Thiếu vốn đầu tư, bỏ tiền cho phần cứng nhưng chúng ta lại không bỏ tiền cho các thành phần khác. Hệ thống máy có xu hướng bị phá vỡ cân bằng, vì phần cứng vượt xa những gì phần mềm có thể phát triển được. Chúng ta có các máy tính có thể chạy song song nhiều ứng dụng. Nhưng cách lập trình lại quá thô.