Siêu máy tính AI nhỏ nhất thế giới biến PC 14 năm tuổi thành cỗ máy ChatGPT chạy ngoại tuyến
Một màn trình diễn gây chấn động cho thấy trí tuệ nhân tạo quy mô lớn không còn là đặc quyền của trung tâm dữ liệu. Với Pocket Lab của Tiiny AI, một chiếc PC 14 năm tuổi vẫn có thể chạy mượt mô hình 120 tỷ tham số hoàn toàn ngoại tuyến.
- Sống hơn một thế kỷ, không lão hóa và nghịch lý sinh tồn của loài cá cổ đại Bắc Mỹ đang bị lãng quên
- Đây là robot chăm sóc răng miệng đầu tiên trên thế giới tự động chải răng cho bạn
- Sự thật rùng mình về "cân bằng nhiệt": Không phải cái chết, mà là sự khởi đầu của một "Vũ trụ 2.0" do chính con người kiến tạo?
- Giải mã cơ thể người dưới lăng kính Tô-pô học: Cuộc tranh luận toán học kỳ lạ về việc chúng ta thực sự có bao nhiêu cái lỗ?
- Siberia: Kho báu 13 triệu km vuông chôn vùi dưới băng giá và nghịch lý 'ngồi trên đống vàng nhưng không thể tiêu'
Trong nhiều năm, trí tuệ nhân tạo quy mô lớn được xem là sân chơi dành riêng cho các trung tâm dữ liệu khổng lồ, nơi những cụm GPU tiêu thụ hàng trăm kilowatt điện ngày đêm để duy trì hoạt động.
Tuy nhiên, một màn trình diễn mới đây của startup Mỹ Tiiny AI đang thách thức trực diện quan niệm đó, khi biến một chiếc máy tính cá nhân 14 năm tuổi thành cỗ máy chạy ChatGPT hoàn chỉnh, không cần Internet.
Buổi demo được Tiiny AI ghi lại trong một cú máy duy nhất, không cắt dựng, cho thấy mô hình GPT-OSS 120B của OpenAI vận hành trên Pocket Lab, một siêu máy tính cá nhân do công ty phát triển. Điều đáng chú ý là Pocket Lab không thay thế chiếc PC cũ, mà đóng vai trò như “bộ não AI” gắn ngoài, cho phép phần cứng lỗi thời thực hiện những tác vụ mà trước đây được cho là bất khả thi.
Theo Tiiny AI, Pocket Lab hướng tới mục tiêu đưa trí tuệ nhân tạo cấp độ đám mây đến với mọi người, không phụ thuộc vào hạ tầng mạng, dịch vụ cloud hay việc nâng cấp GPU đắt đỏ. Sau khi ra mắt vào ngày 10 tháng 12, thiết bị này đã được ghi nhận là miniPC nhỏ nhất có khả năng chạy mô hình ngôn ngữ lớn trên 100 tỷ tham số ở chế độ cục bộ.
Trong thí nghiệm, nhóm nghiên cứu sử dụng một chiếc PC sản xuất năm 2011, trang bị bộ xử lý Intel Core i3-530, 2GB RAM DDR3 và màn hình CRT. Đây là cấu hình vốn chỉ phù hợp cho các tác vụ văn phòng cơ bản. Tuy nhiên, sau khi kết nối với Pocket Lab, hệ thống đã vận hành ChatGPT thành công với tốc độ trung bình khoảng 20 token mỗi giây.
Buổi trình diễn tập trung vào các bài toán suy luận và phân tích. Mô hình trả lời câu hỏi “Bạn là ai?” và sau đó là câu hỏi “Vì sao 1 1=2”, với phần giải thích chi tiết, liền mạch. Riêng câu trả lời thứ hai sử dụng tới 1.582 token, đạt tốc độ xử lý 18,6 token mỗi giây, một con số đáng chú ý trong bối cảnh toàn bộ quá trình diễn ra hoàn toàn ngoại tuyến.
Ông Samar Bhoj, Giám đốc GTM của Tiiny AI, cho biết màn trình diễn này đã phá vỡ một giả định lâu nay của ngành công nghiệp AI. Theo ông, việc chạy mô hình lớn không còn đòi hỏi các cụm GPU khổng lồ hay hạ tầng đám mây phức tạp. Với Pocket Lab, AI tiên tiến có thể hoạt động riêng tư, ngoại tuyến và ngay trên những phần cứng phổ thông, kể cả máy tính đã 14 năm tuổi.
Cốt lõi của Pocket Lab nằm ở hai công nghệ độc quyền mang tên TurboSparse và PowerInfer. TurboSparse giúp tăng hiệu quả tính toán bằng cách chỉ kích hoạt các nơ-ron cần thiết, thay vì toàn bộ mô hình, mà không làm suy giảm năng lực suy luận. Trong khi đó, PowerInfer phân bổ khối lượng công việc giữa CPU và NPU, giúp tối ưu hiệu năng và giảm đáng kể mức tiêu thụ điện so với các hệ thống AI truyền thống dựa trên GPU.
Về mặt phần cứng, Pocket Lab sở hữu CPU ARMv9.2 12 nhân, 80GB bộ nhớ LPDDR5X và ổ SSD 1TB, tất cả được đóng gói trong một thiết bị nặng khoảng 300 gram. Dù nhỏ gọn, cấu hình này đủ để chạy nhiều mô hình mã nguồn mở phổ biến như Llama, Qwen, DeepSeek, Mistral, Phi và GPT-OSS.
Tiiny AI định vị Pocket Lab là nền tảng AI cá nhân, phục vụ nhà sáng tạo nội dung, lập trình viên, nhà nghiên cứu, sinh viên và các chuyên gia cần xử lý dữ liệu nhạy cảm. Thiết bị hỗ trợ suy luận nhiều bước, hiểu ngữ cảnh sâu, vận hành các quy trình tác nhân AI và tạo nội dung mà không cần kết nối mạng.
Một điểm nhấn khác là yếu tố bảo mật. Dữ liệu người dùng, tài liệu và sở thích đều được lưu trữ cục bộ với mã hóa đạt chuẩn ngân hàng, mang lại mức độ riêng tư cao hơn đáng kể so với các hệ thống AI dựa trên đám mây.
Màn trình diễn của Tiiny AI cho thấy một viễn cảnh khác cho tương lai của trí tuệ nhân tạo, nơi sức mạnh tính toán không còn tập trung trong các trung tâm dữ liệu khổng lồ, mà được phân tán về thiết bị cá nhân. Trong bối cảnh AI ngày càng gắn chặt với đời sống, khả năng đưa những mô hình khổng lồ về chạy trên phần cứng phổ thông có thể là bước ngoặt lớn, không chỉ về công nghệ, mà còn về cách con người kiểm soát và sở hữu trí tuệ nhân tạo.
NỔI BẬT TRANG CHỦ
-
Người người vibe code, nhà nhà vibe code: Cậu bé 13 tuổi cùng chị gái tuổi teen thức trắng 24 giờ thi hackathon AI tại Singapore nhờ vibe coding
Từ một buổi học thử của người cha, cả gia đình cùng bước vào thế giới vibe coding, xây dựng ứng dụng AI và tranh tài tại hackathon 24 giờ của Cursor ở Singapore.
-
Nhu cầu H200 từ Trung Quốc tăng cao ngoài dự kiến, NVIDIA hối thúc TSMC tăng tốc sản xuất