Cuộc đua robot hình người chuyển từ phát triển mô hình sang thu thập dữ liệu thực tế máy thật
Báo cáo mới nhất chỉ ra tỷ lệ thành công của robot hình người giảm mạnh khi hoạt động thực tế. Để khắc phục điểm yếu này, toàn bộ ngành công nghiệp đang chuyển hướng mạnh mẽ từ việc tối ưu hóa mô hình sang cuộc đua thu thập dữ liệu.
- Giải mã bí ẩn về hiện tượng não loài chó teo nhỏ một nửa khi bị con người thuần hóa
- Cú sốc ngành pin toàn cầu: Phương Tây xây nhà máy nghìn tỷ rồi để không vì thiếu rác, Trung Quốc ung dung ôm trọn mỏ vàng
- Bí ẩn đội quân gấu mèo Canada: Hàng nghìn người bị dắt mũi bởi một trò đùa?
- Suýt mất trắng hàng trăm triệu USD: NASA giải cứu tàu Curiosity khỏi sự cố tồi tệ nhất trên Sao Hỏa
- Matt Damon đối đầu quái vật khổng lồ trong trailer mới đầy tham vọng của “The Odyssey”
Vào tháng 4 năm 2026, báo cáo do trung tâm HAI của đại học Stanford công bố đã vạch trần một thực tế phũ phàng về trí tuệ hiện thân.
Theo đó, tỷ lệ thành công của robot trong môi trường mô phỏng đạt tới 89.4%, nhưng khi bước vào không gian gia đình thực tế, con số này lao dốc không phanh xuống chỉ còn 12%. Khoảng cách 77% này đã trở thành điểm nghẽn lớn nhất, giải thích cho mọi động thái hiện tại của toàn ngành công nghiệp.

Báo cáo của đại học Stanford chỉ ra tỷ lệ thành công của robot hình người giảm mạnh tới 77% khi chuyển từ môi trường mô phỏng sang hoạt động thực tế.
Điển hình như Tesla, trong báo cáo tài chính quý 4 năm 2025, hãng đã thừa nhận nhiệm vụ hàng đầu của Optimus lúc này không phải là làm việc, mà là thu thập dữ liệu thông qua vận hành thực tế.
Tại Trung Quốc, kế hoạch 5 năm lần thứ 15 cũng chỉ rõ việc bố trí các thao trường huấn luyện trí tuệ hiện thân. Chỉ trong chưa đầy một năm, gần 30 thao trường như vậy đã và đang được xây dựng trên toàn quốc. Mọi nguồn lực từ chính sách, hạ tầng đến những gã khổng lồ công nghệ đều xoay quanh một mục tiêu duy nhất: lấp đầy khoảng trống 77% chết người kia.
Bước sang năm 2026, câu chuyện của ngành công nghiệp trí tuệ hiện thân đã hoàn toàn thay đổi. Tạp chí MIT Technology Review đã xếp dữ liệu robot hình người là một trong những mệnh đề quan trọng nhất của năm. Nếu các mô hình ngôn ngữ lớn học cách tạo ra văn bản nhờ khối lượng dữ liệu khổng lồ trên internet, thì robot hình người cũng cần dữ liệu vận động khổng lồ để học cách làm việc trong thế giới thực.
Thế nhưng, việc thu thập loại dữ liệu này khó khăn hơn nhiều. Ông Yao Maoqing, người sáng lập Zhiyuan và giám đốc điều hành Mifeng Technology, đã đưa ra một phép so sánh tại sự kiện hồi tháng 4. Trong khi mô hình GPT-5 sở hữu lượng dữ liệu huấn luyện tương đương khoảng 10 tỷ giờ, thì toàn bộ ngành công nghiệp trí tuệ hiện thân mới chỉ gom được vỏn vẹn 500.000 giờ dữ liệu chất lượng cao.
Ông Wang Song, giám đốc kỹ thuật của Leju, giải thích thêm rằng phần cứng và não phụ của robot đã dần hoàn thiện, nhưng bộ não chính lại đang đình trệ vì thiếu dữ liệu máy thật. Ông so sánh với hệ thống lái xe tự động cấp độ L4 vốn đã cần hàng triệu giờ dữ liệu, trong khi robot hình người phức tạp hơn từ 1 đến 2 bậc, đòi hỏi lượng dữ liệu từ vài triệu đến hàng chục triệu giờ.
Nhiều người đặt câu hỏi liệu có thể dùng môi trường mô phỏng để bù đắp hay không. Câu trả lời là không thể. Mô phỏng chỉ giỏi xử lý động lực học vật rắn, nhưng lại bất lực trước các tình huống tiếp xúc phong phú. Nó không thể tính toán chính xác sự biến dạng của linh kiện, ma sát phi tuyến tính hay đặc tính vật lý của các vật thể mềm như quần áo, chất lỏng. Một nghiên cứu năm 2025 chỉ ra rằng chỉ cần ánh sáng thay đổi, đồ vật bị dịch chuyển hay chiếc cốc nặng thêm 50 gram, mô hình mô phỏng có thể hoàn toàn thất bại.

Các quốc gia và tập đoàn công nghệ đang ồ ạt xây dựng các thao trường huấn luyện để giải quyết bài toán chi phí chế tạo và thu thập dữ liệu thực.
Thực tế tại Leju đã chứng minh sức mạnh của dữ liệu máy thật. Chỉ với 400 dữ liệu máy thật chất lượng cao, hiệu quả huấn luyện đã vượt xa 1.300 dữ liệu kém chất lượng. Thời gian lặp lại mô hình giảm từ 7 - 10 ngày xuống còn 2 - 3 ngày, tỷ lệ triển khai thiết bị thành công tăng từ mức dưới 60% lên hơn 90%. Hãng này cũng đã thương mại hóa thành công dữ liệu máy thật khi cung cấp dịch vụ cho các doanh nghiệp như FAW, Haichen Logistics và Zhaofeng.
Việc thu thập dữ liệu trực tiếp gặp vô vàn rào cản do chi phí chế tạo robot đắt đỏ và hao mòn cơ học. Do đó, các thao trường huấn luyện công cộng đang mọc lên nhanh chóng. Theo báo cáo từ Học viện công nghệ thông tin và truyền thông Trung Quốc phối hợp cùng đại học Thanh Hoa, gần 30 cơ sở đang được triển khai.
Trung tâm dữ liệu robot hình người Thạch Cảnh Sơn có thể sản xuất hơn 6 triệu dữ liệu mỗi năm, trong khi khu Trương Giang ở Thượng Hải hướng tới tập dữ liệu hàng chục triệu để phá vỡ thế ốc đảo dữ liệu giữa các phần cứng khác nhau.
Các doanh nghiệp hàng đầu đang lao vào cuộc đua này một cách quyết liệt. Leju đã tham gia xây dựng 10 thao trường trên toàn quốc, sản xuất 25 triệu dữ liệu máy thật mỗi năm. Bộ dữ liệu LET của hãng đã vượt mốc 1 triệu lượt tải xuống. Leju cũng hợp tác sâu rộng với các nhà phát triển mô hình, cung cấp hàng vạn giờ dữ liệu cho mô hình LingBot-VLA. Không chịu kém cạnh, Zhiyuan thành lập Mifeng Technology để giải quyết cơn khát dữ liệu, còn công ty Yushu dự kiến dành một nửa số vốn huy động được cho mảng mô hình và dữ liệu. Tập đoàn JD cũng đang rục rịch xây dựng trung tâm thu thập dữ liệu khổng lồ.
Ở quy mô toàn cầu, Tesla không ngừng thử nghiệm Optimus ngay trong các nhà máy của mình, còn Figure AI thì triển khai robot trực tiếp trên các dây chuyền sản xuất công nghiệp thực tế. Năm 2026 được định danh là năm giao hàng của trí tuệ hiện thân.
Mặc dù dữ liệu mô phỏng vẫn giữ vai trò nhất định trong giai đoạn đầu, nhưng giới chuyên môn đã đi đến thống nhất: để xóa bỏ khoảng cách 77%, ngành công nghiệp không thể chỉ dựa vào việc tăng kích thước mô hình, mà bắt buộc phải sở hữu dữ liệu máy thật đa dạng và chất lượng. Sự khan hiếm dữ liệu hiện tại chính là nút thắt lớn nhất, nhưng cũng là cơ hội vàng cho bất kỳ ai muốn thống trị kỷ nguyên robot hình người sắp tới.
NỔI BẬT TRANG CHỦ
-
Một startup AI tuyên bố tiến lên mô hình “thuần AI”, bước đầu tiên là sa thải 25% nhân sự
Một startup AI vừa sa thải 25% nhân sự để trở thành công ty “thuần AI”, dấu hiệu cho thấy làn sóng AI thay thế con người có thể đang bước sang giai đoạn mới.
-
"Thánh leak" @evleaks nghỉ hưu sau 14 năm: Không đủ tiền mua thuốc điều trị bệnh mãn tính