Robot hình người NEO tự học kỹ năng nhờ xem video, mở ra viễn cảnh robot biết tự dạy cho nhau

Đức Khương, Thanh Niên Việt 

Mô hình World Model mới của 1X cho phép robot hình người NEO học nhiệm vụ trực tiếp từ video trên internet, chuyển yêu cầu ngôn ngữ thành hành động vật lý và thích nghi với môi trường chưa từng gặp, đánh dấu bước tiến đáng chú ý trong nỗ lực đưa trí tuệ nhân tạo từ thế giới số bước vào đời sống thực.

Công ty công nghệ 1X vừa công bố một bản cập nhật trí tuệ nhân tạo quan trọng dành cho robot hình người NEO, với việc giới thiệu hệ thống mang tên 1X World Model. Theo mô tả của hãng, đây không chỉ là một cải tiến phần mềm thông thường, mà là nỗ lực nhằm giải quyết một trong những thách thức lớn nhất của robot hình người hiện nay: làm thế nào để chuyển hóa trí tuệ số thành hành động vật lý linh hoạt và đáng tin cậy trong thế giới thực.

Trọng tâm của World Model là một mô hình trí tuệ nhân tạo dựa trên video, được huấn luyện để hiểu cách con người tương tác với đồ vật và môi trường xung quanh. Thay vì phải dựa hoàn toàn vào các hành vi được lập trình sẵn hoặc khối lượng lớn dữ liệu do con người điều khiển robot thu thập, NEO giờ đây có thể học trực tiếp từ video quy mô internet và áp dụng kiến thức đó vào các tình huống thực tế.

Robot hình người NEO tự học kỹ năng nhờ xem video, mở ra viễn cảnh robot biết tự dạy cho nhau- Ảnh 1.

Theo 1X, cách tiếp cận này giúp robot vượt qua hạn chế lâu nay của ngành robot hình người, nơi các hệ thống thường tỏ ra hiệu quả trong môi trường phòng thí nghiệm nhưng gặp khó khăn khi bước ra không gian đời sống phức tạp và khó dự đoán. Bằng việc học từ video ghi lại hành vi của con người, NEO có khả năng khái quát hóa, tức là áp dụng kiến thức đã học vào những nhiệm vụ và môi trường mà nó chưa từng gặp trước đó.

Một điểm đáng chú ý của World Model là khả năng chuyển yêu cầu ngôn ngữ thành hành động. Người dùng chỉ cần đưa ra một chỉ dẫn ngắn, bằng giọng nói hoặc văn bản, NEO sẽ sử dụng hệ thống camera để phân tích bối cảnh, tạo ra các dự đoán trực quan về chuỗi hành động cần thực hiện, sau đó chuyển những dự đoán này thành chuyển động chính xác thông qua mô hình động lực học nghịch.

Ông Bernt Børnich, giám đốc điều hành kiêm nhà sáng lập 1X, cho biết sau nhiều năm phát triển World Model và hoàn thiện thiết kế hình thể của NEO để gần với con người nhất có thể, robot giờ đây đã sẵn sàng học hỏi trực tiếp từ kho kiến thức khổng lồ trên internet. Theo ông, khả năng biến bất kỳ yêu cầu nào thành hành động mới, ngay cả khi không có ví dụ huấn luyện trước, đánh dấu điểm khởi đầu cho năng lực tự học thực sự của robot hình người.

Trong video trình diễn được 1X công bố, NEO được cho thấy thực hiện những công việc quen thuộc trong đời sống hàng ngày, như đóng gói hộp cơm trưa. Ngay cả khi hình dạng và vị trí của đồ vật khác với những gì robot từng gặp, NEO vẫn có thể lập kế hoạch và hoàn thành nhiệm vụ một cách mạch lạc, cho thấy khả năng thích nghi với biến đổi của môi trường.

Đáng chú ý hơn, robot còn thực hiện được nhiều hành động hoàn toàn mới mà không có dữ liệu huấn luyện trước. Các ví dụ được đưa ra bao gồm mở cửa trượt, nâng nắp bồn cầu, là quần áo và chải tóc cho con người. Theo 1X, đây là minh chứng cho việc kiến thức tổng quát của con người, được ghi lại trong video, có thể được chuyển hóa thành hành vi robot một cách hiệu quả.

Robot hình người NEO tự học kỹ năng nhờ xem video, mở ra viễn cảnh robot biết tự dạy cho nhau- Ảnh 2.

Ông Daniel Ho, nhà nghiên cứu AI tại 1X, cho rằng với World Model, bất kỳ yêu cầu nào cũng có thể trở thành một hành động robot hoàn toàn tự chủ, ngay cả khi NEO chưa từng nhìn thấy đồ vật hay nhiệm vụ đó trước đây. Điều này mở ra khả năng ứng dụng rộng hơn cho robot hình người trong môi trường gia đình và dịch vụ.

Không chỉ tập trung vào việc học từng nhiệm vụ riêng lẻ, World Model còn thay đổi cách NEO cải thiện năng lực theo thời gian. Thay vì phụ thuộc nặng nề vào dữ liệu do con người vận hành, vốn tốn kém và chậm chạp, NEO có thể tự thu thập dữ liệu khi tương tác với thế giới, tạo ra một vòng lặp học tập tự củng cố.

Cách tiếp cận này cũng giúp robot hưởng lợi trực tiếp từ những tiến bộ chung của lĩnh vực AI video. Khi các mô hình hiểu video ngày càng chính xác và giàu ngữ cảnh hơn, năng lực của NEO trong thế giới vật lý cũng được nâng cao tương ứng.

Một trọng tâm khác của World Model là khả năng duy trì sự ổn định trong môi trường gia đình, vốn đầy biến động với ánh sáng thay đổi, đồ đạc lộn xộn và con người di chuyển liên tục. 1X cho biết hệ thống mới giúp NEO tạo ra các hành động đáng tin cậy ngay cả khi điều kiện xung quanh thay đổi nhanh chóng.

Hiện tại, robot hình người NEO đã được 1X mở bán thông qua cửa hàng trực tuyến, với gói tiếp cận sớm có giá 20.000 USD và kế hoạch giao hàng ưu tiên vào năm 2026, kèm theo tùy chọn thuê bao 499 USD mỗi tháng. Dù còn cần thêm thời gian để kiểm chứng trong thực tế, World Model đang cho thấy một hướng đi mới, nơi robot hình người không chỉ thực hiện lệnh, mà còn có thể tự học và thích nghi như một thực thể thông minh trong thế giới của con người.

https://genk.vn/robot-hinh-nguoi-neo-tu-hoc-ky-nang-nho-xem-video-mo-ra-vien-canh-robot-biet-tu-day-cho-nhau-165261501092518653.chn
Tin cùng chuyên mục
Xem theo ngày

NỔI BẬT TRANG CHỦ