Phát triển công nghệ giúp robot nhìn được thế giới như con người

    Tân Phan,  

    Đây là sẽ bước tiến mới của công nghệ để ứng dụng nó lên các xe tự hành.

    Một trong những điều khó khăn nhất trong việc "dạy" máy móc là làm thế nào để nó có thế nhìn đồ vật. Phần cứng của máy móc hiện tại chưa thể nào đáp ứng được điều này, vì nó đòi hỏi khả năng nhận diện, phân loại và sử dụng các đồ vật xung quanh. Tuy nhiên, các nhà nghiên cứu tại Đại học Cambridge đã phát triển hai công nghệ mới có thể giúp các robot có khả năng nhìn thực sự bằng cách "học sâu" (deep learning).

    Các nhà nghiên cứu đang tập trung phát triển những công nghệ này để nó có thể sử dụng cho xe ô tô không người lái, ngoài ra công nghệ này có thể hữu ích cho công nghệ tăng cường thực tế ảo (augmented reality) hay camera giám sát. Hai công nghệ này là SegNet và một hệ thống chưa được đặt tên.

    SegNet là một ứng dụng nhận dạng trong thời gian thực có thể nhận diện đối tượng một cách chính xác hơn cả các hệ thống radar tiên tiến nhất trên xe ô tô bán tự hành ngày nay. Nó có thể xác định nội dung hình ảnh quét được và phân loại các vật thể trong ảnh thành 12 loại khác nhau (đường, biển báo, người đi bộ, các tòa nhà, v.v...).

    Hệ thống này sẽ hoạt động trong gần như tất cả điều kiện ánh sáng, bao gồm cả ban đêm, và nhận diện hình ảnh theo thời gian thực. Mặc dù SegNet nhắm đến môi trường đô thị, nhưng nó cũng có khả năng nhận diện các vật thể ở vùng nông thôn và trong các điều kiện thời tiết khác nhau nhờ khả năng "học sâu".

    "Hệ thống này nhận biết vật thể trong hình ảnh rất tốt vì nó trải qua rất nhiều cuộc luyện tập. Tuy nhiên, có hàng tá thứ khác chúng tôi phải tinh chỉnh để khiến nó tốt hơn." Alex Kendall, một nghiên cứu sinh tại Khoa Kỹ thuật cho biết.

    Hệ thống này đã được "đào tạo" bởi 5000 hình ảnh đường phố khác nhau, Mỗi điểm ảnh trong hình đều được đánh dấu là vật thể gì để hệ thống tham khảo. SegNet sẽ "học" cách nhận ra những vật thể đó theo thời gian, và từ từ nó sẽ nhận diện hình ảnh mà không cần có đánh dấu. Hiện tại, hệ thống này đã được đăng tải trên trang web - người dùng có thể lên đó đăng một hình ảnh và xem những vật thể trong đó sẽ được nhận diện ra sao.

    Đi kèm Segnet là hệ thống nhận diện địa điểm qua những gì nó nhìn thấy trong camera. Nó chính xác hơn nhiều so với GPS và sẽ hoạt động ở bất kì môi trường nào, miễn là có camera ví dụ như trong nhà, trong đường hầm, v.v... Hiện tại hệ thống này có thể xác định được vị trí của camera trong hoặc ngoài toà nhà một cách chính xác. Bước đầu nó sẽ được sử dụng trên các robot; trong tương lai sẽ là xe tự động không người lái và thiết bị đeo thông minh.

    Tham khảo Gizmag

    Tin cùng chuyên mục
    Xem theo ngày