Mô hình AI này có khả năng đọc hướng dẫn làm bánh và tạo ra sản phẩm hoàn thiện.
Một nhóm các nhà nghiên cứu MIT mới đây đã phát triển được một mô hình AI có khả năng đọc hướng dẫn và tạo ra sản phẩm hoàn thiện. Mô hình AI này có tính ứng dụng rất cao trong các lĩnh vực như xây dựng và robot làm việc nhà, thế nhưng nhóm nghiên cứu lại quyết định thử nghiệm bằng một việc mà có lẽ tất cả chúng ta đều yêu thích: làm bánh pizza.
PizzaGAN, mạng thần kinh mới nhất được tạo ra bởi các thiên tài tại Phòng thí nghiệm Khoa học máy tính và Trí tuệ nhân tạo (CSAIL) của MIT và Viện nghiên cứu Điện toán Qatar (QCRI), là một mạng nghịch cảnh với chức năng tạo ra hình ảnh của chiếc bánh pizza trước và sau khi được nướng.
Nếu bạn đang thắc mắc tại sao chỉ là hình ảnh, thì đó là bởi đây chỉ là thử nghiệm ban đầu mà thôi. Khi chúng ta nghe về những con robot có thể thay thế con người trong ngành công nghiệp thực phẩm, chúng ta thường hình dung ngay đến một cỗ máy của Boston Dynamics đang đi loanh quanh trong bếp, vung tay xào nấu, nướng bánh burger, chiên khoai tây, và kêu lên "Đã xong" khi hoàn thiện chiếc bánh, nhưng sự thật lại ít hào hứng hơn nhiều.
Trên thực tế, những nhà hàng như miêu tả ở trên sử dụng công nghệ "tự động hóa", không phải "trí tuệ nhân tạo". Những con robot làm bánh burger chẳng hề quan tâm trên tay nó là một cái bánh thực sự hay một quả bóng hockey. Nó không hiểu bánh burger là gì, hay liệu sản phẩm cuối cùng nên trông ra sao. Những cỗ máy đó có thể được mang vào nhà kho của Amazon để đảm nhận nhiệm vụ dán băng keo các kiện hàng cũng chẳng có vấn đề gì, bởi chúng không thông minh.
Ngược lại, thứ mà MIT và QCRI đã làm là tạo ra một mạng thần kinh có khả năng nhìn vào hình ảnh một chiếc bánh pizza, xác định loại bánh và các nguyên liệu cần thiết, sau đó nghiên cứu cách đặt các nguyên liệu đó thành từng lớp ra sao trước khi cho bánh vào lò. Nó hiểu - theo cách mà bất kỳ AI nào khác hiểu những thứ chúng được huấn luyện - quy trình làm pizza là như thế nào từ đầu tới khi hoàn thành.
Nhóm nghiên cứu đã đạt được kết quả tuyệt vời này thông qua phương thức sử dụng mô-đun đầy mới lạ. Họ phát triển AI với khả năng hình ảnh hóa bánh pizza dựa trên những nguyên liệu được thêm vào hoặc lấy ra. Bạn có thể đưa cho nó hình ảnh một chiếc bánh pizza đang được làm, và yêu cầu nó loại bỏ nấm và hành tây, nó sẽ tạo ra hình ảnh một chiếc bánh mới không có hai thứ đó.
Theo các nhà nghiên cứu: "Từ khía cạnh thị giác, mỗi bước hướng dẫn có thể được nhìn nhận như một cách nhằm thay đổi hình thức bên ngoài của món ăn bằng cách thêm vào các đối tượng bổ sung (ví dụ thêm một nguyên liệu) hay thay đổi hình thức của một món ăn đã có (ví dụ nấu một món ăn)".
Để robot hay máy móc có thể làm được pizza ở ngoài đời thực, nó sẽ phải hiểu pizza là gì. Và cho đến nay, con người chúng ta - dù là những người cực kỳ thông minh tại CSAIL và QCRI - lại làm tốt việc tái tạo lại hình ảnh món ăn trong robot hơn là nếm vị món ăn.
Ví dụ, Domino Pizza hiện đang thử nghiệm một giải pháp thị giác máy tính để giám sát mỗi chiếc pizza xuất ra khỏi lò, nhằm xác định xem chúng có trông đủ tốt theo tiêu chuẩn của công ty hay không. Những thứ như mật độ rắc topping, độ chín, và độ tròn của đế bánh có thể được đo đạc và đánh giá chất lượng bởi machine learning trong thời gian thực để đảm bảo khách hàng không phải trên tay những chiếc bánh lỗi.
Giải pháp của MIT và QCRI tích hợp công đoạn trước khi nấu và xác định phương thức xếp lớp bánh phù hợp để tạo ra một chiếc pizza thơm ngon, nịnh mắt. Ít nhất đó là trên lý thuyết - chúng ta vẫn còn nhiều năm nữa mới có thể có một giải pháp hoàn chỉnh sử dụng AI từ đầu đến cuối, từ chuẩn bị, nấu, và phục vụ pizza cho khách.
Tất nhiên, pizza không phải là thứ duy nhất robot có thể làm một khi nó đã hiểu về nguyên liệu, các bước thực hiện, và thành quả cuôi cùng nên trông ra sao. Các nhà nghiên cứu kết luận rằng mô hình AI đằng sau PizzaGAN có thể sẽ hữu dụng trong nhiều lĩnh vực khác.
"Dù chúng tôi mới chỉ đánh giá mô hình này trong việc làm pizza, chúng tôi tin một hướng tiếp cận tương tự có thể sẽ rất hứa hẹn trong việc làm các loại đồ ăn khác cũng xếp lớp như burgers, sandwich, salad... Ngoài thức ăn, mô hình của chúng tôi còn có thể ứng dụng vào các lĩnh vực khác như trợ lý mua sắm thời trang số, một lĩnh vực mà hoạt động chính là kết hợp nhiều lớp quần áo khác nhau".
Tham khảo: TheNextWeb
NỔI BẬT TRANG CHỦ
Nâng cấp lớn của iPhone 16 mà Apple không đề cập
Không rõ lý do tại sao Apple lại không "đả động" gì về nâng cấp này.
Samsung ra mắt điện thoại giá chỉ 2 triệu có thiết kế đẹp, dùng chip của Bphone A40, camera 50MP, pin 5.000mAh