AI của Google có khả năng tái tạo không gian 3D chỉ từ một vài bức ảnh đơn giản

    TVD,  

    Ứng dụng mới này của Deep Dream thực sự khiến nhiều người phải ngạc nhiên, khi nó có thể tái tạo một không gian 3D khá hoàn thiện dựa trên một vài bức ảnh đơn giản.

    Cách đây không lâu, chúng ta đã được xem những hình ảnh kỳ quái trong “giấc mơ” của hệ thống mạng máy tính mô phỏng hệ thần kinh Deep Dream do Google phát triển. Mặc dù việc định nghĩa các hình ảnh của AI chưa hoàn thiện, khiến cho những gì chúng ta thấy rất mơ hồ và khó hiểu. Nhưng mới đây các kỹ sư của Google đã thử nghiệm một ứng dụng khác của hệ thống máy tính này.

    Ứng dụng mới này của Deep Dream thực sự khiến nhiều người phải ngạc nhiên, khi nó có thể tái tạo một không gian 3D khá hoàn thiện dựa trên một vài bức ảnh đơn giản được chụp bằng Street View của Google.

    Nó nằm trong một dự án khác, do kỹ sư John Flynn và ba đồng nghiệp của ông tại Google chịu trách nhiệm. Nó được gọi là Deep Stereo, sử dụng khả năng của hệ thống AI của Google để tạo ra một môi trường 3D kỹ thuật số. Các hình ảnh được xây dựng liền mạch, mà bạn sẽ có thể tham quan không gian 3D này giống như một vị khách du lịch đang bước vào một viện bảo tàng.

    Trước đây cũng từng có những công nghệ tương tự, cho phép xây dựng một môi trường 3D kỹ thuật số. Tuy nhiên các công nghệ trước đó đều cần phải có các thông số chính xác, đặc biệt là chiều sâu của vật thể để có thể xây dựng được mô hình 3D.

    The Latest Google Algorithm Creates Video Based On a Few Still Images

    Điều đặc biệt của Deep Stereo chính là dữ liệu đầu vào chỉ là những bức ảnh 2D đơn giản. Kỹ sư máy tính John Flynn cho biết, hệ thống sẽ tính toán dựa trên 2 yếu tố từ các bức ảnh này. Một là độ sâu của các vật thể trong bức ảnh, hai là màu sắc và hình khối của các vật thể. Nó có thể tự dự đoán các dữ liệu đầu vào mà không cần chúng ta phải cung cấp đầy đủ các thông số như chiều sâu, kích thước v.v..

    Tất nhiên các hình ảnh 3D được mô phỏng không thể chi tiết và đầy đủ như thật. Đôi lúc bạn sẽ thấy các hình ảnh mờ đi, đó chính là những chi tiết bị thiếu và các kỹ sư đã chọn cách này để bù đắp. Nó giúp cho hình ảnh không bị biến dạng hay bị bóp méo, bức tranh tổng thể vẫn rất hoàn hảo.

    Nhóm dự án Deep Stereo cho biết ứng dụng của công nghệ này là rất rộng rãi, đặc biệt là trong ngành du lịch. Trong tương lai gần, nó có thể được tích hợp vào trong tính năng Street View, giúp mọi người có trải nghiệm chân thực nhất về những nơi mà mình chưa từng đặt chân đến.

    Tham khảo: Gizmodo

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ