Trí tuệ nhân tạo (AI) mới của Baidu đã có thể nhái giọng người sau vài giây lắng nghe và học hỏi

    Thiên Long,  

    Mặc dù tiềm năng ứng dụng của AI (trí tuệ nhân tạo) có khả năng bắt chước giọng nói của con người rất lớn nhưng nếu không kiểm soát tốt, đây có thể là một mối nguy mới cho toàn bộ nhân loại.

    Gã khổng lồ tìm kiếm Baidu, Trung Quốc đã phát triển thành công một hệ thống trí tuệ nhân tạo (AI) có khả năng giả giọng nói chỉ sau vài giây lắng nghe.

    Trí tuệ nhân tạo (AI) mới của Baidu đã có thể nhái giọng người sau vài giây lắng nghe và học hỏi - Ảnh 1.

    Không chỉ có khả năng bắt chước giọng nói, AI ứng dụng mạng nơ-ron của Baidu thậm chí còn có thể thay đổi giọng nói theo giới tính và trọng âm.

    Hồi năm 2017, nhóm nghiên cứu Baidu Deep Voice từng giới thiệu AI Deep Voice 2 với khả năng bắt chước giọng nói của con người chỉ sau 30 phút lắng nghe âm thanh phát ra từ loa.

    Trong khi đó, Adobe cũng có Voco, một phần mềm âm thanh có khả năng bắt chước giọng nói với chỉ 20 phút lắng nghe. Thậm chí, một start-up có tên Lyrebird đã tạo ra ra được AI có thể bắt chước giọng nói chỉ sau 1 phút lắng nghe. Nhưng tất cả giờ đã thua AI của Baidu.

    Ưu điểm của AI thế hệ mới do Baidu phát triển là khả năng nhận diện và bắt chước giọng nói nhanh hơn rất nhiều lần so với các hệ thống khác. Nếu các hệ thống trên đều mất ít nhất từ 1 phút trở lên thì với AI của Baidu, mọi thứ chỉ mất khoảng vài giây.

    Tiềm năng ứng dụng AI mới của Baidu là rất lớn. Hãy thử tưởng tượng, bạn đang có chuyến công tác xa mà vẫn muốn đọc một câu chuyện thú vị cho bé con ở nhà nghe trước khi đi ngủ. Hệ thống AI sẽ giả giọng và thay bạn đọc lại câu chuyện đó cho đứa bé một cách chân thực nhất.

    Trí tuệ nhân tạo (AI) mới của Baidu đã có thể nhái giọng người sau vài giây lắng nghe và học hỏi - Ảnh 2.

    Hơn hết, AI có thể ứng dụng trong việc đào tạo trợ lý ảo thông minh và tích hợp trong nhiều dịch vụ dịch thuật nhờ khả năng giả giọng con người một cách tự nhiên.

    Mặc dù vậy nếu không biết cách kiểm soát, AI bắt chước giọng nói hoàn toàn có thể là công cụ phục vụ cho những mục đích xấu. Theo New Scientist, chương trình giả giọng thật đến nỗi đánh lừa được các hệ thống nhận diện giọng nói với độ chính xác lên tới 95%.

    Đây chắc chắn là một thông tin không tốt cũng không xấu trong bối cảnh thế giới đang diễn biến phức tạp. Dù được sinh ra với mục đích tốt nhưng nếu công nghệ không được kiểm soát có chừng mực, nó sẽ trở thành công cụ tiếp tay cho những kẻ xấu thực hiện hành vi bất hợp pháp.

    Tham khảo Wonderful Engineering

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ