Cực kỳ ấn tượng: AI của Google có thể thay bạn nói trôi chảy mọi loại ngoại ngữ, bằng giọng điệu của chính bạn!
Hệ thống mới cắt bỏ được nhiều bước nhiêu khê, cho phép dịch nhanh hơn và được một kết quả ấn tượng.
- Đi xe taxi tự lái của Google, hành khách sẽ được dùng WiFi và nghe nhạc miễn phí
- Google và Facebook đang hút hết chất xám khỏi châu Âu
- Không muốn dữ liệu người dùng bị Google, Facebook khai thác miễn phí, Nhật Bản ra mắt ngân hàng thông tin, chụp ảnh bữa ăn cũng nhận được thẻ quà tặng
- Google reCaptcha phiên bản mới: con dao hai lưỡi đối với người dùng
- Thích sự độc lạ, một gia đình tại Indonesia quyết định đặt tên con là “Google”
- Cái chết của nút Back trên Android Q gợi nhắc đến những gì Google đã từng làm khi "khai sinh" Android
Trước khi biết về công nghệ AI mới của Google, bạn hãy nghe kết quả dự án nghiên cứu trước.
Đây là một câu trong tiếng Tây Ban Nha.
Vẫn là câu đó, được dịch sang tiếng Anh bằng hệ thống thông thường của Google. Các hệ thống dịch thuật khác cũng sẽ có kết quả tương tự, chỉ là giọng khác nhau thôi.
Dịch sang tiếng Anh, câu này có nghĩa là: “Tôi tự hỏi mình cảm thấy sao, và đó là lúc tôi bắt đầu khóc”.
Đây là câu nói nguyên bản được dịch sang tiếng Anh, thông qua hệ thống dịch tự động mới. Nội dung câu nói giờ đã khác: "Larry hỏi tôi cảm thấy thế nào, và đó là lúc tôi bắt đầu khóc".
Kết quả chưa hoàn hảo, nhưng bạn có thể thấy ngữ điệu, âm sắc trầm bổng trong câu nói được giữ lại phần nhiều. Đây là hệ thống dịch lập tức mới của Google, có thể cho phép người dùng giữ lại chính giọng nói đó.
Đây chính là điểm khác biệt giữa hai hệ thống dịch thuật giọng nói cũ và mới. Trước thời điểm này, mọi câu nói đều được chuyển hóa thành dạng text, được dịch lại thành ngôn ngữ yêu cầu và được đọc lại bằng giọng nói máy móc. Việc này khiến cho ngữ điệu bị mất trong quá trình phiên dịch.
Hệ thống mới, được đặt cho cái tên Translatotron, bao gồm 3 thành phần; cả ba sẽ đều tập trung vào ảnh phổ - hình ảnh đại diện cho một phổ nhất định, rồi thực hiện ba công việc khác nhau.
Phần đầu tiên sẽ sử dụng mạng neural đã được huấn luyện phân tích phổ âm thanh, để tạo ra một phổ âm thanh của ngôn ngữ đầu ra.
Phần thứ hai sẽ chuyển phổ đó thành một sóng âm thanh có thể nghe được.
Phần thứ ba sẽ tách riêng những nét đặc trưng trong giọng nói nguyên bản, để gắn vào đoạn âm thanh cuối cùng.
Cách thức mới không chỉ giữ nguyên được những ngữ điệu (trong nhiều trường hợp là cả hàm ý) người nói trong sản phẩm cuối cùng, trên lyus thuyết, nó còn giảm được lỗi khi cắt bớt được những bước không cần thiết trong các hệ thống dịch thuật cũ.
Translatotron mới chỉ là sản phẩm mẫu mang tính chất chứng minh hệ thống hoạt động được. Trong quá trình thử, các nhà nghiên cứu mới chỉ tập trung vào dịch tiếng Tây Ban Nha sang tiếng Anh, “mới chỉ” có thế mà đã cần tới lượng dữ liệu huấn luyện AI khổng lồ. Nhưng nó hé cảnh cửa hẹp cho ta thấy tương lai có thể sẽ ra sao.
Bạn có thể nghe thêm các ví dụ khác theo đường link này.
NỔI BẬT TRANG CHỦ
Sự thật từ nghiên cứu khoa học: Chơi trò chơi điện tử có ảnh hưởng bất ngờ đến chỉ số IQ của trẻ em!
Trò chơi điện tử từ lâu đã là chủ đề gây tranh cãi khi nhắc đến ảnh hưởng của chúng đối với trẻ em. Trong khi nhiều ý kiến chỉ trích việc chơi game có thể gây hại cho sự phát triển trí não, thì một nghiên cứu khoa học đã mang đến cái nhìn khác biệt, cho thấy mối liên hệ tích cực giữa việc chơi game và sự gia tăng trí thông minh ở trẻ nhỏ.
Những tiểu tiết bạn có thể đã bỏ qua trong trailer The Witcher 4