Facebook đang nắm trong tay phương thức dịch thuật chuẩn xác và nhanh hơn 9 lần các đối thủ của mình

    Tuấn Hưng,  

    Thế nhưng phải mất một thời gian nữa nó mới có thể áp dụng vào những sản phẩm của họ.

    Dịch thuật đã trở thành một trong những ứng dụng quan trọng bậc nhất của hệ thống AI nhà Facebook. Bởi mục tiêu sau cuối của mạng xã hội này là “làm thế giới cởi mở và liên kết với nhau nhiều hơn” mà, vì vậy rào cản về mặt ngôn ngữ chắc chắn là một chướng ngại vật.

    Để vượt qua thử thách nói trên, hôm nay Facebook đã chính thức giới thiệu một phương thức dịch thuật nhờ sử dụng machine learning, và tốc độ “đọc hiểu” của nó sẽ nhanh gấp 9 lần so với các đối thủ cùng lĩnh vực của mình.

    Sản phẩm này mới chỉ dừng lại ở giai đoạn nghiên cứu vào thời điểm hiện tại – điều này đồng nghĩa với việc phương thức này chưa được tích hợp vào bất kỳ ứng dụng nào của Facebook.Và mới đây kỹ sư nghiên cứu về trí tuệ nhân tạo của Facebook là Michael Auli và David Grangier chia sẻ với tờ The Verge rằng sẽ phải mất thêm một quãng thời gian khá dài nữa thì nó mới được đưa vào sử dụng.

    Mạng xã hội này vốn đã sử dụng AI để thực hiện vài công việc một cách tự động như dịch status (cập nhật trạng thái) sang ngôn ngữ khác, thế nhưng để đưa nó từ một thử nghiệm thành sản phẩm thực tế thì cần phải tra qua rất nhiều công đoạn.

    “Chúng tôi hiện đang tiến hành đàm phán với đội ngũ quản lý sản phẩm để giúp phương thức này hoạt động trơn tru, mượt mà trong môi trường của Facebook,” Grangier cho biết. “Có rất nhiều sự khác biệt khi chuyển từ thu thập và xử lý dữ liệu học thuật sang môi trường ngôn ngữ thực tế. Dữ liệu học thuật là thông tin kiểu mới, trong khi những cuộc trò chuyện trên Facebook lại thường thông tục, phổ biến hơn.” Facebook trước kia đã từng nhắc đến chuyện họ đang xây dựng một vốn từ lóng để khiến quá trình này trở nên đơn giản hơn.

    Auli và Grangier lại tỏ ra hết sức háo hức vì phương thức mà Facebook lựa chọn để tiếp cận với machine learning đang bắt đầu gặt hái được thành quả. Họ giải thích rằng, những cỗ máy dịch thuật sử dụng AI đều phải phụ thuộc vào Recurrent Neural Networks (RNNs – một mô hình Deep learning), thế nhưng phương thức mà họ mới nghiên cứu được lại tận dụng Convolutional Neural Networks (CNNs - là một trong những mô hình Deep Learning khác).

    RNNs phân tích dữ liệu theo chuỗi, nó đọc một câu từ trái sang phải, theo thứ tự đúng để có thể dịch được nghĩa theo kiểu từng từ một (word by word). CNNs thì lại khác, nó nghiên cứu nhiều phương diện của dữ liệu một cách liên tục – kỹ thuật tính toán này tương thích hơn rất nhiều với GPU phần cứng được sử dụng để huấn luyện những neural networks hiện đại. GPU ban đầu được thiết kế để xử lý hình ảnh trong trò chơi điện tử, và nó cũng thể hiện rất tốt trong việc thực hiện các phép tính nhỏ.

    Vì vậy việc chuyển sang sử dụng mô hình CNNs nghĩa là họ sẽ giải quyết dược vấn đề về câu tối nghĩa, Auli và Grangier cho biết, đồng thời phân tích câu cú và ngữ pháp ở mức độ cao hơn. “CNNs xây dựng một cấu trúc có logic hơn, có thể nói là ngang tầm với các nhà ngôn ngữ học, chứ không đơn thuần là dịch từng chữ rồi ghép chúng lại thành một câu,” Auli tiết lộ.

    Lý giải cho việc tại sao phương thức này lại không được sử dụng rộng rãi hơn, Grangier nhấn mạnh rằng cộng đồng nghiên cứu trí tuệ nhân tạo đã đổ rất nhiều công sức vào việc biến RNNs thành cỗ máy dịch thuật, vì vậy nhiều người muốn tiếp tục phát triển và cải thiện nó hơn là phải “đập đi xây lại” với CNNs. Ông nói rằng: “Câu trả lời ngắn gọn là người ta chưa đầu tư nhiều thời gian vào mô hình này, và chúng tôi đã phát triển ra một bước đột phá mới khiến cho CNNs trở nên tốt hơn.”

    Theo TheVerge

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ