Thảm họa từ các công cụ dịch online - lối đi nào cho công nghệ dịch thuật thế hệ mới?

    Ngocmiz,  

    Công nghệ dịch thuật hiện nay đã tiến một bước dài và có thể cung cấp các đoạn dịch ở chất lượng tương đối tốt, nhưng chúng ta vẫn cần thứ gì đó thực sự có thể nói cùng một ngôn ngữ với người dùng với sự tinh tế và linh hoạt ở mức cao.

    Hãy tưởng tượng bạn cần làm việc hay giao tiếp với người nước ngoài bằng một thứ tiếng bạn không mấy thông thạo và cần tới sự trợ giúp của các ứng dụng, công cụ dịch tự động trên mạng. Ngoài sự tiện ích, các công cụ này cũng không ít lần gây ra những sự cố dở khóc dở cười cho người dùng.

    Dưới đây là một số ví dụ thật về những thảm họa dịch thuật gây ra bởi các công cụ dịch tự động và cũng là lời cảnh báo cho các công ty vận hành các công cụ này trước nguy cơ gây hiểu lầm và “tai nạn” cho người dùng.

    Bảng hiệu này được dịch tự động từ tiếng Hindi nhưng khi chuyển sang tiếng Anh lại biến thành “Ăn thảm bị cấm ở đây”.

    Mặc dù các công ty thiết kế công cụ dịch thuật vẫn luôn hứa hẹn công nghệ machine learning và ngôn ngữ tự nhiên sẽ sớm trở nên hoàn hảo, dịch thuật tức thời sẽ sớm trở thành hiện thực.

    Thế nhưng khi nào chúng ta mới được chứng kiến điều đó?

    Khi thảm họa xảy ra

    Tháng 1 vừa qua, Skype cho ra mắt phần mềm dịch real-time cho phép dịch tức thời cả giọng nói ra 7 ngôn ngữ khác nhau.

    Thế nhưng công nghệ cao cũng không phải không có mặt trái của nó, và một số lần thậm chí còn biến nhiều từ tiếng Anh thành những từ tục tĩu, xúc phạm trong tiếng Trung.

    Nhiếp ảnh gia Tom Carter trong một cuộc hồi thoại Skype thương lượng với người Trung Quốc đã sử dụng phần mềm này để nói chuyện với họ bằng tiếng Trung.

    Thế nhưng khi anh nói “Rất vui được nói chuyện với anh”, Skype tự động dịch ra thành một câu gồm nhiều từ tục tĩu và chửi thề. Một phần nguyên nhân của sự cố này còn liên quan đến Great Firewall – công cụ kiểm duyệt website mà chính phủ Trung Quốc sử dụng đã làm gián đoạn cuộc hội thoại.

    Mạng thần kinh nhân tạo

     Mạng thần kinh nhân tạo có thể mô phỏng cách thức hoạt động của não người

    Mạng thần kinh nhân tạo có thể mô phỏng cách thức hoạt động của não người

    Các chương trình dịch thuật, bao gồm cả Google Translate được xây dựng dựa trên các thuật toán dịch theo cụm từ.

    Hệ thống này hoạt động bằng cách phân tích các đoạn chữ đã được dịch trước đây – ví dụ như trong các bài viết học thuật hay các bảng thuật ngữ. Nó sẽ phân tích chúng song song giữa ngôn ngữ gốc (ngôn ngữ cần dịch) và ngôn ngữ đích (ngôn ngữ được dịch sang) rồi sử dụng các ngữ nghĩa tổng hợp được lựa chọn lấy một cách dịch phù hợp nhất.

    Chính vì vậy mà độ hiệu quả của hệ thống này phụ thuộc khá nhiều vào các văn bản được nó tổng hợp, phân tích. Công cụ dịch tự động cũng thường cho ra ngôn ngữ máy móc, thiếu tự nhiên và liền mạch.

    Cũng vì lý do này mà Alan Packer, giám đốc mảng công nghệ ngôn ngữ của Facebook cho biết gần đây, các cỗ máy dịch thuật bằng tổng hợp, thống kê như vậy đang dần tiến tới điểm kết của mình.

    Thay vào đó, công nghệ dịch thuật nay đã chuyển sang hướng sử dụng hệ thần kinh nhân tạo. Các hệ thần kinh nhân tạo này có cấu trúc tương tự với não người và sử dụng các thuật toán phức tạp để lựa chọn và quyết định cách dịch phù hợp.

    Thế nhưng tiên tiến hơn công nghệ thống kê trước đây, hệ thần kinh nhân tạo có thể học được cả các đoạn ẩn dụ và ý nghĩa đằng sau ngôn từ nên có thể lựa chọn cách dịch tương đồng với cách con người quốc gia đó hay diễn đạt, có lồng ghép yếu tố văn hóa chứ không phải chỉ dịch nguyên ngôn từ một cách cứng nhắc và thô thiển.

    Với hơn 2 tỷ lượt dịch 40 ngôn ngữ khác nhau mỗi ngày từ người dùng, Facebook cũng đang dự kiến tung ra một hệ thống như vậy vào cuối năm nay.

    Google cũng không hề kém cạnh với 103 ngôn ngữ, phủ sóng tới 99% cư dân mạng toàn cầu và cũng thông báo đang tích cực chuyển công nghệ dịch thuật trước đây sang hệ thần kinh nhân tạo.

    Tuy nhiên, công ty cũng chưa đưa ra thông báo chính thức nào về việc khi nào thì việc chuyển giao này sẽ được hoàn thành.

    Những vấn đề phức tạp

    Trước khi bạn khấp khởi hy vọng về sự hoàn hảo của dịch tự động thì có lẽ bạn nên cân nhắc lại một chút.

    Giáo sư Phillipp Koehn dạy chuyên ngành khoa học máy tính và là một chuyên gia về công nghệ dịch thuật tại ĐH Edinburgh, Anh cho biết: “Vẫn còn rất nhiều vấn đề phức tạp với ngữ nghĩa và kiến thức cần được giải quyết, và chúng ta vẫn chưa chạm gần được đến mức giải quyết được chúng.”

    Thách thức lớn nhất là khi lượng thông tin bằng ngôn ngữ gốc không đủ để hệ thống “học” và dịch được sang ngôn ngữ đích một cách hoàn chỉnh.

    Ví dụ như tiếng Trung không có danh từ số nhiều, thời động từ hay đại từ như trong tiếng Anh, khiến cho việc dịch gặp rất nhiều khó khăn. Tiếng Anh cũng không có giới tính đực cái cho các danh từ như trong tiếng Pháp, Ý hay Đức, nên việc chuyển ngữ cũng không hề đơn giản.

    Sự tinh tế như con người

    Cho đến khi các thách thức trên được giải quyết, tình trạng dịch sai vẫn sẽ còn tiếp diễn, và những câu văn vô nghĩa và hài hước vẫn sẽ còn xuất hiện.

     Liệu máy móc có thể có được khả năng diễn đạt linh hoạt như con người?

    Liệu máy móc có thể có được khả năng diễn đạt linh hoạt như con người?

    Mặc dù công nghệ dịch thuật đã được nâng cấp nhanh chóng trong những năm gần nhau nhưng cái giá của việc dịch sai cũng không hề nhỏ chút nào. Chính vì vậy mà nhiều doanh nghiệp vẫn chưa sẵn sàng tin tưởng sử dụng các công cụ dịch thuật hiện nay.

    Clem Chambers là CEO của ADVFN, một website thông tin về các loại cổ phiếu tai hơn 70 sàn chứng khoán trên toàn thế giới. Chambers cho biết “Đối với chúng tôi, mỗi khi cần tạo một website hay nội dung cho các thị trường mục tiêu nào đó, không gì hoàn hảo hơn việc sử dụng một người bản xứ với vốn biết sâu sắc về cách diễn đạt cũng như về thị trường tài chính các nước.

    Công nghệ dịch thuật hiện nay đã tiến một bước dài và có thể cung cấp các đoạn dịch ở chất lượng tương đối tốt, nhưng chúng ta vẫn cần thứ gì đó thực sự có thể nói cùng một ngôn ngữ với người dùng với sự tinh tế và linh hoạt ở mức cao.

    Nói một cách khác thì công nghệ dịch thuật hiện nay vẫn có những tác dụng nhất định, nhưng chất lượng cũng rất “hên xui” và chưa thể tin tưởng hoàn toàn.

    Tham khảo BBC

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ