Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt

    Nút Chuối,  

    2 ứng dụng hoàn toàn miễn phí: Dragon Dictation và Dragon Search

    Công nghệ nhận diện giọng nói đã không còn chút xa lạ gì với những tín đồ công nghệ trên toàn thế giới. Những hệ điều hành di động đương đại đều có những công cụ hỗ trợ người sử dụng thông qua giọng nói của chính họ, ví như Siri của iOS, Microsoft TellMe hay Google Now trên Android. Thế nhưng điểm chung của những hệ thống trợ giúp bằng giọng nói như vậy đó là chúng đều chỉ hỗ trợ một vài ngôn ngữ lớn, được phần đông dân số thế giới sử dụng như tiếng Anh, tiếng Pháp hay tiếng Trung. Vậy còn với người sử dụng Việt Nam? Đôi khi việc “kỳ cạch” gõ những cụm từ khóa tìm kiếm trên đường hay trong một số trường hợp là không mấy tiện dụng, do đó 1 bộ công cụ nhận diện ngôn ngữ tiếng Việt dành cho smartphone là rất cần thiết.

    Và rồi, Nuance Communications, một tập đoàn truyền thông có trụ sở tại Massachusetts, Hoa Kỳ mới đây đã giới thiệu đến cộng đồng sử dụng iOS Việt Nam bộ đôi ứng dụng phục vụ việc tìm kiếm và nhập dữ liệu thông qua giọng nói với cái tên Dragon Search và Dragon Dictation. Hiện cả hai ứng dụng này đều được phân phối miễn phí thông qua hệ thống cửa hàng trực tuyến  App Store của Apple.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 1
    Giao diện ứng dụng Dragon Dictation.

    Điều đặc biệt của bộ đôi ứng dụng này, đó là chúng đều có hệ thống module nhận diện tiếng Việt tương đối hoàn chỉnh, có thể nhận diện hầu hết những câu chữ được nhập vào chiếc điện thoại, ngay cả khi nói bằng giọng nhiều vùng miền khác nhau. 

    Dragon Dictation

    Kỳ thực, Dictation mới chỉ là mức “entrance” trong số những ứng dụng nhận diện giọng nói của Nuance Communications. Công việc chính của Dictation cực kỳ đơn giản: “Diễn xuôi” tất cả những gì người sử dụng nói vào điện thoại dưới dạng đoạn text. Sau đó, ứng dụng cho phép người dùng chia sẻ những gì mình vừa nói thông qua một vài giao thức như SMS, Email, hay thậm chí là chia sẻ lên cả Facebook hay Twitter.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 2
    Giao diện chính.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 3
    Chế độ thiết lập cài đặt.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 4
    Lựa chọn ngôn ngữ tiếng Việt cho ứng dụng.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 5
    Quá trình thực hiện nhận diện giọng nói.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 6
    Kết quả thu được sẽ hiển thị qua text.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 7
    Nội dung thu được hết sức chính xác.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 8
    Người dùng có thể chia sẻ nội dung này qua tin nhắn, email, Facebook...

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 9
    Đăng nhập Facebook để chia sẻ đoạn văn bản lên mạng xã hội này hết sức nhanh chóng.

    Cá nhân tôi cho rằng với đặc điểm hoạt động hiệu quả với tỉ lệ thành công vào khoảng 85 đến 93% của Dragon Dictation, thì đây rõ ràng là một trải nghiệm cực kỳ hiệu quả cho bất kỳ ai có lối sống bận rộn, vì những gì bạn nói ra hoàn toàn có thể được gửi đi như một bức thư điện tử phục vụ cho nhu cầu công việc, hay thường xuyên chia sẻ những trạng thái mới nhất lên Facebook.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 10
    Hay gửi tin nhắn ngay lập tức.

    Trong thử nghiệm cụ thể, Dragon Dictation hoạt động rất tốt, với khả năng nhận diện chính xác mọi âm tiết tiếng Việt mà người thử nghiệm nói, trong điều kiện anh nói chậm rãi và rõ ràng từng tiếng. Ngay sau đó là những tính năng chia sẻ đi kèm cũng hoạt động tương đối hiệu quả.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 11
    Gửi email với tài khoản đăng nhập sẵn trên thiết bị iOS.

    Tuy nhiên, một điều cần ghi nhớ đó là ngay sau khi kết thúc đoạn nói, bạn cần chạm vào nút “Done” ngay phía dưới màn hình để báo cho điện thoại biết rằng bạn đã kết thúc việc nhập dữ liệu, tránh xảy ra tình trạng tạp âm bên ngoài lọt vào gây ảnh hưởng đến kết quả thu được.

    Dragon Search

    Về cơ bản thì Dragon Search của Nuance cũng có cơ chế hoạt động giống y hệt như Dragon Dictation trong mảng nhận diện giọng nói. Tuy nhiên điểm khác biệt lại đến từ những chức năng đi kèm của Dragon Search.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 12
    Giao diện Dragon Search.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 13
    Giao diện chính.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 14
    Chế độ cài đặt.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 15
    Tiếp tục lựa chọn ngôn ngữ tiếng Việt cho ứng dụng.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 16
    Công cụ ghi âm để chuyển đổi thành văn bản.

    Sauk hi diễn giải những cụm dữ liệu giọng nói người sử dụng nhập vào điện thoại, Dragon Search sử dụng chính đoạn dữ liệu này để tìm kiếm trên một số công cụ tìm kiếm hay trang web nổi tiếng như Google, Wikipedia hay YouTube. Đây chính là điểm tạo ra lợi thế cho Dragon Search. Thay vì nhập qua màn hình iPhone những cụm từ khóa dễ sai sót (màn hình iPhone tương đối bé, tôi đã có vài lần phát bực vì… gõ mãi không xong một cụm từ khóa), người sử dụng có thể tạo lệnh tìm kiếm ngay bằng giọng nói của chính mình.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 17
    Sử dụng công cụ của Google và một số nguồn dữ liệu khác.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 18
    Chẳng hạn như Youtube.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 19
    Hay Wikipedia.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 20
    Khả năng nhận diện giọng nói khá chính xác.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 21

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 22
    Phần mềm có khả năng phân biệt từ và chữ cái chính xác.

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 23

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 24

    Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt 25

    Thời gian tải trang cũng như xử lý thông tin âm thanh của Dragon Search cũng tương đối ấn tượng. Phụ thuộc tương đối nhiều vào tốc độ mạng 3G hoặc WiFi, tuy nhiên tốc độ xử lý của Dragon Search nhanh trong phần lớn trường hợp thử nghiệm của chúng tôi.

    Lợi thế lớn

    Ưu điểm của hai công cụ được giới thiệu ở trên  chính là khả năng nhận diện được phát âm tiếng Việt nhiều vùng miền. Không phải ai cũng sở hữu giọng nói giống nhau, đó chính là thứ Nuance đã làm tương đối tốt với sản phẩm nhận diện giọng nói của mình. Trong khi đó việc tích hợp một số công cụ chia sẻ hay tìm kiếm cơ bản lại là ưu điểm thứ 2 của Dragon Search và Dictation.

    Tuy nhiên một số lưu ý dành cho người sử dụng, đó là họ nên nói to và rõ ràng, ngắt nghỉ đúng để engine nhận diện làm việc với hiệu quả cao nhất.

    Dưới đây là đoạn video trải nghiệm thực tế 2 ứng dụng nhận diện giọng nói Dragon Dictation và Dragon Search:


    Ảnh và video: DT
    Tin cùng chuyên mục
    Xem theo ngày