Modder Witcher 3 dùng AI để làm giả giọng Geralt, chân thực đến mức cộng đồng diễn viên lồng tiếng sợ mất việc

Tự động hóa sẽ khiến quá trình làm game đơn giản đi nhiều, nhưng hành động này sẽ cướp đi việc làm của rất nhiều những diễn viên có tài.

Witcher 3 ra mắt được hơn 6 năm, đủ thời gian để đa số fan chơi tới vài lần lượng nội dung khổng lồ mà game đem lại. Dù game đã được 6 năm tuổi, nhưng cộng đồng vẫn hoạt động mạnh, mà cụ thể là cộng đồng modder vẫn liên tục thêm thắt những thứ mới vào bản game đã cũ.

Đôi lúc, sản phẩm mới không chỉ thu hút được những lời khen do chất lượng cao, mà còn khuấy động cả ngành game khi những lời chỉ trích xuất hiện. Trong ví dụ mới nhất, ta có bản mod mang tên A Night to Remember, với nội dung nối tiếp các sự kiện diễn ra trong bản mở rộng cuối cùng có tựa đề Blood and Wine. Trong phần truyện mới do fan thực hiện, Geralt xứ Rivia sẽ tiếp tục săn tìm ma cà rồng Orianna.

Trailer giới thiệu mod A Night to Remember.

Fan hào hứng với bản mod vì nhiều lý do, một trong số đó là việc Geralt và nhiều nhân vật khác có thêm lời thoại mới. Nhưng rõ ràng, một modder không thể đủ kinh phí thuê diễn viên lồng tiếng được rồi; modder nikich340 có được những đoạn lồng tiếng mới nhờ trí tuệ nhân tạo, sử dụng AI học giọng diễn viên lồng tiếng Geralt, anh Doug Cockle, để làm mod.

Một số diễn viên lồng tiếng và người trong ngành không vui trước hành động này.

Nếu đúng vậy, thì thật đau lòng biết bao”, diễn viên lồng tiếng Jay Britton, người đã góp nhiều công trong hai tựa game cần rất nhiều lồng tiếng, là Divinity: Original Sin 2 và Pathfinder: Kingmaker, nói trên Twitter. “Đúng là AI có thể thay thế nhiều thứ, nhưng có nên làm vậy không? Chúng ta có quyền đưa ra lựa chọn mà. Việc thay thế diễn viên bằng AI không chỉ ẩn chứa nhiều cạm bẫy liên quan tới pháp luật, mà còn là một sự thay thế vô hồn”.

Vụ việc liên quan tới bản mod Witcher 3 đến đúng thời điểm Obsidian, một nhà phát triển game nhập vai có tiếng, đăng tải video cộng tác với công ty Sonantic. Họ cùng nhau sử dụng giọng nói AI nhằm tạo ra câu thoại và đưa vào game. Nhà phát triển Obsidian cho rằng việc sử dụng AI rất có ích cho quá trình phát triển game.

Tất cả giọng nói của nhân vật giả tưởng trong video này đều do AI tạo ra.

Nỗi lo “tự động hóa lấy mất việc làm” lại hiện hữu rõ ràng, và lần này, những diễn viên lồng tiếng là những người nằm trong tầm ngắm của trí tuệ nhân tạo. Trong thời buổi đại dịch này, cả việc công nghệ đang ngày một dễ tiếp cận hơn, công việc lồng tiếng có thể được thực hiện ngay tại nhà. Các diễn viên phải cạnh tranh khốc liệt để có được việc làm, và khi giọng nói do máy tính tạo ra đủ thuyết phục người nghe, cơ hội làm việc sẽ còn giảm sâu.

Lại nói về bản mod Witcher 3 do fan thực hiện. Modder nikich340 sử dụng phần mềm có tên CyberVoice để tạo ra lời thoại cho nhân vật chính Geralt. Đứng sau CyberVoice là công ty Mind Solution Lab có trụ sở tại Nga, họ cũng phát triển CyberMind - một phần mềm trí tuệ nhân tạo khác có thể tạo ra “nhân cách” giả cho NPC trong game.

Trong bản mod, CyberMind tạo nên não của Geralt - là tổ hợp những gì nhân vật chính biết về thế giới, những nhân vật khác và các loài quái vật, và CyberVoice tạo nên tiếng nói của Geralt, nói ra những hiểu biết mà CyberMind nắm giữ.

Modder Witcher 3 dùng AI để làm giả giọng Geralt, chân thực đến mức cộng đồng diễn viên lồng tiếng sợ mất việc - Ảnh 3.

Nhân vật Geralt với giọng nói khó quên.

Trả lời phỏng vấn tạp chí Input, Leonid Derikyants, CEO của Mind Simulation Lab, khẳng định đây là công nghệ thiết yếu của ngành công nghiệp phát triển game. “Chúng tôi tạo ra những bản thể giọng nói cho phép các NPC trong thế giới giả lập có một giọng nói để giải đáp thắc mắc của người chơi, trả lời những câu hỏi không nằm trong chuỗi nhiệm vụ chính”. 

Anh nói thêm: “Bởi lẽ chúng tự tạo nên câu trả lời và ghi nhớ những sự thật được cung cấp trong tiến trình chơi, nên khó có thể lập trình trước các câu thoại. Sẽ thật quái lạ khi giọng nhân vật đổi giữa chừng, vậy nên chúng tôi sử dụng công nghệ tiên tiến để giả giọng”.

Mind Simulation Lab cũng đã từng cộng tác với diễn viên lồng tiếng, nhưng giọng của Geralt trong bản mod của nikich340 được tái tạo bằng máy, dựa trên giọng được ghi âm khác. Theo lời giải thích của Derikyants, Mind Simulation Lab sửa đổi giọng ghi âm sao cho giống với giọng Geralt nguyên bản, và như trong clip bạn đã xem, chất giọng giống thật một cách đáng ngạc nhiên.

Và từ đây, vấn đề xuất hiện: làm sao để ngăn một ai đó dùng giọng của người có tầm ảnh hưởng để tạo nên những lời lẽ đả kích, trái luân thường đạo lý? 

Modder Witcher 3 dùng AI để làm giả giọng Geralt, chân thực đến mức cộng đồng diễn viên lồng tiếng sợ mất việc - Ảnh 4.

Zeena Qureshi, CEO của Sonantic, không đồng ý với việc giả giọng nhân vật Geralt trong bản mod A Night to Remember. Cô nói rằng trong trường hợp công ty mình, người cung cấp giọng phải chấp thuận với những sản phẩm Sonantic tạo ra trước khi công ty dám đăng tải chúng. Và một công ty sẽ phải đền bù thích đáng nếu như họ tiếp tục sử dụng giọng của diễn viên trong những dự án ngoài hợp đồng đã ký.

Nhưng lời khẳng định, những luật lệ này không ngăn được việc một bên thứ ba, sử dụng những phần mềm thứ ba, tổng hợp nhân tạo giọng nói của bất cứ ai. 

Thomas Mitchells, diễn viên lồng tiếng và cũng là đạo diễn chịu trách nhiệm mảng lồng tiếng của game nhập vai Baldur’s Gate 3, biết về sự tồn tại của những công nghệ này. 

Những công ty như Sonantic cung cấp khả năng ‘bảo vệ tác quyền giọng nói’, nhưng theo thời gian, người ta sẽ có trong tay những công cụ [giả giọng] này”, giám đốc Mitchells nói. Và ông không nói sai. Trên GitHub, đã có nhiều phần mềm dạng này trôi nổi với chất lượng khác nhau.

Mitchells hậu thuẫn việc sử dụng AI để tạo ra những câu thoại đơn giản, ví dụ như khẩu lệnh (như “Tấn công!”) hay lời động viên (như “Làm tốt lắm!”) của nhân vật, nhưng việc sử dụng trí tuệ nhân tạo để diễn đạt thì lại khác. Ông nói: “Không một phần mềm AI nào hoàn hảo. Bạn sẽ không nhận được một sản phẩm liền mạch, hay trải nghiệm cá nhân của người nói, bạn sẽ không nhận được cái hồn người nằm trong từng câu thoại. Những gì bạn có là một phụ phẩm đã được tinh chỉnh sao cho thuyết phục nhất có thể”.

Lấy dẫn chứng cho nhận định của mình, Mitchells kể về một sự tích nổi tiếng xuất thân từ quá trình làm phim Chúa tể những chiếc Nhẫn. Diễn viên gạo cội, rocker già, cựu chiến binh Thế chiến thứ Hai, Ngài Christopher Lee giải thích cho đạo diễn Peter Jackson tiếng kêu của một người bị đâm sau lưng ra sao. Trải nghiệm của cố diễn viên Christopher Lee đã đem lại màn trình diễn thuyết phục mà không AI nào có thể tái tạo.

Ngài Christopher Lee dạy cho Peter Jackson biết tiếng kêu của một người bị đâm sau lưng ra sao.

Cảnh Saruman bị đâm sau lưng.

Còn một yếu tố khả thổi hồn người vào trong câu thoại: đó chính là hơi thở của diễn viên. “Nhịp thở là yếu tố chủ chốt để ta diễn đạt, nhất là việc diễn đạt bằng lời”, Natalie WInter, một diễn viên lồng tiếng góp mặt trong Assassin’s Creed: Valhalla bộc bạch. “Nếu giọng nói do AI tạo ra không biết thở, nó sẽ không thể mang trong mình tác động cảm xúc giống như lời nói của một diễn viên”.

Với những diễn viên lồng tiếng tài năng như Mitchells và nhiều những cái tên đã xuất hiện trong bài viết này, việc dùng máy móc để gạt họ sang một bên khó chấp nhận vô cùng. “Diễn viên yêu nghiệp diễn. Đó là lý do họ hy sinh rất nhiều để làm công việc này. Nó thỏa mãn khả năng sáng tạo của cá nhân, và khi nhân vật được số đông khán giả yêu mến, đó sẽ là phần thưởng quý giá nhất của một diễn viên lồng tiếng”.

Bạn hãy thử tưởng tượng việc trở thành một nhân vật được nhiều người yêu thích nhưng lại chẳng đóng góp công sức gì cho sự thành công ấy cả. Người diễn viên chẳng đóng góp được chút sáng tạo nào. Họ không thấy chút thỏa mãn. Và hành động đó không phải nghệ thuật”, ông Michells kết luận.

Tham khảo Input

Tin cùng chuyên mục
Xem theo ngày

NỔI BẬT TRANG CHỦ