Bị cáo buộc tải phim người lớn để huấn luyện AI, Meta phản bác: những nội dung này được dùng vào mục đích cá nhân
Meta bác bỏ mọi cáo buộc của tổ chức đứng sau những nội dung nhạy cảm trên.
Các công ty AI đang đối mặt với làn sóng kiện tụng mới. Tháng 7 vừa qua, Meta tiếp tục bị khởi kiện bởi Strike 3 Holdings và Counterlife Media, những nhà sản xuất đứng sau hàng loạt thương hiệu phim người lớn nổi tiếng. Theo trang TorrentFreak, hai công ty này cáo buộc Meta đã tải xuống ít nhất 2.369 bộ phim của họ kể từ năm 2018 để huấn luyện AI.
Nguồn gốc của vụ việc bắt đầu từ một vụ kiện khác vào năm 2024, do nhóm tác giả kiện Meta vì hành vi vi phạm bản quyền. Trong quá trình xét xử, vụ kiện này tiết lộ rằng Meta đã từng thực hiện các hoạt động torrent. Sau đó, Strike 3 sử dụng công cụ theo dõi BitTorrent để phát hiện các hành vi vi phạm bản quyền video, và kết quả cho thấy nhiều địa chỉ IP thuộc sở hữu của Meta có dấu hiệu tải phim của họ. Ngoài ra, bên nguyên còn cáo buộc Meta đã che giấu một “mạng lưới ngầm” gồm khoảng 2.500 địa chỉ IP bí mật.
Vì sao Meta lại muốn sử dụng gần 2.400 video khiêu dâm để huấn luyện AI? Strike 3 cho rằng mục đích là để bí mật phát triển một phiên bản AI dành cho người lớn của công nghệ Movie Gen. Họ hiện đang yêu cầu bồi thường thiệt hại 359 triệu USD.
Meta, dĩ nhiên, phủ nhận mọi cáo buộc và đề nghị bác bỏ vụ kiện. Công ty cũng chỉ ra rằng Strike 3 từng bị một số bên gọi là “kẻ săn bản quyền” chuyên khởi kiện để tống tiền.

Meta đưa ra nhiều luận điểm để phản bác: Năm 2018, thời điểm Strike 3 cho rằng Meta bắt đầu tải nội dung của mình, là nhiều năm trước khi Meta nghiên cứu về các mô hình ngôn ngữ lớn (LLM) và video tạo sinh, vốn chỉ khởi động vào năm 2022. Ngoài ra, các điều khoản của Meta cũng nghiêm cấm việc tạo ra nội dung người lớn bằng AI.
Đối với bằng chứng về địa chỉ IP, Meta cho rằng số lượng tải xuống quá nhỏ, trung bình chỉ khoảng 22 video mỗi năm trên hàng chục địa chỉ IP. Điều này cho thấy đây là hành vi tải cho mục đích cá nhân. Trong vụ kiện của các tác giả trước đó, Meta từng thừa nhận đã sử dụng bộ dữ liệu Book3, gồm 195.000 cuốn sách có bản quyền với tổng dung lượng lên tới 37GB, để huấn luyện các mô hình LLM của mình.
Với hàng chục nghìn nhân viên, cùng nhiều nhà thầu, khách và bên thứ ba truy cập Internet mỗi ngày, Meta cho biết không thể xác định ai đã tải các video này, hay liệu họ có phải nhân viên Meta hay không.
Một chi tiết khác là có cáo buộc rằng một nhà thầu của Meta từng thực hiện hành vi tải phim người lớn tại nhà cha ruột. Meta lập luận rằng chẳng có lý do gì để một kỹ sư tự động hóa lại phải tự tải dữ liệu huấn luyện AI tại nhà riêng, và hành vi này rõ ràng mang tính cá nhân.
Meta khẳng định: “Những cáo buộc này không chỉ thiếu căn cứ mà còn vô lý và mâu thuẫn với chính các dữ kiện mà bên nguyên đưa ra”.
Trong khi đó, vào tháng 8, Anthropic đã đồng ý chi trả 1,5 tỷ USD cho các tác giả vì bị cáo buộc sử dụng sách vi phạm bản quyền để huấn luyện LLM. Đến tháng 9, Apple cũng bị kiện với cáo buộc tương tự, rằng họ đã dùng các bản sách lậu để huấn luyện mô hình ngôn ngữ OpenELM.
NỔI BẬT TRANG CHỦ
-
Trải nghiệm nhanh Apple Intelligence tiếng Việt: Cuộc sống tiện lợi hơn khi iPhone bắt đầu thật sự "hiểu" người Việt
Trên iOS 26.1, Apple Intelligence lần đầu hỗ trợ tiếng Việt. Trong quá trình trải nghiệm, tôi nhận thấy nhiều tính năng AI được Apple thiết kế thực sự hữu ích và gần gũi với người dùng Việt.
-
Cận cảnh Galaxy Z TriFold - Điện thoại gập ba đầu tiên của Samsung