Diễn đàn lớn nhất thế giới rao bán dữ liệu người dùng để huấn luyện AI, dự kiến thu về 60 triệu USD/năm

    Nguyễn Hải,  

    Một lượng khổng lồ các bài đăng và hình ảnh người dùng đưa lên Reddit trong suốt 2 thập kỷ qua, đây sẽ là mỏ vàng cho các công ty AI

    Theo báo cáo của Bloomberg vào thứ Sáu tuần trước, Reddit đã ký hợp đồng cho phép một công ty AI giấu tên sử dụng nội dung trên nền tảng của mình để huấn luyện các mô hình của họ. Biến động này diễn ra khi nền tảng truyền thông xã hội này sắp tiến hành IPO (phát hành cổ phiếu lần đầu ra công chúng), có thể diễn ra ngay tháng tới.

    Theo Bloomberg, trước đó vào đầu năm 2024, Reddit đã tiết lộ thỏa thuận trị giá 60 triệu USD/năm này với các nhà đầu tư tiềm năng dự kiến tham gia vào đợt IPO sắp tới. Nguồn tin của Bloomberg cho rằng hợp đồng này có thể trở thành hình mẫu cho các thỏa thuận tương lai với các công ty AI khác.

    Diễn đàn lớn nhất thế giới rao bán dữ liệu người dùng để huấn luyện AI, dự kiến thu về 60 triệu USD/năm- Ảnh 1.

    Dữ liệu người dùng tích lũy suốt 2 thập kỷ qua trên Reddit sắp được chính thức sử dụng để huấn luyện cho AI

    Sau thời kỳ các công ty AI sử dụng dữ liệu huấn luyện mà không xin phép chính thức từ chủ sở hữu, một số công ty công nghệ gần đây đã bắt đầu ký kết thỏa thuận cấp phép nội dung nhất định để huấn luyện các mô hình AI tương tự như GPT-4 (chạy phiên bản trả phí của ChatGPT).

    Ví dụ, vào tháng 12, OpenAI đã ký thỏa thuận với nhà xuất bản Đức Axel Springer (công ty xuất bản của Politico và Business Insider) để truy cập các bài viết của họ. Trước đó, OpenAI đã ký kết thỏa thuận với các tổ chức khác, bao gồm Associated Press. Theo báo cáo, OpenAI cũng đang đàm phán cấp phép với CNN, Fox và Time, cùng nhiều tổ chức khác.

    Trước đó vào tháng 4 năm 2023, CEO của Reddit, Steve Huffman, nói với The New York Times rằng công ty có kế hoạch tính phí các công ty AI để truy cập nội dung do người dùng tạo ra trên nền tảng của họ trong gần hai thập kỷ qua.

    Diễn đàn lớn nhất thế giới rao bán dữ liệu người dùng để huấn luyện AI, dự kiến thu về 60 triệu USD/năm- Ảnh 2.

    Nếu thỏa thuận trị giá 60 triệu USD/năm được thông qua, rất có thể các bài đăng của bạn trên Reddit sẽ được sử dụng để huấn luyện thế hệ mô hình AI tiếp theo có khả năng tạo văn bản, hình ảnh và video. Ngay cả khi không có thỏa thuận này, trước đây cũng có nhiều chuyên gia phát hiện ra rằng Reddit là một nguồn dữ liệu huấn luyện quan trọng cho các mô hình ngôn ngữ lớn và công cụ tạo hình ảnh AI.

    Mặc dù chưa rõ công ty ký hợp đồng với Reddit là ai, Bloomberg cho rằng khả năng khai thác làn sóng AI để tạo thêm doanh thu của Reddit có thể thúc đẩy giá trị IPO của họ, có thể lên tới 5 tỷ USD. Bất chấp những tranh cãi vào năm ngoái, Bloomberg cho biết Reddit đã thu về hơn 800 triệu USD doanh thu trong năm 2023, tăng khoảng 20% so với năm 2022. Mặc dù vậy, con số này vẫn thấp hơn 200 triệu USD so với mục tiêu 1 tỷ USD họ đặt ra 2 năm trước đó.

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ