Bán dữ liệu cho OpenAI, "Ngôi đền của coder" tự đào hố chôn mình khi bị ChatGPT cướp khách

Nguyễn Hải, doisongphapluat.nguoiduatin.vn 

Dù lượng câu hỏi trên Stack Overflow vốn đã tụt dần đều qua nhiều năm, nhưng thỏa thuận cung cấp dữ liệu cho OpenAI đã thực sự đánh dấu chấm hết cho nền tảng nổi tiếng này.

Trong suốt 15 năm, Stack Overflow đã là "ngôi đền thiêng" của hàng triệu lập trình viên toàn cầu với 59 triệu bài viết hỏi đáp được xây dựng công phu dưới giấy phép Creative Commons. Bất kỳ developer nào khi gặp khó khăn đều biết rằng câu trả lời có thể nằm đâu đó trên Stack Overflow. Nhưng giờ đây, "ngôi đền" này đang sụp đổ, và điều nghiệt ngã nhất là nó đã tự tay đào hố chôn mình.

Stack Overflow đã ký thỏa thuận cấp phép với OpenAI và Google, hai công ty mà các mô hình AI của họ đã scrape toàn bộ dữ liệu để huấn luyện. Sau đó, công ty bán quyền truy cập API cho chính những đối tượng đang thay thế nó. Đây không chỉ là quyết định kinh doanh tồi, mà là hành động tự sát. Stack Overflow đã kiếm tiền từ chính những mô hình AI đang giết chết nó.

Lượng câu hỏi trên Stack Overflow đã sụt giảm dần từ năm 2014 cho đến nay

Con số thống kê tàn nhẫn đã nói lên tất cả. Từ tháng 3 năm 2023 đến tháng 12 năm 2024, số câu hỏi mỗi tháng đã giảm 70%. Đến tháng 5 năm 2025, số câu hỏi hàng tháng xuống mức thấp như tháng 5 năm 2009, chỉ mười tháng sau khi nền tảng ra mắt. Biểu đồ suy giảm được chia sẻ bởi một trong top 10 contributor mọi thời đại trông thật đáng kinh ngạc theo cách tồi tệ nhất.

Có lẽ các nhà sáng lập Jeff Atwood và Joel Spolsky đã biết điều gì đó sắp xảy ra. Họ bán Stack Overflow cho nhà đầu tư Prosus với giá 1,8 tỷ đô la vào tháng 6 năm 2021, thời điểm gần như hoàn hảo ngay trước khi sự suy giảm không thể đảo ngược bắt đầu. Đây chính là đỉnh cao, và kể từ đó mọi thứ chỉ đi xuống. Công ty hiện đang "bắt đầu đổi thương hiệu" trong khi nền tảng bước vào giai đoạn chăm sóc hấp hối.

Lý do ChatGPT thắng Stack Overflow một cách áp đảo không khó hiểu. Thứ nhất, ChatGPT nhanh hơn nhiều. Thay vì tìm kiếm và đọc qua nhiều câu trả lời, developer chỉ cần hỏi ChatGPT và nhận câu trả lời ngay lập tức. Thứ hai, ChatGPT được huấn luyện trên chính dữ liệu của Stack Overflow, nghĩa là chất lượng câu trả lời tương đương hoặc tốt hơn. Thứ ba, ChatGPT luôn lịch sự và trả lời mọi câu hỏi, không giống các moderator của Stack Overflow.

Đây là vấn đề dai dẳng từ lâu. Từ năm 2014, Stack Overflow đã cải thiện đáng kể hiệu quả kiểm duyệt với câu hỏi bị đóng nhanh hơn và nhiều hơn. Nhiều developer cảm thấy các moderator đã lạm dụng quyền lực bằng cách đóng các câu hỏi hoàn toàn hợp lệ. Không gian từng thân thiện để học hỏi đã trở nên khắt khe và không chào đón. Nhiều người đã ngừng đặt câu hỏi từ thời điểm đó.

Cú đánh quyết định đến vào tháng 11 năm 2022, khi ChatGPT chính thức ra mắt. Ngay lập tức, số lượng câu hỏi trên Stack Overflow bắt đầu giảm mạnh. Developer không còn cần đối mặt với sự khắt khe của moderator hay lo lắng câu hỏi bị đóng. Họ có thể hỏi ChatGPT bất cứ điều gì, bất kỳ lúc nào, và nhận được câu trả lời mà không bị phán xét.

Nhưng thỏa thuận cung cấp dữ liệu cho OpenAI thực sự đã kết thúc số phận của Stack Overflow

Bốn tháng trước, một bài viết đã đặt câu hỏi: "Liệu LLMs có làm Stack Overflow trở nên vô nghĩa?" Dữ liệu lúc đó gợi ý câu trả lời có lẽ là "có". Giờ đây, vào tháng 5 năm 2025, câu trả lời đã rõ ràng và đáng buồn là "có". Câu hỏi không còn là liệu Stack Overflow có sụp đổ hay không, mà là khi nào nền tảng này sẽ đóng cửa hoặc được bán lại với giá rẻ mạt.

Stack Overflow đã giúp đỡ vô số developer thoát khỏi tình trạng "bế tắc" trong công việc và thành công biến việc giúp đỡ người khác trên internet thành một trò chơi hấp dẫn vào đầu những năm 2010. Nhiều developer vẫn nhớ niềm tự hào khi nhận được upvote đầu tiên. Nền tảng đã tạo ra sự khác biệt lớn trong sự phát triển chuyên môn của hàng triệu người.

Nhưng câu chuyện này mang một bài học cảnh báo quan trọng: hãy cẩn thận với các thỏa thuận cấp phép với các công ty AI. Stack Overflow đã bán dữ liệu mà cộng đồng xây dựng trong 15 năm cho những công ty cuối cùng lại tạo ra sản phẩm thay thế chính nó. Đây là ví dụ điển hình về việc tự hủy hoại trong thời đại trí tuệ nhân tạo.

Các không gian nơi developer gặp gỡ và giúp đỡ nhau sẽ tiếp tục tồn tại, dù ở dạng Discord servers, WhatsApp groups hay Telegram. Ngôi đền cũ có thể sụp đổ, nhưng tinh thần chia sẻ trong cộng đồng lập trình viên vẫn sẽ tiếp tục. Đáng tiếc thay, tất cả những điều tốt đẹp đều có hồi kết, và Stack Overflow đang chứng kiến hồi kết của mình.

Tin cùng chuyên mục
Xem theo ngày

NỔI BẬT TRANG CHỦ