Nghiên cứu đập tan ảo tưởng về vibe coding trên mạng xã hội: Không một coder chuyên nghiệp nào thực sự làm như vậy
Dù trông có vẻ thú vị và đơn giản, hóa ra việc vibe coding cũng không thực sự dễ dàng như các video trên mạng xã hội.
Trên mạng xã hội, không khó để bắt gặp những video demo ấn tượng về lập trình viên giao cho AI một prompt mơ hồ, sau đó ngồi nhâm nhi cà phê trong khi hệ thống tự động xây dựng toàn bộ ứng dụng mà không cần can thiệp.
Andrej Karpathy, nhà khoa học AI nổi tiếng, đặt tên cho phong cách này là "vibe coding", nghĩa là "hoàn toàn tin vào cảm giác, quên luôn code có tồn tại, không đọc diff nữa". Hàng nghìn lập trình viên trên X tuyên bố họ điều khiển hàng chục AI agent cùng lúc để xây dựng hệ thống production mà không cần chạm tay vào code.
Andrej Karpathy, người phát minh ra thuật ngữ vibe-coding
Tuy nhiên, một nghiên cứu mới từ Đại học California San Diego và Cornell đã theo dõi 112 lập trình viên chuyên nghiệp sử dụng AI agent trong công việc thực tế của họ, và kết quả hoàn toàn trái ngược với mọi video virus trên mạng xã hội.
Nghiên cứu quan sát trực tiếp 13 lập trình viên trong quá trình làm việc với AI và khảo sát sâu 99 người còn lại, tất cả đều có ít nhất 3 năm kinh nghiệm chuyên nghiệp, một số có tới 25 năm. Kết quả cho thấy không một ai trong số họ thực sự làm việc theo kiểu vibe coding.
Thay vào đó, các lập trình viên có kinh nghiệm luôn lập kế hoạch trước khi viết prompt. Họ vạch ra kiến trúc, các ràng buộc và trường hợp ngoại lệ trước, sau đó mới giao cho AI một nhiệm vụ được giới hạn chặt chẽ phạm vi. Họ đánh giá từng dòng code thay đổi, không phải vì hoang tưởng mà vì họ đã từng chứng kiến hậu quả khi không ai làm điều đó.
Họ giới hạn phạm vi tác động của AI, chỉ giao những công việc nhỏ, và ngay khi vấn đề chạm tới nhiều hệ thống, họ lập tức can thiệp. Họ đối xử với AI như một lập trình viên mới vào nghề có tốc độ nhanh nhưng cần giám sát, chứ không phải một kỹ sư cấp cao có thể tin tưởng để làm việc một mình.
Nghiên cứu còn tiết lộ những dữ liệu đáng lo ngại hơn từ các thử nghiệm khác. Một thí nghiệm ngẫu nhiên độc lập phát hiện những người bảo trì dự án mã nguồn mở có kinh nghiệm thực sự chậm hơn 19% khi được phép sử dụng AI.
Một hệ thống AI khác được triển khai trong issue tracker thực tế chỉ có 8% lần gọi dẫn đến các yêu cầu thay đổi (pull request) được đưa vào dự án, tức là tỷ lệ thất bại lên tới 92% trong môi trường thực tế. Con số này hoàn toàn trái ngược với những gì các video demo hứa hẹn.
Phát hiện quan trọng nhất trong nghiên cứu chỉ gói gọn trong một câu: lập trình viên có kinh nghiệm chỉ cảm thấy tích cực về AI agent khi họ vẫn giữ quyền kiểm soát. Ngay khi họ buông lỏng kiểm soát, chất lượng code sụp đổ và họ biết rõ điều đó.
Kết quả này khớp với những gì mọi công ty nghiêm túc đã âm thầm nhận ra: những lập trình viên làm ra nhiều sản phẩm nhất với AI không phải là những người đang "vibe", mà là những người có quy trình review nghiêm ngặt nhất, phân chia công việc chặt chẽ nhất và có mô hình tư duy rõ ràng nhất về những gì AI có thể và không thể làm.
Luôn theo sát kết quả đầu ra
Trong nghiên cứu, các lập trình viên được quan sát đều thể hiện chiến lược kiểm soát chặt chẽ hành vi của AI. Tất cả 11 người tham gia xây dựng tính năng mới đều kiểm soát quá trình thiết kế, yêu cầu AI tạo bản nháp kế hoạch để họ chỉnh sửa hoặc tự tạo kế hoạch thiết kế hoàn chỉnh.
Về mặt triển khai, 9 trong số 13 người tham gia đều review cẩn thận mọi thay đổi do AI tạo ra. Ba người còn lại không review trực tiếp code nhưng vẫn theo dõi sát kết quả chương trình và sẵn sàng can thiệp khi cần. Một người tham gia thậm chí hoàn toàn không để AI viết code mà chỉ dùng nó để giải thích kiến trúc codebase.
Về prompt, các lập trình viên đều nhấn mạnh cần cung cấp ngữ cảnh rõ ràng và hướng dẫn chi tiết. Họ sử dụng các kỹ thuật prompt cụ thể như chụp màn hình, tham chiếu file, đưa ví dụ và yêu cầu suy nghĩ từng bước.
Một số người thậm chí dùng AI bên ngoài để cải thiện chất lượng prompt trước khi đưa vào AI chính. Họ áp dụng các quy tắc người dùng để thực thi quy chuẩn dự án, cung cấp hướng dẫn độc lập với ngôn ngữ lập trình, hoặc điều chỉnh hành vi AI dựa trên các tương tác trước đó.
Về mặt tác vụ phù hợp, các lập trình viên đánh giá AI thích hợp cho việc tăng tốc các công việc đơn giản, lặp đi lặp lại và tạo khung code ban đầu. Họ cho rằng AI làm tốt việc viết test, tài liệu, chỉnh sửa code đơn giản và sửa những lỗi nhỏ. Tuy nhiên, khi độ phức tạp tăng lên, khả năng phù hợp của AI giảm mạnh.
Các lập trình viên tránh dùng AI cho logic nghiệp vụ, các tác vụ yêu cầu kiến thức chuyên sâu và không ai cho rằng AI có thể thay thế quyết định của con người. Đặc biệt, AI không thể tạo ra code hoàn hảo ngay từ lần đầu và thường gặp khó khăn khi tích hợp với code hiện có.
Một lập trình viên trong khảo sát đã chia sẻ: "Tôi đã là kỹ sư phần mềm và phân tích dữ liệu được 20 năm và không đời nào tôi quay lại viết code bằng tay nữa. Con tàu đó đã ra khơi và tốt thôi. Nhưng một lời cảnh báo cho những người trẻ mới vào nghề: vẫn rất quan trọng phải biết mình đang làm gì. AI rất tuyệt để người không am hiểu kỹ thuật tạo ra demo, nhưng để vượt qua đó và làm ra thứ gì đó gần với sản phẩm production thì cần rất nhiều giám sát."
Vibe coding có thể tạo ra những video Twitter ấn tượng, nhưng nó không tạo ra phần mềm chất lượng. Lần tới khi ai đó nói với bạn rằng họ để Claude xây dựng toàn bộ SaaS trong một cuối tuần, hãy hỏi họ đã đọc bao nhiêu trong số đó. Câu trả lời trung thực sẽ phân biệt kỹ sư thực thụ với đám đông làm demo.
NỔI BẬT TRANG CHỦ
-
Một startup AI tuyên bố tiến lên mô hình “thuần AI”, bước đầu tiên là sa thải 25% nhân sự
Một startup AI vừa sa thải 25% nhân sự để trở thành công ty “thuần AI”, dấu hiệu cho thấy làn sóng AI thay thế con người có thể đang bước sang giai đoạn mới.
-
"Thánh leak" @evleaks nghỉ hưu sau 14 năm: Không đủ tiền mua thuốc điều trị bệnh mãn tính