Một hãng luật tốn gần một tỷ đồng để tự build "ChatGPT" trên dữ liệu riêng, dân mạng xem xong vẫn gật gù khen rẻ

    Nguyễn Hải ,  

    VTV.vn - Dù 35.000 USD là số tiền đầu tư không hề nhỏ, nhưng cư dân mạng vẫn cho rằng chi phí đó hoàn toàn xứng đáng để có được một chatbot AI riêng.

    Cộng đồng công nghệ đang xôn xao trước thông tin một công ty luật quy mô trung bình vừa chi 35.000 USD - tương đương gần một tỷ đồng Việt Nam - để thuê một developer xây dựng hệ thống trí tuệ nhân tạo hoàn toàn riêng tư. Điều bất ngờ là thay vì chỉ trích về sự "phung phí", đa số ý kiến lại cho rằng con số này "cực kỳ hợp lý" và thậm chí là "rẻ bèo".

    Câu chuyện bắt đầu khi một developer có tên u/eeko_systems chia sẻ trên Reddit về thương vụ lớn nhất trong sự nghiệp của mình. Thay vì sử dụng các dịch vụ AI có sẵn như ChatGPT hay Claude, công ty luật này quyết định đầu tư xây dựng một "pháo đài AI" hoàn toàn độc lập, không phụ thuộc vào bất kỳ nhà cung cấp nào.

    Một hãng luật tốn gần một tỷ đồng để tự build "ChatGPT" trên dữ liệu riêng, dân mạng xem xong vẫn gật gù khen rẻ- Ảnh 1.

    Hệ thống được xây dựng dựa trên mô hình LLaMA 3 70B của Meta, được triển khai trên nền tảng CoreWeave với cấu hình dual A100 GPUs - những vi xử lý đồ họa mạnh nhất hiện tại dành cho AI. Điểm đặc biệt là toàn bộ dữ liệu và quá trình xử lý diễn ra hoàn toàn trong môi trường được kiểm soát bởi công ty luật, không có một byte thông tin nào rời khỏi hệ thống của họ.

    Để hiểu được sự phức tạp của hệ thống này, hãy tưởng tượng một "siêu trợ lý" có thể đọc hiểu hàng ngàn trang tài liệu pháp lý trong vài giây, trả lời các câu hỏi phức tạp về luật, tóm tắt các vụ việc, và thậm chí có thể phân tích hợp đồng một cách chi tiết. Tất cả được thực hiện thông qua một giao diện web đơn giản mà bất kỳ luật sư nào trong công ty cũng có thể sử dụng.

    Công nghệ đằng sau hệ thống này đòi hỏi sự kết hợp tinh vi của nhiều thành phần. ChromaDB đóng vai trò như một "thư viện số" khổng lồ, chuyển đổi tất cả tài liệu thành dạng dữ liệu mà AI có thể hiểu được. LlamaIndex hoạt động như một "người thư ký thông minh", giúp AI tìm kiếm và trích xuất thông tin chính xác từ núi tài liệu. Trong khi đó, n8n đảm nhận vai trò "điều phối viên", tự động hóa mọi quy trình từ việc tải tài liệu mới lên hệ thống đến gửi thông báo qua Slack và email.

    Một hãng luật tốn gần một tỷ đồng để tự build "ChatGPT" trên dữ liệu riêng, dân mạng xem xong vẫn gật gù khen rẻ- Ảnh 2.

    Mô hình AI mã nguồn mở được công ty nói trên lựa chọn là Llama 3 phiên bản 70B của hãng Meta

    Điều khiến cộng đồng công nghệ thán phục không chỉ là tính năng mà còn là mức độ bảo mật. Hệ thống được trang bị xác thực JWT, kiểm soát truy cập theo địa chỉ IP và ghi lại đầy đủ mọi hoạt động. Đây là những yêu cầu bắt buộc trong ngành luật, nơi mà việc rò rỉ thông tin có thể dẫn đến hậu quả pháp lý nghiêm trọng.

    Tuy nhiên, tại sao 35.000 USD lại được coi là "rẻ" đối với một hệ thống như vậy? Câu trả lời nằm ở chi phí vận hành. Việc thuê dual A100 GPUs trên CoreWeave có thể tiêu tốn từ 6.000 đến 8.000 USD mỗi tháng, có nghĩa là chỉ riêng chi phí infrastructure trong một năm đã lên tới 72.000 đến 96.000 USD. Con số 35.000 USD để thiết lập toàn bộ hệ thống chỉ tương đương với 4-5 tháng chi phí vận hành.

    Hơn nữa, nếu công ty luật quyết định tự xây dựng đội ngũ AI nội bộ, họ sẽ phải chi ít nhất 400.000 USD mỗi năm cho các chuyên gia về AI, DevOps và bảo mật, chưa kể đến thời gian và rủi ro trong quá trình phát triển. Các giải pháp enterprise từ những "ông lớn" như Microsoft hay Google thường có giá từ 100.000 đến 500.000 USD, nhưng vẫn phụ thuộc vào API bên thứ ba - điều mà nhiều công ty luật không thể chấp nhận được.

    Một hãng luật tốn gần một tỷ đồng để tự build "ChatGPT" trên dữ liệu riêng, dân mạng xem xong vẫn gật gù khen rẻ- Ảnh 3.

    Mô hình AI mới DeepSeek R1-0528 có thể khiến việc tự triển khai các chatbot AI riêng cho mỗi công ty hiệu quả chi phí cao hơn

    Thú vị hơn, ngay khi câu chuyện này đang được bàn tán sôi nổi, thì một sự kiện quan trọng khác diễn ra. DeepSeek, một startup AI từ Trung Quốc, vừa phát hành phiên bản "thu gọn" của mô hình R1, có thể chạy trên chỉ một GPU duy nhất thay vì cả chục GPU như trước đây. Điều này có nghĩa là chi phí thiết lập một hệ thống AI tương tự có thể giảm xuống còn 18.000 đến 22.000 USD, trong khi chi phí vận hành hàng năm chỉ còn 24.000 đến 36.000 USD.

    Mô hình DeepSeek R1 thu gọn này không chỉ rẻ mà còn thể hiện hiệu suất ấn tượng, vượt qua Google Gemini 2.5 Flash trong các bài test toán học và gần bằng Microsoft Phi 4 trong các bài kiểm tra khác. Đặc biệt, tỷ lệ "ảo giác" - tình trạng AI đưa ra thông tin sai lệch - đã giảm 45-50% so với phiên bản trước đó.

    Tuy nhiên, sự xuất hiện của DeepSeek cũng đặt ra những câu hỏi về tương lai. Liệu việc sử dụng công nghệ từ một startup Trung Quốc có phù hợp với các yêu cầu tuân thủ pháp lý của công ty luật Mỹ? Hiệu suất của mô hình nhỏ hơn có đủ để xử lý những tác vụ pháp lý phức tạp hay không? Đây là những câu hỏi mà các công ty luật cần cân nhắc kỹ lưỡng.

    Điều thú vị là trong khi nhiều ngành khác vẫn đang do dự về việc áp dụng AI, các công ty luật lại thể hiện sự quyết đoán bất ngờ. Có lẽ bởi vì trong ngành luật, thời gian chính là tiền bạc theo nghĩa đen. Việc một AI có thể phân tích hàng nghìn trang tài liệu trong vài phút thay vì vài tuần có thể mang lại lợi nhuận khổng lồ.

    Một hãng luật tốn gần một tỷ đồng để tự build "ChatGPT" trên dữ liệu riêng, dân mạng xem xong vẫn gật gù khen rẻ- Ảnh 4.

     

    Tin cùng chuyên mục
    Xem theo ngày