Cơ hội từ những cơn địa chấn AI

    Lê Tỉnh - Huệ Bình,  

    Sự xuất hiện của DeepSeek liệu có là động lực để Việt Nam bước vào đường đua trí tuệ nhân tạo với hiệu suất cao và chi phí rẻ?

    Sau cơn sốt DeepSeek, các công ty công nghệ lớn của Trung Quốc nhanh chóng chạy đua ra mắt mô hình ngôn ngữ lớn (LLM) để cạnh tranh và giành thị phần.

    Công nghệ toàn cầu bứt tốc

    Ngày 29-1, đúng mùng 1 Tết Nguyên đán Ất Tỵ 2025, Tập đoàn Alibaba ra mắt phiên bản mới của mô hình trí tuệ nhân tạo (AI) Qwen 2.5 và tuyên bố mô hình này mạnh hơn cả DeepSeek. Theo Alibaba, Qwen 2.5 "vượt trội gần như trên mọi phương diện" so với những mô hình AI tiên tiến bậc nhất của OpenAI và Meta (Mỹ) như GPT-4o và Llama-3.1-405B.

    Trước đó, DeepSeek lần lượt ra mắt trợ lý AI sử dụng mô hình DeepSeek-V3, DeepSeek-R1 với chi phí chỉ bằng một phần nhỏ so với các sản phẩm từ các công ty Mỹ.

    Hai "cơn địa chấn" DeepSeek và Alibaba tạo ra cuộc chạy đua nâng cấp AI ngay tại Trung Quốc. Đáng chú ý là chatbot AI giá rẻ ChatGLM do nhóm nghiên cứu từ Trường Đại học Thanh Hoa và Công ty Zhipu AI phát triển. ChatGLM là một chatbot AI mã nguồn mở có khả năng tạo ra văn bản, dịch thuật và trả lời câu hỏi.

    Ernie Bot của gã khổng lồ công nghệ Baidu cũng đưa ra phiên bản nâng cấp Ernie 4.0 Turbo, có khả năng thực hiện nhiều tác vụ khác nhau, bao gồm tạo văn bản, dịch thuật, trả lời câu hỏi, tạo hình ảnh... Trong khi đó, ByteDance - công ty mẹ của TikTok - cập nhật mô hình AI chủ lực của mình và tuyên bố nó vượt qua o1 của OpenAI trong bài kiểm tra AIME - một tiêu chuẩn đo khả năng xử lý và phản hồi các chỉ dẫn phức tạp của AI.

    DeepSeek cũng đe dọa thị trường toàn cầu, buộc các "ông lớn" công nghệ hàng đầu như OpenAI, Meta, Google, Microsoft... phải điều chỉnh chiến lược đầu tư. Các tập đoàn công nghệ Mỹ trước đây dồn tiền đầu tư các nhà máy AI và nhà máy dữ liệu nhưng từ nay sẽ phải tập trung cải thiện các thuật toán để giảm chi phí, vận hành nhanh và hiệu quả hơn. Mới đây, OpenAI đã giới thiệu tính năng Deep Research, giúp ChatGPT tổng hợp, nghiên cứu thông tin. Điểm nổi bật của tính năng này là khả năng hiển thị chi tiết quá trình nghiên cứu, bao gồm trích dẫn và tóm tắt phương pháp được sử dụng, giúp người dùng dễ dàng theo dõi và kiểm chứng thông tin.

    Một số quốc gia khác như Ấn Độ, Hàn Quốc... cũng tham gia phát triển chatbot AI giá rẻ. Đơn cử tại Ấn Độ, Công ty Reliance Jio của tỉ phú Mukesh Ambani ra mắt chatbot AI đầu tiên hỗ trợ ngôn ngữ địa phương có tên BharatGPT. Đây là bước tiến đáng kể trong lĩnh vực AI của Ấn Độ, giúp công nghệ tiếp cận nhóm dân số không nói tiếng Anh dễ dàng hơn.

    Giao diện của DeepSeek và Qwen 2.5 Ảnh: Future/Qwen/Shutterstock

    Giao diện của DeepSeek và Qwen 2.5 Ảnh: Future/Qwen/Shutterstock

    Cơ hội nào cho Việt Nam?

    Ông Lữ Vincent Thế Hùng - nhà sáng lập, CEO Công ty CP EduX Global Institute - cho biết trước đây, giới công nghệ thường thông báo chi phí xây dựng mô hình AI lên đến hàng tỉ USD. Thế nhưng, sự ra mắt R1 của start-up công nghệ DeepSeek với chi phí chỉ 6 triệu USD - nếu như đúng là sự thật - có thể là động lực để các quốc gia, công ty khởi nghiệp phát triển AI của riêng mình với hiệu suất cao và chi phí rẻ. Từ đó, doanh nghiệp (DN), nhất là DN vừa và nhỏ, có thể tiếp cận và ứng dụng AI mà không cần đầu tư quá nhiều chi phí ban đầu; thúc đẩy chuyển đổi số trong các lĩnh vực sản xuất, thương mại, dịch vụ, giáo dục...

    Tuy nhiên, mô hình R1 của DeepSeek vừa ra mắt đã đối mặt nhiều lùm xùm liên quan bảo mật dữ liệu, sao chép mô hình AI của công ty công nghệ khác. Do đó, để có thể sáng tạo mô hình AI của riêng mình với chi phí rẻ, các quốc gia, DN cần tìm hiểu kỹ nguyên lý hoạt động, thuật toán, mã nguồn..., thay vì sao chép, đánh cắp. "Một mô hình AI thành công không chỉ ở khả năng xử lý mà còn ở vấn đề chi phí. DN Việt nên đi theo hướng xây dựng những giải pháp có khả năng mở rộng và tùy biến theo yêu cầu của nhiều ngành nghề khác nhau" - ông Hùng góp ý.

    Theo ông Phan Tấn Quốc - Phó Giám đốc Chương trình đổi mới sáng tạo KPMG Việt Nam, sự cạnh tranh gay gắt trên thị trường AI sẽ vừa là áp lực vừa là động lực để DN Việt nhanh chóng tạo ra những mô hình hữu ích, có vị thế nhằm phục vụ người dùng, khách hàng trong nước. Ông Quốc kiến nghị nhà nước có chính sách khuyến khích DN, cá nhân tham gia phát triển AI, xây dựng cơ sở dữ liệu; đồng thời hỗ trợ đầu tư vào các trung tâm nghiên cứu AI.

    "Xu hướng chia sẻ mã nguồn mở trong cộng đồng AI có thể giúp các nhà phát triển tận dụng và cải tiến mô hình. Thời gian tới sẽ có nhiều start-up và cá nhân dễ dàng tiếp cận, ứng dụng AI vào hoạt động của mình khi nhiều mô hình AI mới xuất hiện, đáp ứng nhu cầu riêng biệt" - ông Quốc nhận định.

    Theo các chuyên gia, DN khi phát triển AI phải xác định rõ mô hình đó có thể giải quyết được một bài toán cụ thể, mang lại giá trị thực cho người dùng, có sự khác biệt về tính năng hay điểm nhấn nổi trội không? Mô hình của DeepSeek chính là bài học cho các công ty công nghệ toàn cầu với chi phí tự công bố ở mức siêu rẻ nhưng hiệu suất được cho là vượt cả ChatGPT. Tiếp đó, cần tìm hiểu rõ nhu cầu về AI trên thị trường để bảo đảm AI đủ tính cạnh tranh, có thể sinh lời. 

    DeepSeek có thật sự rẻ?

    Trong báo cáo của mình, DeepSeek cho biết tổng chi phí đào tạo mô hình AI chưa đến 6 triệu USD, chủ yếu ở việc thuê các đơn vị xử lý đồ họa của NVIDIA. Tuy nhiên, mới đây, công ty nghiên cứu và tư vấn về chất bán dẫn SemiAnalysis đưa ra tính toán chi phí phát triển DeepSeek cao hơn nhiều so với tuyên bố.

    Theo tính toán, DeepSeek vận hành một hệ thống điện toán quy mô lớn gồm khoảng 50.000 GPU Hopper, với 10.000 GPU H800 và 10.000 GPU H100 mạnh hơn, cùng với các GPU H20 bổ sung. Tổng chi phí vốn cho máy chủ ước tính khoảng 1,6 tỉ USD và chi phí hoạt động khoảng 944 triệu USD.


    Tags:
    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ