PGS. TS Lê Hoàng Sơn chỉ ra 3 thách thức cần giải quyết trong phát triển công nghệ AI tại Việt Nam trong tuần lễ VinFuture 2024
Vượt qua được các thách thức này sẽ mở ra một cánh cửa đầy tươi sáng cho tương lai ngành AI Việt Nam.
Trong không khí sôi động của chuỗi sự kiện VinFuture với chủ đề "Khoa học vì Nhân loại", một tọa đàm chuyên sâu về "Trí tuệ nhân tạo tạo sinh cho Hỏi đáp trực quan tiếng Việt" (V-VQA) đã diễn ra vào chiều ngày 4/12/2024 tại Trung tâm Hội nghị quốc tế Almaz Convention Center, Hà Nội. Sự kiện quy tụ các chuyên gia hàng đầu trong lĩnh vực AI, với sự góp mặt đặc biệt của PGS.TS Lê Hoàng Sơn - Phó Viện trưởng, Viện Công nghệ Thông tin, Đại học Quốc gia Hà Nội và GS. Leslie Gabriel Valiant đến từ Đại học Harvard.
Mở đầu bài phát biểu, PGS.TS Lê Hoàng Sơn đã điểm lại bức tranh toàn cảnh về sự phát triển của Trí tuệ nhân tạo (AI) trên thế giới, đặc biệt nhấn mạnh đến những thành tựu đáng chú ý trong năm qua. Ông chia sẻ về việc hai nhà khoa học xuất sắc trong lĩnh vực AI - Giáo sư Geoffrey Hinton và Giáo sư John Hopfield - được vinh danh cho những đóng góp quan trọng trong Học máy (Machine Learning) và Học sâu (Deep Learning). Đặc biệt năm nay VinFuture đã mời được Giáo sư Yann LeCun, Đại học New York, Giám đốc Khoa học Trí tuệ nhân tạo tại Meta, người được xem là "cha đẻ" của AI cũng như nhiều chuyên gia công nghệ nổi tiếng trên thế giới như Tiến Sĩ Xuedong Huang - Giám đốc Công nghệ, Tập đoàn Zoom (Hoa Kỳ) đến chia sẻ trong phiên tọa đàm "Triển khai AI trong thực tế" trước đó. Sự kiện này đánh dấu sự quan tâm đặc biệt của cộng đồng khoa học và công nghệ thế giới, đặc biệt trong lĩnh vực AI đối với Việt Nam, mang đến các cơ hội hợp tác chuyên sâu trong lĩnh vực này, đặc biệt là đối với sự phát triển của AI tạo sinh (Generative AI hay Gen AI), một lĩnh vực đang được quan tâm đặc biệt tại Việt Nam trong hai năm gần đây với nhiều ứng dụng trong giáo dục, y tế, môi trường,...
Theo chia sẻ của PGS.TS Lê Hoàng Sơn, chỉ trong vòng ba năm qua, nhận thức về AI tạo sinh tại Việt Nam đã có những thay đổi đáng kể. "Ba năm trước, khi tôi hỏi một số chuyên gia, nhà khoa học về Gen AI, nhiều người còn chưa biết đến khái niệm này. Nhưng giờ đây, ai cũng đang sử dụng Gen AI trong công việc và Gen AI hỗ trợ hiệu quả trong công việc chuyên môn, giúp giảm đáng kể thời gian xử lý.", ông chia sẻ. Điều này phản ánh tốc độ phát triển nhanh chóng của công nghệ Gen AI tại Việt Nam.
Công nghệ V-VQA: Hệ thống hỏi đáp trực quan bằng tiếng Việt
Trọng tâm trong bài phát biểu của PGS.TS Lê Hoàng Sơn là giới thiệu bước phát triển của công nghệ VQA (viết tắt của Visual Question Answering) tại Việt Nam hiện nay. Đây được xem là một trong những chủ đề quan trọng trong nghiên cứu AI, khi cho phép máy tính trả lời câu hỏi dựa trên cả nội dung hình ảnh và ngôn ngữ thay vì chỉ dựa vào văn bản từ các câu hỏi trong các hệ thống Chatbot hiện tại. Đây là một công nghệ quan trọng có nhiều tiềm năng ứng dụng trong nhiều ngành và lĩnh vực.
Theo đó, PGS. Sơn đi sâu vào phân tích chi tiết 3 thành phần cốt lõi của hệ thống Hỏi đáp trực quan tiếng Việt (V-VQA), cùng những thách thức đang đặt ra trong quá trình phát triển và triển khai công nghệ này tại Việt Nam.
Thành phần đầu tiên và quan trọng nhất của hệ thống V-VQA là hệ thống thu thập dữ liệu trong đó, việc xây dựng một tập dữ liệu chất lượng đòi hỏi sự kết hợp của nhiều công nghệ thu thập dữ liệu tiên tiến, từ các hệ thống thu ảnh và video tự động cho đến các hệ thống thu thập dữ liệu từ mạng cảm biến không dây (wireless image sensors) trong mô hình Internet vạn vật (IoT).
PGS. Sơn minh họa điều này qua một dự án thực tế đang triển khai tại Đà Lạt, nơi một mạng lưới cảm biến không dây được triển khai để theo dõi và phân tích thông tin về các vườn hoa. Hệ thống này không chỉ thu thập dữ liệu thông thường mà còn có khả năng phát hiện các bất thường thông qua các thuật toán phân tích tiên tiến, giúp người quản lý có thể phát hiện sớm các vấn đề về bệnh dịch hay điều kiện môi trường thông qua App điện thoại.
Không những vậy, đối với một công nghệ nổi bật như V-VQA còn có tiềm năng ứng dụng lớn trong việc cá nhân hóa hoạt động giáo dục, y tế hoặc du lịch. Công nghệ có thể tạo nên các bài viết minh họa, các ví dụ được cá nhân hóa để hỗ trợ học sinh trong quá trình học tập, đặc biệt sẽ hỗ trợ hiệu quả hơn cho các học sinh có điểm yếu trong việc tiếp thu khi tạo ra những hình ảnh sống động.
Bên cạnh đó, công nghệ này còn có thể hỗ trợ các bệnh nhân giao tiếp với bác sĩ, đặc biệt đối với những bệnh nhân gặp khó khăn trong việc bày tỏ cảm xúc, hoặc cử chỉ, hoặc có dấu hiệu tự kỷ sẽ cảm thấy thuận tiện khi tìm kiếm các thông tin về tình trạng bệnh cũng như gợi ý điều trị qua V-VQA. Trong du lịch, V-VQA sẽ nâng cao các trải nghiệm du lịch của người dùng, đặc biệt khi đến những địa điểm ở nước ngoài cũng sẽ dễ dàng tra cứu các thông tin liên quan đến danh lam thắng cảnh hay di tích lịch sử với công nghệ tích hợp giọng nói tiếng Việt theo vùng miền.
Về mặt kiến trúc mô hình, PGS.TS. Lê Hoàng Sơn đề cập đến những tiến bộ đáng kể từ nghiên cứu của Giáo sư Ian Goodfellow, Giáo sư Yoshua Bengio và các cộng sự về kiến trúc mạng sinh đối kháng (GANs) và mô hình transformer, tạo nền tảng vững chắc cho việc xử lý ngôn ngữ tự nhiên kết hợp với thị giác máy tính. Để vận hành những mô hình phức tạp này, các nhà nghiên cứu đang tận dụng sức mạnh của các nền tảng điện toán đám mây hàng đầu như Google Cloud, Amazon AWS và Microsoft Azure.
Đặc biệt đáng chú ý trong phần thảo luận về huấn luyện mô hình là thông tin về Orion - một mô hình ngôn ngữ lớn mới được công bố của OpenAI vào tháng 12/2024 với sức mạnh vượt trội hơn 100 lần so với GPT-4. Tuy nhiên, một thách thức lớn đang đặt ra là làm sao chuyển đổi những mô hình lớn này thành các phiên bản nhỏ gọn có thể chạy trên thiết bị di động mà vẫn đảm bảo độ chính xác là một vấn đề đáng quan tâm hiện nay.
Các thách thức đối với phát triển V-VQA tại Việt Nam
Bên cạnh những vấn đề kỹ thuật, PGS.TS Lê Hoàng Sơn cũng chỉ ra ba nhóm thách thức chính trong việc phát triển V-VQA tại Việt Nam. Thứ nhất là thách thức về dữ liệu, với vấn đề cốt lõi là thiếu nguồn dữ liệu được gán nhãn bằng tiếng Việt. Việc xây dựng một bộ dữ liệu chuẩn đòi hỏi nguồn kinh phí lớn, đồng thời phải đảm bảo tính đa dạng và chất lượng của dữ liệu.
"Hiện nay, để xây dựng được một bộ dữ liệu, chúng ta cần có các dự án cấp quốc gia hoặc cấp trường đại học. Điều này đồng nghĩa với việc cần có kinh phí, và sau đó mới có thể huy động nghiên cứu sinh tiến sĩ, học viên cao học tham gia thu thập dữ liệu", PGS.TS Lê Hoàng Sơn giải thích.
Thách thức thứ hai liên quan đến kỹ thuật, trong đó nổi bật là giới hạn về tài nguyên tính toán. Nhiều nhóm nghiên cứu và sinh viên hiện đang phụ thuộc vào Google Colab với giới hạn tài nguyên, gây khó khăn cho việc phát triển các mô hình ngôn ngữ lớn (Large Language Model hay LLM). Việc chuyển đổi các mô hình để thực thi trên thiết bị di động cũng đặt ra nhiều thách thức về việc duy trì độ chính xác khi thu nhỏ quy mô mô hình.
Về mặt kỹ thuật, các nhà nghiên cứu tại Việt Nam hiện đang tập trung vào việc hiệu chỉnh và tối ưu hóa các mô hình ngôn ngữ lớn (LLM) như Llama 2 và Llama 3 cho tiếng Việt. Đáng chú ý, Trường Đại học Công nghệ Thông tin TP.HCM (UIT) đã phát triển một bộ dữ liệu công khai cho cộng đồng nghiên cứu, bao gồm nhiều cặp hình ảnh và câu hỏi-trả lời trong các lĩnh vực khác nhau. Trung tâm AIRC, Viện Công nghệ Thông tin, ĐHQGHN cũng đang triển khai xây dựng hạ tầng dữ liệu cho V-VQA tập trung cho giáo dục.
Bên cạnh vấn đề dữ liệu, các doanh nghiệp và chuyên gia đến từ Châu Âu và Mỹ cũng thảo luận sâu về các thách thức về hạ tầng tính toán và an ninh, an toàn. Việc triển khai các mô hình AI cần dữ liệu cá nhân, hiện là một vấn đề thách thức khi phải tuân thủ theo Nghị định 13/2023/NĐ-CP bảo vệ dữ liệu cá nhân tại Việt Nam hiện nay, và Nghị định 53/2022/NĐ-CP quy định chi tiết một số điều của Luật An ninh mạng trong đó các doanh nghiệp phải thực hiện lưu trữ dữ liệu tại Việt Nam, trong đó có cả dữ liệu AI.
Một điểm quan trọng được nhấn mạnh trong hội thảo là khoảng cách giữa nghiên cứu học thuật và ứng dụng thực tiễn. "Nhiều giảng viên tại các trường đại học còn chưa chủ động trong làm việc trực tiếp với khách hàng để tìm hiểu nhu cầu ứng dụng và lấy dữ liệu cũng như triển khai thực tế sau khi có ứng dụng AI. Chúng ta cần thay đổi thói quen và phương thức làm việc để nâng cao chỉ số đổi mới sáng tạo, góp phần quay lại đào tạo cho sinh viên tốt hơn.", PGS Lê Hoàng Sơn chia sẻ.
Mặc dù vậy, PGS. TS Lê Hoàng Sơn cũng cho rằng các thách thức này có thể khắc phục được phần nào nhờ vào các giải pháp như sau:
Trước tiên, việc tăng cường hợp tác quốc tế được xem là yếu tố quan trọng hàng đầu, không chỉ để học hỏi kinh nghiệm từ các đối tác nước ngoài nhất là đối với các chuyên gia hàng đầu thế giới như Giáo sư Yann LeCun, Tiến Sĩ Xuedong Huan,.. mà còn để tham gia sâu hơn vào các dự án nghiên cứu chung, từ đó tận dụng được nguồn lực và công nghệ tiên tiến.
Thứ hai, PGS. Sơn đặc biệt nhấn mạnh vai trò của việc đẩy mạnh quan hệ đối tác, đặc biệt là với khối doanh nghiệp. Điển hình là sáng kiến Better Choice Awards của Trung tâm Đổi mới sáng tạo Quốc gia đồng tổ chức cùng VCCorp, dưới sự chỉ đạo của Bộ Kế hoạch và Đầu tư - dự án đầu tiên tại Việt Nam thúc đẩy đổi mới sáng tạo và đặc biệt chú trọng vào Gen AI. Ông kỳ vọng trong 1-2 năm tới, không chỉ có Better Choice mà nhiều sáng kiến khác cũng sẽ được triển khai, tạo đòn bẩy cho việc thương mại hóa các sản phẩm nghiên cứu.
Gần đây Nvidia đã phối hợp thúc đẩy ngành AI trong nước thông qua việc xây dựng Nvidia Việt Nam với ngày 5/12 là ngày khai sinh, khẳng định vai trò của việc đẩy mạnh quan hệ đối tác này. Trong tương lai, Việt Nam mong chờ nhiều hơn nữa các cơ hội như vậy.
Cuối cùng, về phát triển nguồn nhân lực, PGS.TS Lê Hoàng Sơn chỉ ra sự cần thiết phải thay đổi căn bản trong phương thức làm việc của đội ngũ giảng viên đại học. Theo ông, các giảng viên cần vượt qua giới hạn trong thói quen làm việc với khách hàng, không chỉ dừng lại ở việc cung cấp công cụ giải quyết vấn đề mà phải chủ động thay đổi cách tiếp cận và phong cách làm việc để đáp ứng tốt hơn nhu cầu thực tiễn của thị trường, đồng thời tập trung vào việc đào tạo đội ngũ chuyên gia AI chất lượng cao cho tương lai.
PGS.TS Lê Hoàng Sơn kết luận rằng, mặc dù còn nhiều thách thức, việc phát triển V-VQA vẫn là một hướng đi đầy tiềm năng, đặc biệt trong bối cảnh Việt Nam đang đẩy mạnh ứng dụng AI trong nhiều lĩnh vực. Sự thành công của công nghệ này sẽ phụ thuộc vào khả năng giải quyết đồng bộ các thách thức về dữ liệu, kỹ thuật và ứng dụng, đồng thời tăng cường hợp tác giữa các bên liên quan trong hệ sinh thái AI của Việt Nam.
Một điều thú vị khi kết thúc hội thảo là, PGS. TS Lê Hoàng Sơn nhấn mạnh quan điểm về mối quan hệ giữa AI và con người. "AI không thể thay thế con người, nó chỉ tạo ra nhiều công việc mới và thú vị hơn. Chúng ta cần xác định rõ đâu là việc AI có thể làm và đâu là việc cần có sự tham gia của con người." ông khẳng định. Điều này được minh họa qua một video về cách AI đang tạo ra các vị trí việc làm mới như huấn luyện viên AI, kỹ sư machine learning, và chuyên gia đạo đức AI.
Hội thảo khép lại với phần thảo luận về các dự án tiềm năng, mở ra nhiều cơ hội hợp tác trong lĩnh vực V-VQA. Đây được xem là một bước tiến quan trọng trong nỗ lực phát triển công nghệ AI tại Việt Nam, hướng tới mục tiêu tạo ra các ứng dụng AI thực sự hữu ích cho cộng đồng, đặc biệt trong lĩnh vực xử lý ngôn ngữ tự nhiên và thị giác máy tính, mở ra nhiều cơ hội hợp tác mới trong lĩnh vực V-VQA giữa các tổ chức nghiên cứu và doanh nghiệp.
NỔI BẬT TRANG CHỦ
Google: Giải được bài toán 10 triệu tỷ tỷ năm chỉ trong 5 phút, chip lượng tử mới là bằng chứng về đa vũ trụ
Điều đáng ngạc nhiên hơn cả là nhiều người trên cộng đồng mạng thế giới lại đang đồng tình với kết luận của Google.
Gần 2025 rồi mà vẫn dùng USB để lưu công việc thì quả là lỗi thời