Bàn luận chủ đề “dữ liệu có thật sự quan trọng với mô hình AI” cùng bộ óc thiên tài Andrew Ng
Thiên tài trí tuệ nhân tạo (AI), đồng sáng lập Google Brain và Coursera lần đầu tiên trực tiếp chia sẻ kinh nghiệm tại Việt Nam qua chương trình Data-Centric Go Back To Basics tổ chức ngày 02.12 tới.
Andrew Ng - đồng sáng lập Google Brain, Coursera và Learning AI
Chuyên gia đầu ngành Andrew Ng - người sáng lập Google Brain, Coursera và Learning AI cùng Huyền Chip - giảng viên kiêm nhiệm tại Đại học Stanford (Hoa Kỳ), và Lynn He - chuyên gia nghiên cứu tại DeepLearning.ai sẽ chia sẻ cùng độc giả Việt Nam xoay quanh câu chuyện dữ liệu đặc biệt.
Dữ liệu và xử lý dữ liệu vốn là một đề tài nóng bỏng trong việc xây dựng, phát triển AI. Để dạy cho AI thông minh hơn, người nghiên cứu cần thực hiện hai bước: chuẩn bị dữ liệu dạy AI và xây dựng mô hình, thuật toán để AI áp dụng vào học dữ liệu. Lý giải đơn giản hơn, nếu coi dữ liệu tương đương với cuốn sách thì mô hình, thuật toán là cách đọc sách sao cho hiệu quả.
Trong nỗ lực phát triển AI, các nhà khoa học chia thành hai hướng. Một bên, họ tập trung xây dựng mô hình thuật toán, dựa trên tập dữ liệu cố định và cải thiện thuật toán cho đến khi ra kết quả. Cách làm này tuy đưa ra được mô hình tối ưu trong từng trường hợp, nhưng khó đảm bảo được chất lượng vì sử dụng nguồn dữ liệu thô có lẫn dữ liệu chất lượng thấp hoặc không phù hợp, gây lãng phí tài nguyên khi phải thử nhiều lần, ra nhiều biến thể kết quả.
Theo chia sẻ của ông Andrew, một khảo sát gần đây có đến 99% nhà khoa học máy tính trả lời họ tập trung xây dựng mô hình, thuật toán và chỉ 1% ưu tiên chất lượng của dữ liệu. Bài toán AI càng khó hơn khi lượng dữ liệu đầu vào quá lớn, trong thời đại bùng nổ về Dữ liệu Lớn (Big Data). Ông cũng chỉ ra các kết quả sai có thể lặp đi lặp lại đến 92% nếu sử dụng cách làm tập trung vào thuật toán, và hoàn toàn có thể tránh được.
Từ những quan sát này, Andrew Ng đã tập trung nghiên cứu và nâng cao nhận thức về cách xây dựng AI mà ưu tiên tối ưu chất lượng dữ liệu, trên một thuật toán, mô hình cố định."Dữ liệu là đồ ăn cho AI" ông từng trả lời phỏng vấn, nhấn mạnh tầm quan trọng của dữ liệu trong chất lượng AI.
Các chuyên gia tham dự chương trình Data-Centric Go Back To Basics
Với cách làm này, ông dễ dàng sử dụng 10.000 bản ghi dữ liệu tốt để huấn luyện AI ra kết quả mong muốn, thay vì dùng đến 1 triệu dữ liệu thô hỗn tạp. Không chỉ tiết kiệm thời gian, nguồn lực đáng kể, cách này tạo điều kiện thuận lợi cho doanh nghiệp thường có sẵn đội ngũ xử lý dữ liệu và không có chuyên môn AI, Học Máy. Cứ 3 doanh nghiệp thì có 1 bên không thường xuyên cập nhật, thay đổi thuật toán tối ưu - theo nghiên cứu gần đây của InRule Technology.
"Bằng cách tập trung vào dữ liệu," ông Andrew phân tích, "chúng ta mở đường cho nhân viên nhà máy, bệnh viện, nông trại có thể điều chỉnh dữ liệu, giúp những người không được đào tạo về AI cũng có thể dễ dàng tiếp cận sử dụng và nhập dữ liệu vào một mô hình mở." Ngược lại, điều này góp phần phát triển AI, tiến tới thống nhất hệ thống phân loại, dán nhãn dữ liệu theo nhu cầu thực tế của các ngành.
Với những kết quả nghiên cứu và ứng dụng xuất sắc, Andrew Ng cùng các cộng sự tiếp tục kiếm các giá trị tồn tại lâu dài của dữ liệu, cũng như những thách thức khi chuyển dịch từ tập trung mô hình, thuật toán sang tập trung vào dữ liệu. Đây cũng chính là các vấn đề sẽ được các chuyên gia thảo luận trong chương trình hội thảo sắp tới.
Andrew Ng được mệnh danh là thiên tài Học Sâu trong phát triển Trí thông minh Nhân tạo. Bên cạnh thành công của Google Brain, Coursera, ông từng dẫn dắt Bộ phận Nghiên cứu AI tại Tập đoàn Baidu. Ông tiên phong trong việc phổ cập kiến thức về AI, với khóa học Máy Học trên Coursera đạt 4,5 triệu người học. Ông cũng là giáo sư kiêm nhiệm và nguyên là Giám đốc Phòng nghiên cứu AI tại Đại học Stanford tại Hoa Kỳ, trường đại học hàng đầu thế giới về AI..
Hội thảo Tech Innovators #5: Data Centric - Go back to basics (Tạm dịch: Dữ liệu - Trở về với căn bản) do FPT Software tổ chức từ 9:30 - 11:00 sáng Thứ Năm, ngày 02.12.2021, phát sóng trực tiếp trên Facebook của FPT Software. Khán giả tham dự có cơ hội được trao đổi trực tiếp với Andrew Ng và các khách mời, qua đăng ký tại bit.ly/Register_TechInnovators5. Chương trình nằm trong chuỗi sự kiện dành riêng cho cộng đồng công nghệ, nhằm góp phần xây dựng cộng đồng CNTT Việt, đưa tài năng Việt đến gần hơn với các chuyên gia đẳng cấp thế giới.
NỔI BẬT TRANG CHỦ
iPhone 14 Pro Max phát nổ khiến người dùng bị thương
Vụ việc đang tiếp tục được điều tra, làm rõ.
Tại sao nhân loại lại cần đến máy tính lượng tử, chúng được dùng để làm gì?