Tập đoàn Alibaba của Trung Quốc vừa ra mắt mô hình trí tuệ nhân tạo (AI) mới, được cho là có khả năng nhận diện cảm xúc con người thông qua video, với tham vọng vượt qua mô hình mới nhất của OpenAI.
Phòng thí nghiệm Thông Nghĩa (Tongyi) của Alibaba hôm thứ Ba (11/3) đã công bố mô hình R1-Omni dưới dạng mã nguồn mở. Đây được coi là mô hình ngôn ngữ đa phương thức toàn diện đầu tiên, ứng dụng kỹ thuật học tăng cường với phần thưởng có thể xác minh (RLVR) – một công nghệ hứa hẹn nâng cao khả năng suy luận và phân tích cảm xúc của AI.
Nhóm phát triển cho biết, họ đã sử dụng RLVR để tối ưu hoá mô hình mã nguồn mở HumanOmni 0.5B, giúp cải thiện đáng kể 3 yếu tố quan trọng, gồm khả năng suy luận, độ chính xác trong nhận diện cảm xúc và khả năng tổng quát hoá. Theo báo cáo, R1-Omni có thể hiểu rõ hơn cách thông tin thị giác và thính giác hỗ trợ việc nhận diện cảm xúc, đồng thời xác định rõ yếu tố nào đóng vai trò quan trọng hơn trong việc đánh giá từng loại cảm xúc.

Tập đoàn Alibaba của Trung Quốc vừa ra mắt mô hình trí tuệ nhân tạo (AI) mới - Ảnh: Bloomberg
Trong các video thử nghiệm, R1-Omni có thể xác định trạng thái cảm xúc của con người thông qua video, đồng thời mô tả trang phục và môi trường xung quanh nhân vật. Điều này đánh dấu một bước tiến lớn trong lĩnh vực thị giác máy tính.
Công nghệ nhận diện cảm xúc của AI đang dần trở thành một xu hướng quan trọng trong ngành công nghệ. Công nghệ này thường thấy qua các ứng dụng thực tế, như chatbot hỗ trợ khách hàng hay hệ thống giám sát, phát hiện dấu hiệu mệt mỏi của tài xế khi lái xe trên xe điện Tesla.
Với việc ra mắt mô hình R1-Omni, Alibaba đang tăng tốc trong cuộc đua AI và thách thức vị thể của OpenAI. Trong khi OpenAI ra mắt GPT-4.5 có khả năng nhận diện và phản hồi những tín hiệu tinh tế trong câu hỏi của người dùng, với mức giá lên tới 200 USD/tháng, Alibaba lại cung cấp R1-Omni hoàn toàn miễn phí trên nền tảng Hugging Face.
Mặc dù hiện tại R1-Omni mới chỉ nhận diện các cảm xúc cơ bản như “vui” hay “giận dữ”, nhưng theo CEO của Alibaba Ngô Dũng Minh, trí tuệ nhân tạo tổng quát (AGI) là mục tiêu hàng đầu của công ty, và phát triển trí tuệ cảm xúc cho AI chính là một bước tiến quan trọng.
NỔI BẬT TRANG CHỦ
Từ số 0 cho đến nghìn tỷ USD - Cơ hội 4.000 năm có một cho Việt Nam bước chân vào cuộc cách mạng AI và bán dẫn trên toàn cầu
Đó là nhận định của Tiến sĩ Christopher Nguyễn đưa ra tại Hội nghị Quốc tế về Trí tuệ nhân tạo và Bán dẫn AISC 2025 tại Việt Nam.
iPhone 17 Pro và iPhone 17 Pro Max sẽ có tản nhiệt giống điện thoại Android