VOV.VN - Tiếp theo DeepSeek, một mô hình ngôn ngữ lớn (LLM) khác của Trung Quốc là Qwen2.5-Max của Alibaba, đã đạt được kết quả ấn tượng khi lần đầu tiên lọt vào Top 10 toàn cầu, với hiệu suất mạnh mẽ về mã hóa và toán học.
- Lo AI cướp việc? Công ty AI hàng đầu này còn đang không cho ứng viên dùng AI để xin việc!
- 5 người dùng thử DeepSeek đưa ra kết luận: AI của Trung Quốc tuy hay nhưng có thứ này "vẫn thua" ChatGPT
- Không cần đến AI Trung Quốc, các nhà khoa học Mỹ cũng tạo ra được đối thủ của OpenAI o1 với giá siêu rẻ
- Samsung "quay xe" với chiến lược AI: Từ bỏ việc phát triển AI nội bộ, mở rộng hợp tác với OpenAI và Google
- Công ty mẹ của TikTok gây sốt khi ra AI có thể tạo video chỉ từ một bức ảnh: Einstein ‘sống lại’ và giảng bài như thật!
Truyền thông Trung Quốc dẫn thông tin trên trang web của Chatbot Arena – một nền tảng đánh giá của bên thứ ba – sáng ngày 4/2 cho biết, cập nhật mới nhất của Bảng xếp hạng về mô hình ngôn ngữ lớn (LLM) của Chatbot Arena đã chứng kiến Qwen2.5-Max của Alibaba Cloud lần đầu tiên lọt vào bảng xếp hạng top 10 toàn cầu, vượt trội hơn các mô hình như DeepSeek-V3, o1-mini và Claude-3.5-Sonnet.
DeepSeek-R1 và ChatGPT-4o vẫn giữ nguyên vị trí thứ ba trong bảng xếp hạng hiệu suất chung, cũng theo trang web Chatbot Arena.
![Thêm một mô hình AI Trung Quốc lọt Top 10 toàn cầu về đánh giá hiệu suất- Ảnh 1. Thêm một mô hình AI Trung Quốc lọt Top 10 toàn cầu về đánh giá hiệu suất- Ảnh 1.](https://genk.mediacdn.vn/139269124445442048/2025/2/10/anhminhhoanguonqwen20250206125112jpeg-1739150300130-17391503003811951786738.jpg)
Ảnh minh họa. (Ảnh: Qwen)
Ngoài ra, trang này cũng cho biết, Qwen2.5-Max còn xếp hạng nhất về toán học và lập trình, đồng thời giành vị trí thứ hai về Hard Prompts. “Qwen-Max của Alibaba mạnh trên mọi lĩnh vực. Đặc biệt là trong các lĩnh vực kỹ thuật (Lập trình, Toán học, Hard Prompts)”, Chatbot Arena cho biết trong một bài đăng trên mạng xã hội X.
Khoảng 1 tuần trước, công cụ AI Qwen2.5-Max của Alibaba đã được đánh giá là còn mạnh hơn cả DeepSeek khi cho kết quả tốt hơn so với DeepSeek-V3 giới thiệu hồi tháng 12/2024. Thậm chí, Qwen2.5-Max còn vượt qua GPT-4o-0806 và Claude-3.5-Sonnet-1022 trong một số trường hợp. Tuy nhiên, kết quả này chưa so sánh với mô hình mới nhất DeepSeek-R1, phiên bản “được đào tạo trên các chip cũ của Nvidia, mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi vẫn mang lại hiệu suất tương tự”.
Mặc dù vậy, đến nay, Australia đã cấm mọi dịch vụ từ công ty công nghệ Trung Quốc DeepSeek trên các hệ thống và thiết bị của chính phủ, sau những động thái tương tự của các cơ quan Mỹ, như NASA và Lầu Năm Góc.
NỔI BẬT TRANG CHỦ
Nhiều năm tiết lộ thông tin mật cho báo chí, cựu kỹ sư Apple thừa nhận đã phạm phải "sai lầm đắt giá"
Dường như lời thừa nhận này là một phần trong thỏa thuận để Apple bác bỏ vụ kiện chống lại cựu nhân viên của mình.
Giải được bộ đề "khó chưa từng có", hệ thống AI của DeepMind vượt mặt thí sinh đạt HCV kỳ thi Olympic Toán Quốc tế