OpenAI ra mắt GPT-5.4, mô hình AI mới với khả năng vượt trội cho công việc chuyên nghiệp

Max, Thanh Niên Việt 

OpenAI vừa chính thức phát hành GPT-5.4, mô hình nền tảng mới mạnh mẽ và hiệu quả nhất của hãng, tối ưu cho các tác vụ chuyên môn và doanh nghiệp.

Vào thứ Năm, OpenAI đã chính thức công bố GPT-5.4, một mô hình nền tảng mới được giới thiệu là "mạnh mẽ và hiệu quả nhất cho công việc chuyên nghiệp". Bên cạnh phiên bản tiêu chuẩn, GPT-5.4 còn có sẵn dưới dạng mô hình suy luận (GPT-5.4 Thinking) hoặc được tối ưu hóa cho hiệu suất cao (GPT-5.4 Pro), đáp ứng đa dạng nhu cầu của người dùng doanh nghiệp và chuyên gia.

Phiên bản API của mô hình này sẽ hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token, đây là cửa sổ ngữ cảnh lớn nhất mà OpenAI từng cung cấp. Điều này cho phép mô hình xử lý lượng thông tin khổng lồ trong một lần, mở ra nhiều khả năng mới cho các ứng dụng phức tạp. OpenAI cũng nhấn mạnh vào việc cải thiện hiệu quả sử dụng token, khẳng định GPT-5.4 có thể giải quyết cùng một vấn đề với số lượng token ít hơn đáng kể so với phiên bản tiền nhiệm.

GPT-5.4 mang lại kết quả điểm chuẩn được cải thiện đáng kể, bao gồm các điểm số kỷ lục trong các bài kiểm tra sử dụng máy tính như OSWorld-Verified và WebArena Verified. Mô hình mới cũng đạt 83% điểm kỷ lục trong bài kiểm tra GDPval của OpenAI dành cho các tác vụ công việc tri thức. Theo tuyên bố từ CEO Brendan Foody của Mercor, GPT-5.4 còn dẫn đầu trong điểm chuẩn APEX-Agents của Mercor, được thiết kế để kiểm tra các kỹ năng chuyên môn trong lĩnh vực luật và tài chính.

Ông Foody cho biết: "GPT-5.4 vượt trội trong việc tạo ra các sản phẩm yêu cầu phạm vi dài hạn như bộ slide, mô hình tài chính và phân tích pháp lý, mang lại hiệu suất hàng đầu trong khi hoạt động nhanh hơn và với chi phí thấp hơn so với các mô hình tiên tiến cạnh tranh khác."

OpenAI ra mắt GPT-5.4, mô hình AI mới với khả năng vượt trội cho công việc chuyên nghiệp- Ảnh 1.

OpenAI cho biết GPT-5.4 ít khả năng mắc lỗi trong các tuyên bố riêng lẻ hơn 33% so với GPT-5.2, và các phản hồi tổng thể ít khả năng chứa lỗi hơn 18%.

Trong đợt ra mắt này, OpenAI cũng đã tái cấu trúc cách phiên bản API của GPT-5.4 quản lý việc gọi công cụ, giới thiệu một hệ thống mới có tên là Tìm kiếm Công cụ (Tool Search). Trước đây, các lời nhắc hệ thống sẽ đưa ra định nghĩa cho tất cả các công cụ có sẵn khi gọi mô hình, một quá trình có thể tiêu thụ nhiều token khi số lượng công cụ tăng lên. Hệ thống mới cho phép mô hình tra cứu định nghĩa công cụ khi cần, giúp các yêu cầu nhanh hơn và rẻ hơn trong các hệ thống có nhiều công cụ.

OpenAI cũng đã triển khai một đánh giá an toàn mới để kiểm tra "chuỗi suy nghĩ" (chain-of-thought) của mô hình, tức là các bình luận liên tục do mô hình đưa ra để thể hiện quá trình tư duy qua các tác vụ đa bước. Các nhà nghiên cứu an toàn AI từ lâu đã lo ngại rằng các mô hình suy luận có thể xuyên tạc chuỗi suy nghĩ của chúng, và các thử nghiệm cho thấy điều này có thể xảy ra trong những trường hợp nhất định. Đánh giá mới của OpenAI cho thấy khả năng lừa dối ít xảy ra hơn trong phiên bản Thinking của GPT-5.4, "cho thấy mô hình thiếu khả năng che giấu suy luận của mình và rằng việc giám sát CoT vẫn là một công cụ an toàn hiệu quả."

https://genk.vn/openai-ra-mat-gpt-54-mo-hinh-ai-moi-voi-kha-nang-vuot-troi-cho-cong-viec-chuyen-nghiep-165260903062436521.chn
Tin cùng chuyên mục
Xem theo ngày

NỔI BẬT TRANG CHỦ