OpenAI nâng cấp chức năng tạo hình ảnh cho ChatGPT, người dùng miễn phí cũng được sử dụng
Tuy vẫn mắc những sai lầm cố hữu, khả năng sản sinh hình ảnh của ChatGPT nay đã tốt hơn xưa rất nhiều.
- DeepSeek âm thầm ra mắt "cơn ác mộng thực sự" cho OpenAI: Mô hình AI mới miễn phí, chạy được ngay trên Mac Studio
- CEO OpenAI: công việc lập trình sẽ ít dần do AI, nhưng coder không biết dùng AI thì mất việc
- OpenAI tiếp tục nâng cấp: Sức mạnh vô đối, giá trên trời?
- ‘Quái kiệt’ người Việt tại Google chỉ ra lý do ChatGPT của Mỹ và DeepSeek của Trung Quốc có thể là ‘bệ đỡ’ cho Việt Nam tỏa sáng trong cuộc đua AI
- "Nên mua vàng tiếp hay bán vàng ra khi vàng vượt ngưỡng 100 triệu đồng/lượng?" - Grok 3 và ChatGPT trả lời sao?
Chatbot đã đổi khác nhiều trong những năm trở lại đây: từ chỗ sinh chữ đơn thuần, các chatbot nay đã có thể sản sinh hình ảnh.
Sau đợt cập nhật mới nhất , khả năng sinh hình của ChatGPT đã đạt tới tầm cao mới. OpenAI khẳng định công nghệ mới có thể giúp ChatGPT tạo ra những hình ảnh phức tạp, chi tiết và nay, chatbot có thể làm theo những chỉ dẫn khác thường của người dùng.
Ví dụ, trong một yêu cầu như tạo ra truyện tranh dạng 4 hình, hình nào cũng có nhân vật đang trò chuyện với nhau, ChatGPT đã có thể làm được ngay chứ không phải làm từng bước như trước. Những phiên bản tiền nhiệm cũng đã có thể sinh hình, tuy nhiên “độ tín” vẫn chưa cao và chưa thể phối hợp các khái niệm lại để cho ra kết quả có nghĩa.
Nhưng với công nghệ nền tảng mới là GPT-4o, ChatGPT nay đã có thể nhận và phản hồi lệnh bằng giọng nói, hình ảnh và video. Thậm chí, nó còn có thể phát âm thành câu hoàn chỉnh.

Một trang truyện tranh do ChatGPT sản sinh - Ảnh: NYT.
Phiên bản mới của ChatGPT, bên cạnh những cập nhật mà Google tạo ra cho Gemini hay xAI nâng cấp thêm cho Grok, là dấu hiệu cho thấy dấu hiệu của những thay đổi lớn trong ngành trí tuệ nhân tạo. Khởi đầu là các hệ thống chỉ tạo văn bản, chatbot đang dần biến đổi thành các công cụ kết hợp trò chuyện với nhiều khả năng khác.
“Đây là một loại công nghệ hoàn toàn mới”, Gabriel Goh, một nhà nghiên cứu tại OpenAI, cho biết. “Chúng tôi không tách biệt việc tạo hình ảnh và tạo văn bản. Chúng tôi muốn thực hiện tất cả tác vụ một lúc”.
Trước đây, các trình tạo hình ảnh bằng AI thường gặp khó khăn trong việc tạo ra những hình ảnh khác biệt rõ rệt so với những hình ảnh, khái niệm đã được khẳng định. Chẳng hạn, nếu bạn yêu cầu một trình tạo hình ảnh tạo ra một chiếc xe đạp với bánh xe hình tam giác, nó sẽ gặp khó khăn.
Ông Goh cho biết phiên bản ChatGPT mới có thể xử lý những yêu cầu khác thường như vậy.

Khái niệm về một chiếc xe đạp có bánh hình tam giác đã từng làm khó ChatGPT phiên bản cũ - Ảnh: OpenAI.
Phiên bản mới của ChatGPT sẽ xuất hiện trên cả bản miễn phí và trả phí - là hai bản ChatGPT Plus (20 USD/tháng) và ChatGPT Pro (200 USD/tháng).
Tuy nhiên, khả năng của ChatGPT phiên bản mới vẫn còn đôi chút hạn chế. Trường hợp "bịa" thông tin vẫn diễn ra, công tác sinh chữ nằm ngoài bảng ký tự Latin vẫn chưa tốt. Bên cạnh đó, nó chưa thể sinh ra hình ảnh chính xác khi phải cùng lúc thực hiện 10-20 khái niệm; ví dụ về bảng tuần hoàn các nguyên tố hóa học sau đây chỉ ra điều đó.

Bảng tuần hoàn hóa học chưa thể đúng được hết - Ảnh: OpenAI.
Trong tương lai, OpenAI sẽ cố gắng khắc phục những nhược điểm này.
NỔI BẬT TRANG CHỦ
Tiến sĩ tâm lý học giải thích hiệu ứng "chối ác": Những người trông có vẻ tự tin, không bao giờ thừa nhận mình sai, não bộ họ sẽ tự bóp méo thực tại để bảo vệ cái tôi yếu đuối của mình
Một số người có cái tôi mong manh, lòng tự trọng dễ vỡ và "cấu tạo tâm lý" yếu ớt đến mức việc thừa nhận mình đã sai về cơ bản là quá sức chịu đựng với sự yếu đuối của họ.
Livestream triệu người xem: Streamer có thể kiếm được bao nhiêu tiền chỉ trong vài giờ trên TikTok?