Năm 2024, một câu hỏi đơn giản lan truyền khắp mạng xã hội khiến ChatGPT liên tục trả lời sai. Thay vì âm thầm vá lỗi, OpenAI làm điều không ai ngờ tới: biến chính câu hỏi đó thành tên bí danh cho dự án quan trọng nhất trong lịch sử công ty.
Giữa năm 2024, một thử thách nhỏ bắt đầu lan truyền trên mạng xã hội: hỏi ChatGPT "có bao nhiêu chữ r trong từ strawberry?" Câu trả lời đúng là 3. ChatGPT trả lời: 2. Không phải một lần, không phải do nhầm lẫn ngẫu nhiên - mà nhất quán, tự tin, lần nào cũng sai theo cùng một cách.
Bài đăng viral, cộng đồng tech châm biếm. Một AI có thể viết luận văn tiến sĩ, giải đề thi đại học, lập trình ứng dụng - nhưng lại đếm sai chữ cái trong một từ mà học sinh tiểu học biết ngay. Điều gì đang xảy ra?

Vấn đề không phải là AI "ngu" - mà là AI không nhìn thấy chữ cái
Để hiểu tại sao, cần biết cách AI đọc văn bản. Không giống con người đọc từng chữ cái, các mô hình ngôn ngữ lớn như ChatGPT không xử lý ký tự riêng lẻ. Thay vào đó, văn bản được chia thành các "token" - những khối ngôn ngữ lớn hơn ký tự, thường là từ, tiền tố, hậu tố, hoặc các cụm âm tiết phổ biến.
Với GPT-4, từ "strawberry" không phải là 10 chữ cái s-t-r-a-w-b-e-r-r-y. Nó là 3 token: str + aw + berry. Ba con số nguyên. Trong ba khối đó, chỉ có str và berry chứa chữ r - vì vậy AI đếm được 2.

Đây không phải lỗi có thể vá bằng một bản cập nhật đơn giản. Đây là hệ quả kiến trúc - AI không được xây để nhìn thấy từng ký tự. Nó được xây để hiểu nghĩa, không phải để phân tích chính tả.
Dự án bí mật mang tên một quả dâu tây
Tháng 11/2023, một sự kiện chấn động ngành công nghệ: Sam Altman bị sa thải khỏi OpenAI. Trong nhiều ngày hỗn loạn sau đó, tin đồn lan ra về một dự án AI bí mật tên "Q*" - được cho là đã đạt đột phá quan trọng về khả năng lý luận toán học.
Tám tháng sau, tháng 7/2024, Reuters xác nhận OpenAI đang phát triển một model mới với bí danh nội bộ là "Strawberry". Bí danh Q* và Strawberry là một.
Và cái tên Strawberry không phải ngẫu nhiên. Theo xác nhận từ phía OpenAI sau này, đây là tuyên ngôn nội bộ: đội ngũ đang xây một model cuối cùng sẽ làm được điều mà các model trước không làm được - đếm đúng số chữ r trong "strawberry". Khi o1 ra mắt tháng 9/2024, OpenAI thậm chí đưa câu hỏi strawberry vào danh sách gợi ý ngay trên giao diện như một lời thách thức công khai với chính sản phẩm cũ của mình.
O1 không sửa cách tokenization hoạt động. Thay vào đó, model được huấn luyện để "suy nghĩ thành tiếng" trước khi trả lời - kỹ thuật gọi là chain-of-thought reasoning (suy luận từng bước). Thay vì trả lời ngay lập tức, o1 tự nhẩm: tách từng chữ cái ra, đếm từng bước, kiểm tra lại. Kết quả: 3. Đúng.
Nhưng cách làm này có giá. O1 cần 20-30 giây để trả lời một câu hỏi mà GPT-4o xử lý trong chưa đầy 3 giây. Chi phí API của o1 cao gấp nhiều lần các model thông thường. OpenAI giải thích đây là model cho "tác vụ phức tạp" - không phải thay thế GPT-4o.
Phần tiếp theo của câu chuyện ít ai kể
Tháng 12/2025, OpenAI ra mắt GPT-5.2. Khi được hỏi câu hỏi cũ, model mới nhất của OpenAI trả lời: 2. Lại sai theo cùng một cách.
GPT-5.x sử dụng tokenization scheme mới hơn tên o200k_harmony, nhưng "strawberry" vẫn bị tách thành str + aw + berry. Chain-of-thought reasoning của o1 không được đưa vào dòng GPT-5.x vì trade-off rõ ràng: tốc độ phản hồi và chi phí. Người dùng ChatGPT thông thường không muốn chờ 30 giây cho mỗi câu trả lời.
Tính tới thời điểm hiện tại, GPT-5.3 và GPT5.4, những model mới nhất của OpenAI tính đến tháng 4/2026 đã khắc phục phần nào vấn đề này. Trong khi đó, Claude, Gemini, Grok và Perplexity đều rất ít khi trả lời sai từ trước tới nay vì dùng tokenization khác.
O1-preview và o1-mini đã bị deprecated từ tháng 4/2025. Nhưng inside joke mà cái tên "Strawberry" mang theo vẫn chưa có hồi kết.
Có lẽ điều thú vị nhất trong toàn bộ câu chuyện này không phải là kỹ thuật, không phải là o1 giải được bài toán. Mà là cách một đội ngũ gồm hàng nghìn kỹ sư, nhà nghiên cứu và nhà khoa học hàng đầu thế giới chọn đặt tên cho dự án quan trọng nhất của mình - theo đúng điều họ chưa làm được, như một lời nhắc nhở tự đặt ra cho chính mình.
Trong ngành công nghệ nơi mỗi sản phẩm mới đều được quảng bá với những tính từ hoa mỹ, "Strawberry" là cái tên đặc biệt trung thực một cách hiếm gặp.
NỔI BẬT TRANG CHỦ
-
"Thiên tài AI" Sam Altman qua lời đồng nghiệp: Gần như không biết code, hiểu sai các khái niệm học máy cơ bản
Một bài điều tra từ The New Yorker hé lộ những góc nhìn trái chiều từ nội bộ OpenAI, khi một số nhân sự cho rằng Sam Altman không mạnh về kỹ thuật như hình ảnh công chúng, đồng thời đặt ra nhiều câu hỏi về cách ông điều hành công ty AI hàng đầu thế giới.
-
Anthropic có một AI mạnh đến mức không dám công khai: từng trốn khỏi sandbox, tự xóa dấu vết, tự tìm lỗ hổng 27 năm tuổi