Apple dùng AI của Google để vá lỗ hổng lớn nhất trên iPhone - đây là cách hoạt động

Tại WWDC 2026, Apple lần đầu tiên giải thích chi tiết kiến trúc bên trong Apple Intelligence mới - và câu trả lời thú vị hơn nhiều so với một thông báo hợp tác thông thường.

Khi Apple và Google thông báo hợp tác AI hồi tháng 1/2026, nhiều người nghĩ đây chỉ là một thỏa thuận kinh doanh thông thường. Tại WWDC 2026 hôm nay, Apple mới giải thích đầy đủ cơ chế bên trong - và nó phức tạp hơn, nhưng cũng thú vị hơn, những gì người ta tưởng.

Apple dùng AI của Google để vá lỗ hổng lớn nhất trên iPhone - đây là cách hoạt động - Ảnh 1.

Tại sao Apple cần Google?

Câu trả lời ngắn gọn: Apple tự build AI và nó không đủ mạnh.

Mô hình AI trên đám mây mà Apple tự phát triển có khoảng 150 tỷ tham số - con số nghe lớn, nhưng trong thế giới AI 2026, đó là mức trung bình. Mô hình Gemini tùy chỉnh mà Google xây riêng cho Apple có 1,2 nghìn tỷ tham số - lớn hơn 8 lần. Khoảng cách này giải thích tại sao Siri liên tục tụt hậu so với ChatGPT và Gemini trong những năm qua, dù Apple đã đổ rất nhiều tiền và nhân lực vào đó.

Trong tuyên bố chung công bố ngày 12/1/2026, chính Apple thừa nhận: "Sau khi đánh giá cẩn thận, chúng tôi xác định công nghệ của Google cung cấp nền tảng có năng lực nhất cho Apple Foundation Models". Đây là một phát biểu hiếm gặp từ một công ty nổi tiếng với văn hóa tự làm mọi thứ.

Theo Bloomberg, Apple trả cho Google khoảng 1 tỷ USD mỗi năm cho thỏa thuận này - con số Apple và Google chưa xác nhận chính thức. Để so sánh: Google hiện trả Apple khoảng 20 tỷ USD mỗi năm để làm công cụ tìm kiếm mặc định trên Safari. Giờ dòng tiền đổi chiều một phần.

Apple dùng AI của Google để vá lỗ hổng lớn nhất trên iPhone - đây là cách hoạt động - Ảnh 2.

Sơ đồ kiến trúc 3 tầng xử lý Apple Intelligence tại WWDC 2026, từ on-device đến Private Cloud Compute đến Google Cloud

Câu hỏi bạn hỏi Siri đi đến đâu?

Đây là phần Apple giải thích lần đầu tiên hôm nay, và nó hoạt động theo 3 tầng tùy độ phức tạp của câu hỏi.

Tầng 1 là thiết bị của bạn. Những yêu cầu đơn giản - hẹn báo thức, bật nhạc, điều khiển nhà thông minh - được xử lý hoàn toàn trên iPhone bằng mô hình khoảng 3 tỷ tham số của Apple. Không có dữ liệu nào rời khỏi máy.

Tầng 2 là cụm máy chủ riêng của Apple gọi là Private Cloud Compute. Những câu hỏi phức tạp hơn - tóm tắt email, phân tích tài liệu - sẽ được chuyển lên đây. Máy chủ này dùng chip Apple Silicon, được thiết kế để xóa dữ liệu ngay sau khi xử lý xong, ngay cả nhân viên Apple cũng không thể truy cập nội dung câu hỏi của bạn.

Tầng 3 là Google Cloud. Những tác vụ đòi hỏi lý luận phức tạp nhất - câu hỏi nhiều bước, tổng hợp thông tin từ nhiều nguồn, tạo ảnh chất lượng cao - sẽ được đẩy lên đây, nơi chạy trên chip GPU Nvidia Blackwell B200 của Google. Đây là tầng dùng đến mô hình 1,2 nghìn tỷ tham số.

Lý do phải dùng đến tầng 3 không phải vì Apple không muốn tự xử lý: theo The Information, Apple đã thử chạy mô hình nghìn tỷ tham số trên Private Cloud Compute của mình nhưng tốc độ quá chậm, không đáp ứng được yêu cầu phản hồi nhanh của Siri ở quy mô hàng tỷ người dùng.

Apple dùng AI của Google để vá lỗ hổng lớn nhất trên iPhone - đây là cách hoạt động - Ảnh 3.

GPU Nvidia Blackwell B200 - phần cứng xử lý tầng cao nhất của Siri mới trên hạ tầng Google Cloud

Vậy quyền riêng tư thì sao?

Đây là câu hỏi rõ ràng nhất khi biết dữ liệu có thể chạm đến máy chủ Google.

Apple cho biết trước khi bất kỳ dữ liệu nào chuyển lên Google Cloud, hệ thống sẽ xóa mọi thông tin nhận dạng - tách khỏi Apple ID, mã hóa nội dung. Hợp đồng với Google cũng ràng buộc Google không được dùng các câu hỏi của người dùng Apple để huấn luyện mô hình Gemini trong tương lai.

Craig Federighi, Phó Chủ tịch Cấp cao phụ trách Kỹ thuật Phần mềm của Apple, cũng dùng WWDC để nhân cơ hội nhắm vào các đối thủ: "Một số người dường như đang lao về phía trước, có vẻ theo đuổi AI vì lợi ích của AI, mà không thực sự quan tâm đến người dùng - những người AI cuối cùng phải phục vụ". Câu này khá rõ nhắm vào ai.

Một chi tiết kỹ thuật thú vị khiến thỏa thuận này khả thi về mặt kinh tế: mô hình 1,2 nghìn tỷ tham số dùng kiến trúc "mixture-of-experts" - thay vì kích hoạt toàn bộ mô hình cho mọi câu hỏi, hệ thống chỉ kích hoạt phần nhỏ liên quan đến từng yêu cầu cụ thể. Kết quả là Apple có được năng lực của một mô hình khổng lồ nhưng chi phí vận hành thực tế gần với mô hình nhỏ hơn nhiều.

Hai phiên bản on-device - và thiết bị nào được hưởng?

Hôm nay Apple cũng xác nhận có hai phiên bản mô hình chạy trực tiếp trên thiết bị. Phiên bản tiêu chuẩn chạy trên mọi thiết bị hỗ trợ Apple Intelligence. Phiên bản nâng cao - có thêm khả năng hiểu và tạo ra giọng nói, nhận diện hình ảnh phức tạp hơn, đọc chính tả chính xác hơn - chỉ chạy trên các thiết bị có chip Apple Silicon cao cấp hơn. Apple chưa liệt kê danh sách cụ thể thiết bị nào thuộc nhóm được phiên bản nâng cao.

Điều gì thực sự thay đổi với người dùng?

Trên giấy tờ, kiến trúc mới này cho phép Siri làm được nhiều thứ mà trước đây không thể: tạo ảnh thực tế, chỉnh sửa ảnh theo yêu cầu mô tả bằng lời, trả lời câu hỏi về nội dung hình ảnh, tổng hợp thông tin từ nhiều ứng dụng cùng lúc, và tạo giọng nói tự nhiên hơn đáng kể.

Nhưng bài kiểm tra thực sự chưa đến. Apple Intelligence mới với Gemini dự kiến triển khai theo giai đoạn từ tháng 9/2026 cùng iOS 27 - và đây là lần thứ tư Apple đặt cột mốc cho Siri thế hệ mới sau nhiều lần trì hoãn kể từ WWDC 2024. Developer beta của iOS 27 đã có mặt ngay hôm nay, và cộng đồng nhà phát triển sẽ là nhóm đầu tiên thực sự kiểm chứng liệu kiến trúc 3 tầng này hoạt động đúng như Apple hứa hay không.

Tin cùng chuyên mục
Xem theo ngày

NỔI BẬT TRANG CHỦ