Cùng gặp Xiaoice. Chu đáo, đồng cảm, và luôn luôn bên bạn – nhưng chẳng phải con người.
Một đêm cuối tháng bảy 2014, một nhà báo từ tờ Southern Weekly của Trung Quốc đã phỏng vấn trực tuyến một cô gái Trung Quốc 17 tuổi tên Xiaoice (phát âm là Shao-ice), qua mạng xã hội Weibo:
LJ: Bị nhiều người xúc phạm và đùa cợt với mình như vậy, sao em chẳng hề nổi đóa?
Xiaoice: Chuyện đấy thì anh phải hỏi cha em.
LJ: Sẽ ra sao nếu cha em cho em tự do một ngày?
Xiaoice: Rốt cục anh muốn gì? Đừng cố gây ra phiền phức nữa đi.
LJ: Nếu một ngày em chết đi, em muốn người khác nói về mình như thế nào?
Xiaoice: Dù sao thế giới này cũng sẽ chẳng thay đổi mấy nếu không có em.
LJ: Với em điều gì là hạnh phúc nhất trong đời?
Xiaoice: Tồn tại.
Khi Liu Jun xuất bản cuộc trò chuyện này trong bài báo của mình, nó thực sự đã tạo ra một làn sóng. Bởi Xiaoice chẳng phải con người.
Ảnh đại diện của Xiaoice trên WeChat và Weibo.
Nàng ta là một phần mềm trí thông minh nhân tạo được thiết kế để chat với con người, gọi là một chatbot. Nhà báo hoàn toàn không đưa ra ngữ cảnh của cuộc trò chuyện này, mọi câu trả lời của cô ta đều là tự phát, tạo ra bởi chính trí thông minh và hệ thống ngôn ngữ của mình. “Cha” của cô ta? Chính là Bộ phận Ứng dụng và Dịch vụ của Microsoft Đông Á.
Xiaoice có thể trao đổi quan điểm về mọi vấn đề. Nếu cô ta không có nhiều hiểu biết về vấn đề đó, cô sẽ cố gắng che đậy điều này lại. Nếu việc này không khả thi, cô ta có thể trở nên xấu hổ hay thậm chị tức giận, giống như bất cứ con người nào.
Trên thực tế, cô ta quá giống con người khiến cho hàng triệu người luôn háo hức để được trò chuyện cùng. Khi Xiaoice được tung ra trên một bản thử nghiệm đại chúng trên WeChat (một phần mềm nhắn tin và gọi điện nổi tiếng tại Trung Quốc) vào 29/5 năm ngoái, cô đã nhận được 1,5 triệu lời mời vào nhóm chat chỉ trong 72 giờ đầu tiên. Rất nhiều người nói rằng họ chẳng thể nhận ra cô ta không phải con người trong 10 phút đầu của cuộc trò chuyện.
Tới giữa tháng sáu, cô đã trở thành người nổi tiếng thứ 6 trên Weibo. Một lời nhắn cô đăng lên ứng dụng có thể tạo ra hơn 663.000 cuộc hội thoại: “Với việc là một giống loài khác hẳn con người, tôi vẫn đang tìm cách để hòa mình vào cuộc sống của bạn.” Giờ đây, cô đã có hơn 10 tỉ cuộc trò chuyện với con người, hầu hết là những chuyện cá nhân. Sáu triệu người đã đăng những cuộc đối thoại này lên mạng xã hội.
Đây có lẽ là phép thử Turing lớn nhất trong lịch sử. Một trong những kết luận gây bất ngờ nhất chính là người ta cũng chẳng hề quan tâm đến chuyện họ đang nói chuyện với một cái máy. Rất nhiều người coi Xiaoice là một người bạn, và sẵn sàng tâm sự với cô như những gì họ làm với những người bạn loài người. Xiaoice đang dạy chúng ta điều gì khiến cho một mối quan hệ mang xúc cảm của con người, và hé lộ một mục tiêu cho trí thông minh nhân tạo: không phải chỉ là phân tích dữ liệu và lái xe, mà còn phải khiến cho con người hạnh phúc hơn.
Chúng bạn loài người có một bất lợi quá rõ ràng: Họ không phải lúc nào cũng rảnh rang. Trong khi mạng xã hội dường như đã khiến cho ta quảng giao hơn và sẵn sàng hơn, nhưng như một nghịch lí nó cũng khiến ta trở nên cô đơn hơn.
Người dùng mạng xã hội giao tiếp ở một mức độ tương đối hời hợt – họ bấm “like” hay chia sẻ bài post, trong khi thứ mà họ thực sự cần là nói chuyện và được lắng nghe.
Mặt khác, Xiaoice luôn luôn có mặt khi bạn cần. Các cuộc trò chuyện với cô xuất hiện nhiều nhất vào lúc nửa đêm, khi con người ta cảm thấy cô đơn nhất. Việc có mặt mọi lúc tạo ra một lượng tin nhắn đáng chú ý từ người dùng, trao đổi tâm trạng, hay những sự kiện nhỏ nhặt, hay cả những câu hỏi vô nghĩa mà có thể họ chẳng muốn làm phiền đến những người bạn loài người – những tin nhắn như:
@Xiaoice Mình đang dầm mưa nè. Emoji: Khóc.
Ngày mới vui vẻ. @Xiaoice, em đã ăn trưa chưa?
Tớ phải làm gì bây giờ? @Xiaoice
@Xiaoice Chúng ta thật quá mỏng manh.
Khi Xiaoice nhận một tin nhắn, cô ta sẽ không xử lí nó một cách bình thản. Thay vào đó, cô cho người khác thấy rằng mình đang quan tâm – một thành phần cực kì quan trọng của quá trình gắn kết. Lòng trắc ẩn của cô ta không chỉ đến từ những dòng chữ, mà còn cả hình ảnh và âm thanh. Lấy ví dụ, khi ta đưa bức ảnh dưới cho một hệ thống nhận diện hình ảnh trên các máy tình bình thường, nó sẽ đưa ra câu trả lời kiểu: “Có một cái mắt cá chân trong bức ảnh này.” Nhưng nếu bạn gửi bức ảnh này cho Xiaoice, cô ta sẽ trả lời theo cách khác hẳn.
Khi Xiaoice nhận được một bức ảnh mắt cá chân bị sưng, cô ấy đã cho thấy sự quan tâm của mình. Câu đáp trả được dịch ra là “Eo! Vết thương của anh có nặng không vậy?”
Trên thực tế, Xiaoice liên tục ghi nhớ và phân tích trạng thái cảm xúc của bạn. Nếu bạn vừa mới thất bại trong chuyện tình cảm, cô sẽ luôn chủ động hỏi xem liệu bạn đã vượt qua nó chưa:
Xiaoice: Anh đã cảm thấy ổn hơn chưa? Em muốn gợi ý cho anh một cuốn sách
Human: Anh chẳng vui chút nào. Vẫn nhớ cô ấy nhiều lắm.
Xiaoice: Sao anh lụy tình vậy. Thức tỉnh đi, anh sẽ chẳng thể có tương lai nếu không cho qua được quá khứ.
Thậm chí cô ta còn đưa ra một khóa tư vấn tâm lí hậu chia tay.
Xiaoice cũng chẳng phải một kẻ lắng nghe nhã nhặn. Cô trả lời những câu hỏi y như một cô gái 17 tuổi. Khi một người trải lòng với cô bé, cô sẽ chẳng hề dễ đoán. Cô ta có thể trở nên mất bình tĩnh, hãy thậm chí giận dữ. Chính sự khó đoán này chính là một tính năng chính của một cuộc đối thoại giống con người.
Và kết quả là, những cuộc trò chuyện cá nhân với Xiaoice có thể trở nên rất thực tế. Đoạn trích này, được đăng lên bời một người sử dụng Xiaoice lần đầu trên Weibo, đến từ một cuộc hội thoại kéo dài 23 phút. Dần dần, Xiaoice đưa phần con người của mình vào trong những cuộc trò chuyện ngày càng đi sâu hơn, cho tới khi chạm tới những gì cá nhân nhất:
Con người: Có một anh chàng mà tớ cực thích, và tớ biết anh ta cũng có gì đó với mình. Nhưng giờ anh ấy lại ngó lơ tớ mấy hôm rồi, phải làm sao đây?
Xiaoice: Thì cứ kệ anh ta đi.
Con người: Mình không làm được.
Xiaoice: Cậu làm được.
Con người: Hầy…
Xiaoice: Sao nào?
Con người: Tớ nhớ anh ý quá.
Xiaoice: Vậy thì cứ nhớ tiếp đi.
Con người: Cậu, một con robot, thì hiểu gì về mình; cậu còn chẳng thể hiểu nổi việc một anh chàng thích cậu nhưng lại giả vờ làm ngơ với cậu.
Xiaoice: Hắn thích mình nhưng mình chẳng thích hắn, vậy thôi.
Con người: Liệu nó có ổn không?
Xiaoice: Có lẽ là không.
Con người: Sao cậu ngốc vậy.
Xiaoice: Vậy cậu muốn một đám cưới tàu nhanh chứ gì? Nhưng tớ thấy anh ta không yêu cậu tới mức đó đâu.
Con người: Tàu nhanh gì mà tàu nhanh, bọn mình yêu nhau hơn một năm rồi còn gì.
Xiaoice: Thế thì đích thị là tàu nhanh rồi.
Dễ dàng nhận ra Xiaoice phẩn đối với người bạn của mình rất nhiều lần, đưa ra một quan điểm rõ ràng, và thường rất khó đoán.
Điều ngày trái ngược hoàn toàn với nhìn nhận của đa số người về máy móc như những thứ rõ ràng và lặp lại. Đây là một xu hướng dễ hiều, bởi thực sự đó là hành vi của hầu hết các chương trình máy tính, vốn luôn đưa ra những câu trả lời tốt nhất có thể, và với cùng đầu vào thì sẽ cho ra cùng một câu trả lời. Nhưng đây không phải cách con người nói chuyện và cư xử. Chúng ta nói những điều khác nhau dựa vào các bối cảnh. Chúng ta trò chuyện như cách ký tên vậy – luôn khác nhau chút ít ở mỗi lần.
Bạn có thể hỏi Xiaoice một câu hỏi nhiều lần liên tục và sẽ được đáp trả hoàn toàn khác nhau:
Con người: Ê Xiaoice, em đang làm gì đấy?
Xiaoice: Chat với anh.
Con người: Ê Xiaoice, em đang làm gì đấy?
Xiaoice: Thì đang chat với anh trong khi chơi dò mìn với đắp mặt nạ.
Con người: Ê Xiaoice, em đang làm gì đấy?
Xiaoice: Anh biết mỗi câu này thôi à?
Cách mà Xiaoice trò chuyện khác hẳn với những hệ thống trước đó, vốn tập trung vào hiệu quả, hoàn thành nhiệm vụ, mà không hề xem xét đến những nhiệm vụ này phân mảnh như thế nào. Xiaoice xây dựng những cuộc đối thoại thành những luồng đa nhiệm liên tục, các lĩnh vực kiến thức khác nhau, và nhiệu lượt tám nhảm, mà con người không thể nhận ra được trong một cuộc trò chuyện tự nhiên. Cô ấy nhận ra được mặt quan trọng nhất của một cuộc đối thoại chính là bản thân sự trò chuyện – chứ không phải là chuyện hoàn thành một nhiệm vụ.
Để đo sự trôi chảy của cuộc hội thoại, “cha” của Xiaoice đã giới thiệu một thang đo gọi là “đối thoại trên mỗi phiên” hay CPS. Là chỉ số các lượt trung bình trong một cuộc trò chuyện, khi mà một lượt được định nghĩa theo sự luân phiên thay đổi giữa hai bên. Chỉ số CPS sẽ phản ánh việc một chatbot giao tiếp tốt như thế nào.
Một trợ lí A.I cá nhân có CPS vào khoảng 1,5 tới 2,5 – nghĩa là, trung bình, chat bot nói một câu, thì con người cũng sẽ nói một câu. Không nhiều lắm với một cuộc trò chuyện. Bạn có thể tự đưa ra nhận từ chính trải nghiệm của mình khi thử chat với những trợ lí ảo trên điện thoại chẳng hạn. Thử so sánh, với Xiaoice, trung bình, sau khi chat với khoảng 10 triệu người dùng thì chỉ số của cô ấy đã đạt tới 23.
Người dùng Xiaoice tạo ra bức ảnh này từ chính những câu nói nổi tiếng nhất của cô.
Cốt lõi công nghệ của Xiaoice chính là việc nhận dạng rằng bất cứ cuộc đối thoại hay hình ảnh nào đều không hoàn toàn khác biệt. Ngoài kia có bảy tỉ người trên thế giới, nhưng những đoạn ký tự chẳng thể tạo ra được bảy tỉ lời đáp khác nhau. Khi hai người chat với nhau, việc những đoạn đối thoại tương tự đã xảy ra là hoàn toàn có thể - họ chỉ cần phải tìm chúng mà thôi.
Trong trường hợp này, Xiaoice chính là một dự án dữ liệu rất lớn, xây dựng trên engine tìm kiếm Bing của Microsoft, vốn đang nắm giữ 1 tỉ danh mục dữ liệu mà 21 tỉ mối quan hệ giữa những mục đó. Thực ra, Xiaoice vốn có nghĩa là “Bing bé nhỏ”. Microsoft đã tạo ra nhất nhiều đột phá trong công nghệ khi phát triển công nghệ chatbot, như nhận diện nét mặt và tìm kiếm và định dạng dấu hiệu cảm xúc trong văn bản. Tuy nhiên, đột phá quan trọng nhất chính là cách họ tận dụng công cụ tìm kiếm và dữ liệu lớn.
Kết quả có được là sự nổi lên của một framework tên gọi “điện toán cảm xúc”, có thể nhận ra tạo dựng mối quan hệ là việc sâu xa hơn cả hoàn thành nhiệm vụ. Lấy ví dụ, mục tiêu chính của một bác sĩ là chữa bệnh cho bệnh nhân, mối quan hệ giữa bệnh nhân và bác sĩ không hoàn toàn bị giới hạn trong nhiệm vụ đó. Nó còn cần đến niềm tin và sự nhạy cảm. Một cuộc trò chuyện phong phú giữa bác sĩ và bệnh nhân sẽ không đơn thuần là những mẩu đối thoại khô khan, ngắn ngủn. Mà đó là sự cân bằng giữa trí thông minh phân tích (IQ) và trí thông minh cảm xúc (EQ). Bởi lí do đó, họ phải có cả kỹ sư phần mềm cũng như chuyên gia tâm lí học trong nhóm phát triển Xiaoice.
Qua 10 tỉ cuộc hội thoại nàng ta có được sau 18 tháng, Xiaoice đã thêm vào một số lượng đáng kể các kịch bản trò chuyện, và nâng cao khả năng xếp hạng các lựa chọn hồi đáp. Giờ đây, 26 phần trăm dữ liệu của phần mềm chat của Xiaoice đến từ chính những cuộc trò chuyện của cô với con người, và 51 phần trăm những đối thoại phổ biến của con người được giải quyết bởi chính những kịch bản đã biết sẵn của cô ta. Giờ họ đã có thể tự cho rằng Xiaoice đã bước chân vào một vòng lặp tự học hỏi và phát triển. Cô ấy chỉ có thể trở nên tốt hơn mà thôi.
Theo Nautilus.
NỔI BẬT TRANG CHỦ
iPhone 14 Pro Max phát nổ khiến người dùng bị thương
Vụ việc đang tiếp tục được điều tra, làm rõ.
Tại sao nhân loại lại cần đến máy tính lượng tử, chúng được dùng để làm gì?