Thuật toán của Google có thể quyết định được ai sẽ là Tổng thống Mỹ

Lê Hoàng,

Cách Google sắp xếp các kết quả tìm kiếm cũng sẽ quyết định ấn tượng của bạn về ứng viên Tổng thống nào đó là tích cực hay tiêu cực.

Hãy thử tưởng tượng ra một cuộc bầu cử gay cấn. Bạn không biết bỏ phiếu cho ứng viên nào. Bạn gõ tên của ứng viên một ứng viên đó vào trang tìm kiếm ưa thích của mình – gần như chắc chắn, đó sẽ là Google. Chỉ trong vòng chưa đầy một giây, hàng nghìn thông tin về ứng viên bạn vừa gõ tên sẽ hiện lên màn hình. Chỉ cần đọc lướt qua là bạn đã nắm phần lớn tiểu sử về ứng viên đó và có thể đưa ra lá phiếu của mình với cảm giác tự tin rằng bạn đã tìm hiểu kỹ và đưa ra lựa chọn tốt nhất của mình.

Nhưng sự thật không đơn giản như vậy.

Theo một nghiên cứu kéo dài nhiều năm do 2 giáo sư tâm lý học Robert Epstein và Ronald Robertson thuộc Viện Nghiên cứu và Công nghệ Hành vi Hoa Kỳ AIBRT thực hiện, thứ tự sắp xếp các thông tin tích cực và tiêu cực trên màn hình kết quả tìm kiếm sẽ có ảnh hưởng rất lớn tới lá phiếu của bạn. Và nếu các chiến dịch vận động của các ứng viên không thể giúp họ phân thắng bại rõ ràng, các bộ máy tìm kiếm – trong phần lớn các trường hợp là Google – sẽ đóng vai trò quyết định kết quả cuối cùng.

Nói cách khác, thuật toán sắp xếp kết quả tìm kiếm của Google có thể vô tình "đánh cắp" ghế tổng thống Mỹ từ tay một ứng viên và trao cho một ứng viên khác. "Chúng tôi ước tính, dựa theo tỷ lệ thắng cử tại các cuộc bầu cử trên khắp thế giới, rằng Google có thể quyết định kết quả của ít nhất là 25% tất cả các cuộc bầu cử toàn quốc", giáo sư Epstein khẳng định.

Nghiên cứu của Epstein và Robertson bao gồm nhiều thí nghiệm kéo dài trong nhiều năm, trong đó 2 tác giả đã cho phép người tham gia được truy cập vào thông tin về cuộc đua giành ghế thủ tướng Úc trong năm 2010, năm 2008 và sau đó cho phép họ xem các bài báo về từng ứng viên do một bộ máy tìm kiếm giả lập đưa ra.

Trong nghiên cứu này, bộ máy tìm kiếm giả lập sẽ sắp xếp các bài viết tích cực về một ứng viên lên đầu cho một nhóm người tham gia (được lựa chọn ngẫu nhiên); nhóm còn lại cũng sẽ chứng kiến các bài viết tích cực về người còn lại được ưu tiên trên trang kết quả tìm kiếm giả lập của họ. Kết quả cho thấy, càng nhận được nhiều kết quả tìm kiếm tích cực về một ứng viên thì những người tham gia càng dễ bỏ phiếu cho người đó – mức chênh lệch lên tới 48%.

Con số 48% này được 2 nhà nghiên cứu gọi là chỉ số VMP, hay "sức mạnh thao túng bầu cử". Hiệu ứng này vẫn giữ nguyên khi các nhà nghiên cứu chèn vào chỉ một bài báo tiêu cực duy nhất vào vị trí thứ 3 hoặc thứ 4 trên trang tìm kiếm giả lập của 2 nhóm người tham gia. Có vẻ như bài báo tiêu cực này thậm chí còn làm cho các kết quả tìm kiếm có vẻ trung lập hơn và do đó đáng tin cậy hơn.

Từ phòng thí nghiệm ra đời thực

Nghiên cứu trên, dù có bất ngờ tới mấy, cũng chỉ được thực hiện trong môi trường giả lập. 2 tác giả đã quyết định tiến thêm một bước khi tới Ấn Độ để tham gia cuộc bầu cử Quốc hội nước này vào năm 2014 với 430 triệu người tham gia trên 800 cử tri đủ điều kiện. "Ban đầu tôi nghĩ rằng chúng tôi sẽ rất may mắn nếu như VMP đạt mức 2 hoặc 3%. Linh cảm của tôi thậm chí còn báo trước sẽ không có hiệu ứng nào cả, bởi vì đây là một cuộc bầu cử rất, rất căng thẳng", Epstein khẳng định. Các cử tri Ấn Độ đã được tiếp xúc với rất nhiều kênh thông tin khác bên cạnh bộ máy tìm kiếm giả lập mà 2 nhà nghiên cứu của AIBRT đưa ra.

Thế nhưng, trong số 2.150 cử tri vẫn còn lưỡng lự với lá phiếu của họ, thí nghiệm của Epstein và Robertson lại một lần nữa mang đến các chỉ số VMP cao bất ngờ. Ngay cả khi đã tính toán tới những trục trặc trong khâu khai thác dữ liệu và một số khó khăn trong việc đánh giá liệu các bài báo mang đến hiệu ứng tích cực hay tiêu cực, tổng cộng nghiên cứu này vẫn cho thấy chỉ số VMP đạt mốc 24%.

Trong một số nhóm cử tri, con số này còn đạt tới 72%. Nói cách khác, tại một số khu vực, các bộ máy tìm kiếm có thể quyết định phần thắng áp đảo cho một ứng viên nào đó.

Nhưng kể cả trong trường hợp không đạt được tới các mốc VMP cao ngất ngưởng thì ảnh hưởng mà các bộ máy tìm kiếm gây ra cũng là không hề nhỏ. Ví dụ, trong đời thực cuộc bầu cử tại Úc được 2 nhà nghiên cứu sử dụng làm môi trường cho phòng lab đã kết thúc với khoảng cách chỉ 1%. Một nửa trong số các cuộc bầu cử tổng thống trong lịch sử Hoa Kỳ kết thúc với mức cách biệt chưa tới 8%. Và thực tế là cuộc bầu cử tổng thống Mỹ sẽ diễn ra gay gắt trên từng bang trong tổng cộng 50 bang. Những bang giúp Đảng Cộng Hòa hay Đảng Dân Chủ giành chiến thắng sẽ không phải là các bang đã được phân định rõ ràng qua các cuộc bỏ phiếu mà lại là các bang trung lập với tỷ lệ chiến thắng luôn ở mức "mỏng như dao cạo".

Do đó, ngay cả khi kết quả thực tế không thể đạt tới mức 2 chữ số như trong các thử nghiệm, chỉ số VMP vẫn sẽ mang lại ảnh hưởng cực kỳ sâu rộng. "Chỉ 4 đến 8% đã đủ khiến cho các nhà quản lý chiến dịch tranh cử cảm thấy phấn khích rồi", Brian Keegan, một nhà khoa học xã hội-máy tính tại Đại học Harvard khẳng định. "Cuối cùng thì sự thật vẫn là phần lớn các cuộc tranh cử chỉ cần sự khác biệt khoảng 3 hay 4%. Kể cả trong trường hợp các bộ máy tìm kiếm chỉ tạo ra khác biệt 1 đến 2%, hiệu ứng này vẫn sẽ là quá thuyết phục".

Máy móc nghĩ thay cho con người

Dĩ nhiên, bạn có thể nhanh chóng đưa ra kết luận rằng các chiến dịch vận động chính trị, vốn ngày một hiểu biết sâu rộng hơn về khoa học công nghệ, sẽ sớm sử dụng các công cụ tìm kiếm để tìm đường đến chiến thắng. Nhưng điều đó không hẳn là sự thật.

"Làm như vậy sẽ tiêu tốn rất nhiều tiền", David Shor, một nhà khoa học dữ liệu tại công ty phân tích Civis Analytics - một công ty phát triển từ bộ phận kỹ thuật của chiến dịch tranh cử do Tổng thống Obama thực hiện vào năm 2008 khẳng định. "Cố gắng thuyết phục truyền thông đăng tải những thông tin có lợi cho bạn sẽ là một chiến lược hợp lý hơn".

"Tôi nghĩ rằng thông thường cử tri Mỹ không tin tưởng các chiến dịch vận động tranh cử bởi họ không mấy tôn trọng các chính trị gia. Họ thường đón nhận các thông tin từ các tổ chức mà họ dành nhiều sự tôn trọng hơn". Thêm nữa, trong mùa bầu cử, các ứng viên cuối cùng của Đảng Cộng Hòa và Đảng Dân Chủ thường đã có sẵn page rank cao vì đã có nhiều đường link dẫn tới trang của họ. Đây lại là một trong những thông số được Google sử dụng để xếp hạng thông tin.

2 nhà sáng lập của Google, Larry Page và Sergey Brin.

Ngay cả trong tình cảnh này, các công ty chuyên về bộ máy tìm kiếm và mạng xã hội vẫn sẽ tạo ra được nguồn ảnh hưởng mới. Ví dụ, vào cuộc bầu cử Quốc hội Mỹ 2010, các nhà nghiên cứu tại Facebook đã gửi đi một thông điệp yêu cầu 61 triệu người dùng phải tham gia bầu cử (bất kể lựa chọn của họ là ai). Kết quả cho thấy cuộc bầu cử này đã nhận thêm được 340.000 phiếu bầu.

Nhưng, như giáo sư Jonthan Zittrain tại Harvard đề xuất, điều gì sẽ xảy ra nếu như Facebook không gửi tin nhắn tới 61 triệu người dùng ngẫu nhiên là mà 61 triệu người dùng được phát hiện là có xu hướng ủng hộ một ứng viên nào đó (thông qua các thông tin mà họ đã cung cấp sẵn cho Facebook). Bằng cách này, Facebook có thể thay đổi hoàn toàn cục diện của các cuộc bầu cử. Và nếu như bạn vẫn nghĩ rằng các công ty như Facebook và Google sẽ không bao giờ tham gia vào các chiến dịch chính trị, hãy nhớ lại cách mà 2 ông lớn này đã vận động người dùng của mình chống lại các dự luật như SOPA và PIPA.

Gian lận bầu cử số hóa

Trong nhà nghiên cứu của mình, Epstein và Robertson gọi hành vi này là "gian lận bầu cử số hóa", tương tự như các chiến lược dạng GOTV (kích thích phiếu bầu) có mục đích vận động cử tri ủng hộ cho một ứng viên, một đảng phái tham gia bầu cử. Điểm khác biệt giữa hành vi "gian lận số" này với GOTV thông thường là ở chỗ trong khi GOTV tập trung vào những cử tri đã ủng hộ cho một đối tượng cụ thể, hình thức "gian lận số" lại tập trung vào các cử tri chưa đưa ra quyết định cuối cùng.

Tổng thống Obama cùng chủ tịch Google (nay là Alphabet) Eric Schmidt.

Kịch bản hoàn toàn có thể xảy ra ở đây, theo Epstein là "Nếu các nhà lãnh đạo tại Google quyết định nghiên cứu những thứ này thì họ có thể dễ dàng thao túng các cuộc bầu cử theo ý mình mà không ai hay biết". Nhưng vấn đề thậm chí còn sâu rộng hơn, đáng lo ngại hơn là ở chỗ hiện tượng thao túng này hoàn toàn có thể xảy ra mà không có bàn tay của con người:

"Các con số này lớn tới mức các nhà lãnh đạo của Google chẳng liên quan gì đến vấn đề này cả. Nếu như thuật toán của Google, thông qua những gì họ gọi là 'các chu trình tự nhiên', quyết định ưu ái một ứng viên hơn ứng viên còn lại thì tác hại gây ra đã là quá đủ. Tại một đất nước như Ấn Độ, điều này có thể khiến một ứng viên có thể thu được thêm hàng triệu lá phiếu", Epstein cho biết.

Nhưng dĩ nhiên là Google không muốn thừa nhận rằng thuật toán của họ đang thao túng các cuộc bầu cử. Một đại diện chính thức của Google (nhưng lại phát biểu giấu tên) khẳng định: "Đưa ra các câu trả lời liên quan đã luôn là cốt lõi của phương thức tìm kiếm của Google từ ban đầu. Nếu như chúng tôi thay đổi hướng đi, điều đó sẽ ảnh hưởng tới lòng tin của mọi người vào các kết quả tìm kiếm và cả công ty của chúng tôi".

Cần nhớ rằng các thuật toán Google sử dụng để sắp xếp các kết quả tìm kiếm luôn rất phức tạp và luôn thay đổi. Một điều luật yêu cầu Google phải thay đổi thứ tự của các kết quả tìm kiếm về một ứng viên Tổng thống nào đó sẽ làm hỏng giá trị cốt lõi của Google: đưa ra các câu trả lời phù hợp nhất trong bất cứ hoàn cảnh nào. Và bộ luật này cũng sẽ vi phạm quyền tự do ngôn luận của Google theo Tu Chính Thứ Nhất của Hiến Pháp Mỹ.

Hiến pháp Mỹ cho phép Google được thao túng các cuộc bầu cử!

Và dù cho những thứ có vẻ "vô tri" như thuật toán có thể được coi là hoàn toàn khách quan, thực tế lại không như vậy. "Khó có thể có một thuật toán hoàn toàn trung lập", Jonathan Bright, một nhà nghiên cứu tại Viện Internet Oxford khẳng định. "Tôi không nghĩ đã có ai đó tại Google, Facebook hoặc các công ty khác đã từng thay đổi kết quả bầu cử. Nhưng vấn đề thuật toán trung lập là vấn đề đã gây khó cho các công ty này". Các thuật toán sẽ luôn phản ánh các giá trị cốt lõi và góc nhìn của các lập trình viên. Câu hỏi ở đây là "Liệu họ có muốn thực sự cố gắng để gây ảnh hưởng tương đương lên tất cả những người ủng hộ Đảng Cộng Hòa và những người ủng hộ Đảng Dân Chủ hay không? Hay họ sẽ để mặc cho các thuật toán thích làm gì thì làm?".

Đây sẽ là một viễn cảnh đáng sợ cho loài người. Và đó là còn chưa tính tới những ảnh hưởng mà Google đã tạo ra cho bạn dựa trên Gmail của bạn, tài liệu Google Docs của bạn và tất cả những sản phẩm khác mà bạn đang sử dụng.

Bạn có tin nhân viên Facebook từng nảy sinh ý định thao túng bầu cử Tổng thống Mỹ không?

Theo Trí Thức TrẻCopy link

Link bài gốcLấy link

Tags: