Facebook khai thác dữ liệu người dùng ra sao?

PHẠM VŨ LỬA HẠ 04/04/2018 03:04 GMT+7

TTCT - Lâu nay đã râm ran nhiều đồn đoán các mạng xã hội bị thao túng để ảnh hưởng kết quả bầu cử ở Mỹ năm 2016. Hôm 17-3, báo The Observer (Anh) và báo The New York Times (Mỹ) đưa ra tiết lộ động trời về việc một hãng phân tích thông tin tiếp thị khai thác trái phép dữ liệu của hàng chục triệu người dùng Facebook.

Mối liên hệ của những nhân vật chính trong vụ Cambridge Analytica. Minh họa của The Guardian

 

Hôm 18-3, Facebook thông báo rằng tiến sĩ Aleksandr Kogan (giảng viên môn tâm lý ở Đại học Cambridge, Anh) và phó giáo sư Đại học St. Petersburg (Nga) đã nói dối Facebook, đồng thời vi phạm chính sách sử dụng nền tảng Facebook khi chuyển dữ liệu từ một ứng dụng đăng nhập bằng Facebook cho SCL/Cambridge Analytica.

Cambridge Analytica là hãng do Steve Bannon, cựu cố vấn của ông Donald Trump, đồng sáng lập và chuyên phân tích dữ liệu cho nhiều khách hàng chính trị, nhà nước và quân đội trên toàn cầu.

Dữ liệu lớn và tâm lý học

Facebook đã ngừng cho phép Cambridge Analytica dùng nền tảng của mình, sau khi một cựu nhân viên Cambridge Analytica tố cáo hãng này đã dùng sai mục đích dữ liệu Facebook để xây dựng các mô hình “đặc điểm tâm lý” và giúp ông Trump đắc cử tổng thống.

Trong nghiên cứu tâm lý, một trong những mô hình phổ biến để đánh giá hành vi con người là mô hình 5 yếu tố tính cách OCEAN: openness (tính cởi mở - sẵn sàng trải nghiệm), conscientiousness (tính chu đáo - tỉ mỉ), extraversion (tính hướng ngoại), agreeableness (tính dễ chịu - dễ hài lòng) và neuroticism (tính cả lo - dễ bất ổn tâm lý). Căn cứ vào đó, giới tiếp thị có thể chọn kiểu quảng cáo tới đối tượng cụ thể bằng thông điệp phù hợp tính cách của phân khúc thị trường.

Một ví dụ là nghiên cứu năm 2012 của Jacob Hirsh, nhà tâm lý học chuyên về hành vi tổ chức ở Đại học Toronto và các đồng nghiệp.

Trong khảo sát đó, 324 người trả lời được cho xem các mẩu quảng cáo một điện thoại thông minh tưởng tượng. Ngôn từ dùng trong các quảng cáo đó được chọn dựa trên điểm đánh giá tính cách OCEAN của người trả lời. Ai có điểm cao về openness được xem quảng cáo ca ngợi điện thoại là công cụ có nhiều ứng dụng và trải nghiệm mới. Ai có điểm cao về neuroticism được xem quảng cáo nhấn mạnh tính năng bảo mật trên hết. Kết quả cho thấy việc chọn thông điệp khớp với tính cách có hiệu quả tăng tác động của quảng cáo.

Nghiên cứu này về sau được trích dẫn trong công trình của các nhà nghiên cứu ở Đại học Cambridge. Họ dùng các bài đánh giá tính cách của hàng chục ngàn tình nguyện viên, được thực hiện qua Facebook, để chứng minh rằng các đặc điểm tính cách cũng tương ứng những phản ứng “thích” (like) trên Facebook của người sử dụng.

Nhóm nghiên cứu sau đó xây dựng một mô hình điện toán có thể đảo ngược quy trình đó: dùng các phản ứng “thích” để tiên đoán tính cách. Năm 2015, họ chứng minh rằng mô hình đó chính xác hơn con người trong việc đánh giá tính cách và tiên đoán quan điểm chính trị.

Số lượng người sử dụng Facebook khổng lồ cộng với kỹ thuật phân tích dữ liệu lớn (big data) ngày càng mạnh đã mang lại cơ hội chưa từng có để áp dụng mô hình này ở quy mô lớn.

Christopher Wylie - cựu nhân viên SCL, công ty mẹ của Cambridge Analytica - tố cáo Aleksandr Kogan đã cung cấp dữ liệu về hơn 50 triệu tài khoản Facebook cho Cambridge Analytica. Wylie là người viết nên thuật toán giúp những người ủng hộ ông Trump dùng Facebook để khai thác dữ liệu của hàng triệu người.

Tuyên truyền có mục tiêu

Hợp tác với Hãng nghiên cứu Global Science Research (GSR) của Aleksandr Kogan, họ viết ứng dụng “thisisyourdigitallife” (đây là cuộc sống số của bạn). Tuy người dùng được thông báo đây là một khảo sát đánh giá tính cách để giúp nghiên cứu tâm lý học, ứng dụng này thực ra được dùng để phỏng đoán tính cách và thiên hướng chính trị nhằm tuyên truyền chính trị nhắm tới từng cá nhân.

“Báu vật” của ứng dụng này không phải là những câu trả lời của người tham gia, mà là quyền tự do tiếp cận tài khoản Facebook mà người tham gia cho phép Cambridge Analytica.

Theo tố cáo của Wylie, hàng trăm ngàn người dùng Facebook đã làm đánh giá tính cách với ứng dụng này và do vậy họ đã đồng ý để dữ liệu của họ được thu thập vì mục đích nghiên cứu. Nhưng mục đích thực tế thì hoàn toàn khác.

Cambridge Analytica đã lợi dụng một lỗ hổng cho phép truy cập phản ứng “thích” và các thông tin khác không chỉ của 270.000 người tham gia một khảo sát, mà cả của những người trong danh sách bạn bè Facebook của những người tham gia đó (sau giữa năm 2015, Facebook mới cấm chuyện đó).

Rốt cuộc, họ thu thập được dữ liệu liên quan tới tính cách từ khoảng 50 triệu người, tức hơn 1/3 số người bỏ phiếu trong cuộc bầu cử tổng thống Mỹ năm 2016. Mỗi người là một đối tượng khả dĩ để nhận được thông điệp liên quan tới bầu cử được “may đo” phù hợp với cá nhân người đó.

Alexander Nix, CEO (đã bị đình chỉ) của Cambridge Analytica, từng nói rằng khảo sát này thu thập được gần 5.000 điểm dữ liệu về một người để giúp tạo nên thông điệp phù hợp cho người đó. Ví dụ, một cử tri sùng đạo có thể được nhắm tới với 30% thông điệp có màu sắc tôn giáo, 20% thông điệp về quyền sở hữu súng và 30% các quảng cáo về kinh tế, trong khi người hàng xóm là thành viên Hiệp hội Súng quốc gia (NRA) chủ yếu nhận được các thông điệp về quyền sở hữu súng trên Facebook.

Mạng xã hội là một nhân tố tác động quan trọng trong cuộc bầu cử năm 2016 ở Mỹ. Theo trưởng ban phân tích dữ liệu David Wilkinson, Cambridge Analytica đã tư vấn cho chiến dịch tranh cử của ông Trump dành nhiều thời gian và nguồn lực cho cử tri nông thôn, nhất là ở các bang Florida, Pennsylvania và Michigan.

Dù Cambridge Analytica khoe khoang đã góp phần giúp ông Trump bước vào Nhà Trắng, giới chuyên gia vẫn chưa nhất trí về hiệu quả thực sự từ mô hình của hãng này.

Từ đầu năm 2015, Facebook đã biết một số dữ liệu người dùng bị sử dụng sai mục đích. Tháng 8-2016, Facebook yêu cầu Kogan và Cambridge Analytica xác nhận rằng họ đã xóa dữ liệu đó. Việc này diễn ra mấy ngày trước khi ông Trump thuê Steve Bannon, cựu phó tổng giám đốc Cambridge Analytica, điều hành chiến dịch tranh cử tổng thống của ông. Mãi tới nay, sau khi báo chí tiết lộ, Facebook mới công khai thừa nhận dữ liệu người sử dụng đã bị khai thác.

Cambridge Analytica đã phủ nhận nhiều cáo buộc. Hãng này nay khẳng định rằng khi biết dữ liệu đã không được thu thập đúng với quy định của Facebook, hãng đã xóa toàn bộ dữ liệu nhận được. Ngoài ra, Cambridge Analytica nay khẳng định “không có dữ liệu nào từ GSR được Cambridge Analytica dùng trong những dịch vụ mà hãng cung cấp cho chiến dịch tranh cử tổng thống năm 2016 của ông Donald Trump”.

Tờ The New York Times gọi vụ việc là “một trong những vụ rò rỉ dữ liệu lớn nhất trong lịch sử của mạng xã hội này”. Thêm vào đó, mối liên hệ giữa Aleksandr Kogan với Chính phủ Nga và với các nhân vật cánh hữu gạo cội như tỉ phú Robert Mercer và Steve Bannon càng khiến Facebook khó xử, giữa lúc cuộc điều tra về chuyện Nga giật dây năm 2016 vẫn đang rối bời. ■

Bình luận Xem thêm
Bình luận (0)
Xem thêm bình luận