Những kẻ đào mỏ thời đại

TRƯỜNG SƠN 05/04/2018 02:04 GMT+7

TTCT - Chúng ta đã và đang dễ dãi với thông tin cá nhân - thứ tài nguyên được coi là quý giá hơn vàng và dầu mỏ trong kỷ nguyên số - nhiều hơn mình nghĩ.

minh họa

Trong quyển sách Weightless World (tạm dịch: Thế giới không trọng lượng), nữ kinh tế gia Diane Coyle hình dung về tương lai mà công nghệ chi phối nền kinh tế toàn cầu, khi các byte (đơn vị dữ liệu máy tính) là đồng tiền duy nhất và tất cả thứ hàng hóa định hình cuộc sống chúng ta đều không hữu hình và nặng một gram nào.

“Lịch sử kinh tế đã đạt đến đỉnh mà các siêu doanh nghiệp đương thời là những người sở hữu các kho dữ liệu khổng lồ, phần lớn là do chính người dùng vô tư dâng hiến” - biên tập viên BBC Rajan nhận định trong bài viết ngày 19-3.

Tác giả cho rằng sau thời đại công nghiệp chuyển sang nền kinh tế tri thức và dịch vụ, nhân loại đã bước sang nền kinh tế dữ liệu, hay chính là “thế giới không trọng lượng” như Coyle đã phác họa trong quyển sách xuất bản năm 1999.

Chiêu “đào” dữ liệu

Giả sử ngày nọ có một người từ đâu đến gõ cửa nhà bạn và nói rằng hắn có thể cho bạn biết “kiếp trước bạn là tài tử hay minh tinh màn bạc nào”, miễn là bạn mở cửa cho hắn vào nhà và cho xem mọi hồ sơ lý lịch, album ảnh, sổ tay ghi chép. Và hơn thế nữa, bạn có thể sẵn tiện cho hắn biết thông tin bạn bè, bà con, đồng nghiệp của mình.

Vì tò mò và nghĩ chắc không có vấn đề gì, bạn đồng ý. Với số dữ liệu đó, hắn sẽ chế ra vài câu hú họa, mua vui rồi cáo từ. Mọi chuyện chỉ trở nên “có vấn đề” nếu hắn ra về với toàn bộ thông tin của bạn và bạn bè mà chính bạn đã vui vẻ, vô tư, tự nguyện dâng cho và bán cho bên thứ ba.

Giờ hãy thay tay “thầy bói” là ứng dụng vui (quiz) Your Digital Life trên Facebook, “người mua thông tin” là Cambridge Analytica, hãng phân tích dữ liệu có liên quan đến chiến dịch tranh cử tổng thống Mỹ của ông Donald Trump năm 2016 và “chủ nhà” là 270.000 người dùng Facebook đã chơi quiz này, ta sẽ hiểu được bản chất bê bối được cho là lớn nhất trong lịch sử Facebook, mạng xã hội mới mừng sinh nhật thứ 14 hồi tháng 2 vừa qua.

Cần nhớ gã thầy bói cũng đòi coi luôn thông tin gia đình bạn bè của gia chủ, và trong thực tế Cambridge Analytica có được thông tin của 50 triệu tài khoản chỉ từ 270.000 người thực sự dùng ứng dụng này.

Cũng chính Facebook đã cho phép Cambridge Analytica thu thập dữ liệu người dùng thông qua Facebook Platform, bộ công cụ cho phép các lập trình viên viết ứng dụng cho Facebook với “nguyên liệu” là thông tin người chơi và cả bạn bè của họ ra mắt năm 2007. Mãi đến năm 2015, Facebook mới nhận ra cơ chế cấp quyền truy cập thông tin này là quá dễ dãi để thắt chặt nội quy.

Nhưng trong 8 năm giữa hai mốc thời gian đó, không ai biết được còn bao nhiêu Cambridge Analytica cũng đã kịp tranh thủ “đào” và trữ dữ liệu người dùng Facebook. Cần nhớ chỉ cần 1 người chơi và có 100 bạn thì số tập dữ liệu cũng đã tăng 100 lần. Và rõ ràng người dùng luôn sẵn sàng dâng hiến thông tin cho các ứng dụng trên mạng xã hội mà không lăn tăn gì.

Khi đã tham gia “cõi mạng”, việc không để lại bất kỳ dấu vết số nào là điều bất khả thi. Không chỉ những gì ta like và share trên Facebook, mà các trang web ta đã vào, câu lệnh ta đã nhờ Google tìm kiếm, các món hàng đã xem và mua, bài hát và bộ phim đã nghe và xem trên các trang trực tuyến đều là dữ liệu.

Các gã khổng lồ công nghệ như Facebook đều cam kết dữ liệu người dùng an toàn và bảo mật, nhưng sự cố Cambridge Analytica cho thấy ta không thể tin vào đó mà dễ dãi với việc chia sẻ thông tin trên mạng.

“Ngay cả trong tình huống tốt nhất, chúng ta cũng không thể kiểm soát dữ liệu của chính mình và sẽ đến lúc chúng lọt vào những nơi không mong muốn” - Rajan cảnh báo.

minh họa

Triệu lần hơn dầu mỏ

Trong nền kinh tế số, ai nắm nhiều dữ liệu sẽ là bá chủ, hệt như ai làm chủ được dầu cách đây một thế kỷ. Các công ty lớn nhất hành tinh hiện nay - Alphabet (công ty mẹ Google), Amazon, Apple, Facebook và Microsoft là minh chứng cho nhận định này, The Economist viết trong bài “Tài nguyên giá trị nhất quả đất không còn là dầu, mà là dữ liệu” hồi năm ngoái.

Song nhiều ý kiến khác cho rằng dữ liệu khác rất nhiều so với dầu mỏ và các khác biệt này thậm chí làm chúng còn giá trị và quan trọng hơn.

Khác biệt rõ nhất chính là nguồn cung, dầu mỏ thì hữu hạn, còn dữ liệu thì vô hạn. Trong một bài viết khác trên BBC, Rajan cho rằng dữ liệu giống như nắng trời hơn là dầu mỏ. “Có nhiều dữ liệu đến mức quan tâm duy nhất của ta là phải làm gì với nó, hoặc chia sẻ thế nào hơn là nên tìm nó ở đâu” - Rajan viết.

Ngoài ra, dầu chỉ dùng được một lần, còn cùng nguồn dữ liệu thì có thể được nhiều đối tượng khác nhau tái sử dụng cho các mục đích khác nhau. Một mỏ dầu sẽ trở nên vô dụng sau khi đã khai thác hết, còn một tập thông tin người dùng có thể được các nhà quảng cáo, trang dịch vụ khác nhau khai thác cùng một lúc. Và chẳng công ty nào sợ làm ảnh hưởng môi trường khi “đào” dữ liệu người dùng như ngành công nghiệp khai thác mỏ phải lo ngại.

Dữ liệu người dùng đã trở thành một món hàng quan trọng mà các công ty có thể bỏ tiền ra mua để chắc chắn sản phẩm, dịch vụ, quảng cáo của họ đến được chính xác đối tượng mình mong muốn.

Về phía người dùng, khi cung cấp thông tin cho ai đó, dù là dưới hình thức điền phiếu thông tin để nhận quà trong đời thực hay đăng ký tài khoản online, chơi các quiz, ta có thể nghĩ chuyện này đâu có gì nghiêm trọng. Giả sử nhà quảng cáo biết thông tin và giới thiệu toàn sản phẩm đúng gu nhạc ta thích nghe, kiểu quần áo ta chuộng mặc và loại sách ta ưng đọc thì lợi chứ có gì phải phàn nàn?

Frederike Kaltheuner, trưởng nhóm phân tích dữ liệu thuộc Tổ chức Privacy International, cho rằng từng trường hợp riêng lẻ thì nghe không có gì to tát, song “nếu gộp lại, dữ liệu có thể giúp người nắm chúng biết rất nhiều về ta”.

Ngay với trường hợp Cambridge Analytica, các tờ báo điều tra bê bối này cho thấy chỉ bằng cách phân tích vài chục “like” mà người dùng để lại trên Facebook cũng có thể dự đoán được xu hướng tình dục hay đảng chính trị mà họ có khả năng dành lá phiếu cho nhiều nhất.

Thật ra cựu tổng thống Mỹ Barack Obama cũng từng tận dụng phân tích dữ liệu để giành điểm trong chiến dịch tái tranh cử năm 2012 của mình. Theo đó, hơn 1 triệu người ủng hộ ông Obama đã đăng ký sử dụng một ứng dụng trên Facebook, cho phép những người điều hành chiến dịch vận động này truy cập thông tin cá nhân và danh sách bạn bè của họ.

Ứng dụng này được phát triển dựa trên lập luận rằng một người sẽ dễ bị thuyết phục để bầu cho ông Obama nếu lời kêu gọi được đưa ra từ chính bạn bè của họ, thay vì các thông điệp tranh cử. Cụ thể, theo phân tích của tờ USA Today, nhờ dữ liệu có được, những người phụ trách vận động sẽ sàng lọc được ai có bạn bè đang ở các bang lửng lơ (swing state), sau đó sẽ gửi tin nhắn qua Facebook cho người này, gợi ý để họ khuyến khích bạn bè mình đi bầu sớm.

Các trợ lý của ông Obama cho rằng họ đã tuân thủ nghiêm túc các quy định về dữ liệu người dùng của Facebook và không bao giờ chia sẻ thông tin có được với bên thứ ba. Không bàn đến việc vi phạm hay không vi phạm, công cụ “vận động trúng đích” của nhóm ủng hộ ông Obama là ví dụ rõ ràng cho thấy dữ liệu của người dùng không chỉ giúp các nhà quảng cáo bán được hàng, mà còn có thể ảnh hưởng đến chính trị.

Có một câu “châm ngôn” trong thời Internet: nếu thứ gì đó cho miễn phí trên mạng thì chính người dùng là sản phẩm. Facebook, Google, YouTube đều cho người dùng sử dụng miễn phí, nhưng đổi lại là mỏ vàng dữ liệu có thể sử dụng đa mục đích.

Vụ bê bối Cambridge Analytica chỉ là bề nổi của tảng băng, nhưng là hồi chuông cảnh báo cần thiết để người dùng ý thức hơn với những gì họ chia sẻ trên mạng.■

Trong bài viết trên trang Medium, tác giả Pedro Vivas cho rằng dữ liệu của người dùng cũng có thể giúp tính toán “chỉ số tín nhiệm” của người tiêu dùng nhằm quyết định có nên cung cấp dịch vụ cho họ hay không. Các hãng bảo hiểm, nhà băng có thể dựa vào lịch sử thanh toán, các khoản chi tiêu của khách hàng tiềm năng, tất cả đều có thể dễ dàng mua được từ các công ty chuyên đào dữ liệu, để tính toán mức bảo hiểm hay khoản vay mà người này xứng đáng nhận.

“Vì thế, từ việc cỏn con như mua quá nhiều thứ trên mạng cũng có thể là chỉ dấu cho thấy nguy cơ về sức khỏe và có thể ảnh hưởng đến gói chăm sóc y tế mà bạn có thể mua được - Vivas viết - Tương tự, xem thể loại phim nào cũng có tác động đến khả năng bạn có được vay với lãi suất thấp hay cao”.

Điều đáng nói là “chỉ số tín nhiệm” này được tính toán ngầm mà không hề có sự hay biết của chủ thể, khác với điểm tín dụng được tính toán công khai từ lịch sử tín dụng vẫn thường thấy trong ngành ngân hàng.

Bình luận Xem thêm
Bình luận (0)
Xem thêm bình luận