Facebook có nghe lén bạn để hiển thị quảng cáo?

Cứ lâu lâu chúng ta lại nghe người này người kia nói rằng Facebook đang nghe lén họ. Vừa mới nói chuyện với nhau về quán phở trên đường Tôn Đức Thắng, vô Facebook hiện ngay cái quảng cáo về quán ăn đó. Vừa nói chuyện với nhau về cái khoan tay đẹp tính mua, thậm chí còn chưa đi search chỗ mua, thế mà Facebook cũng hiện đúng quảng cáo của cái khoan đấy!
Facebook có nghe lén bạn để hiển thị quảng cáo?

Thậm chí có người còn post video về thử nghiệm của họ nữa (bên dưới, họ thử dùng chữ 'cat food' - thức ăn cho mèo - và Facebook hiện đúng quảng cáo về sản phẩm này). Vậy chẳng phải Facebook đang nghe lén bạn để hiển thị quảng cáo định hướng đấy sao?

Điều này có khả thi không?

Hãy nói về mặt kĩ thuật trước. Giả sử Facebook hoặc Facebook Messenger hoặc các app con của Facebook thật sự có lắng nghe bạn liên tục kể cả khi bạn đang không bật điện thoại. Khi đó, bạn giống như đang gọi một cuộc gọi thoại với Facebook vậy. Trung bình mỗi giây cuộc gọi thoại này sẽ chiếm 3KB dung lượng, và giả sử bạn cầm máy liên tục bên mình khoảng 6 tiếng mỗi ngày, vậy tính ra sẽ có khoảng 130MB dung lượng data giọng nói với mỗi người mỗi ngày được gửi về Facebook, theo ước tính của Antonio García Martínez, người đầu tiên làm giám đốc sản phẩm mảng quảng cáo cho Facebook và giờ đã nghỉ việc.

Đem con số 130MB / người / ngày này nhân cho 150 triệu người dùng tích cực mỗi ngày tại Mỹ (dùng Mỹ làm ví dụ vì người Mỹ nói tiếng Anh, và đặt giả thuyết là Facebook có khả năng phân tích giọng nói tiếng Anh tốt nhất), chúng ta có tổng dung lượng dữ liệu vào khoảng 20 petabyte mỗi ngày. Lưu ý số này chỉ mới ở Mỹ thôi nhé, chưa áp dụng cho toàn thế giới.

Nếu bạn chưa biết thì toàn bộ hệ thống lưu trữ dữ liệu của Facebook hiện đang có dung lượng tầm 300 petabyte, mỗi ngày tăng thêm cỡ 600 terabyte nữa. Như vậy, nếu Facebook thật sự nghe lén bạn thì mỗi ngày Facebook phải tiếp nhận một lượng dữ liệu lớn hơn gấp 33 lần so với hiện nay. Đây là con số lớn khổng lồ và đứng ở góc nhìn kĩ thuật, sẽ rất khó để có thể chứa hết bọn chúng, chưa kể tới nguồn lực xử lý cần dùng để phân tích các từ được nói để trả về kết quả cho hệ thống hiển thị quảng cáo.

Ở phía người dùng, việc phát sinh 130MB dung lượng mỗi ngày cũng sẽ khiến bạn cảnh giác ngay lập tức vì mức độ sử dụng 3G, 4G tăng lên nhanh chóng. Giả sử mỗi tháng bạn có 2GB miễn phí thì chỉ 2 tuần là con số này đã cạn sạch rồi. Chưa hết, việc ghi nhận và truyền dữ liệu giọng nói liên tục về máy chủ còn khiến thiết bị của bạn chạy chậm thường xuyên, mau hao pin và nóng máy. Nói cách khác, việc làm này của Facebook sẽ bị phát hiện ngay lập tức.

Tất nhiên, ở trên chúng ta đang đặt giả thuyết về việc stream dữ liệu liên tục giữa điện thoại với máy chủ Facebook. Nhưng cũng có một cách thông minh hơn và ít bị phát hiện hơn: Facebook sẽ chỉ kích hoạt nghe lén khi bạn nói đúng một từ khóa nào đó. Đây là cách mà các trợ lý ảo như Amazon Alexa, Google Assistant hay sắp tới là Siri đang sử dụng. Chỉ khi bạn gọi tên của mấy 'cô gái' này, mấy 'cổ' mới bắt đầu chạy lên và lắng nghe mệnh lệnh của bạn. Như vậy gói data cần truyền giữa thiết bị của bạn với Facebook sẽ rất nhỏ gọn và khó bị phát hiện.

Nhưng vấn đề là từ khóa được Facebook sử dụng là gì? Rất khó để Facebook có thể chọn từ khóa kích hoạt vì những đoạn hội thoại bình thường của bạn có thể có cả nghìn chữ trong đó, với mỗi người bạn lại nói một vấn đề khác nhau. Việc sử dụng 1 vài từ khóa để kích hoạt là chuyện bất khả thi. Và đó là chỉ mới áp dụng cho tiếng Anh, mở rộng ra các ngôn ngữ khác lại càng không thể, đặc biệt là tiếng Việt rất phong phú cũng như chưa có những hệ thống nhận diện, phân tích đủ mạnh và đủ tốt.

Bên cạnh đó, Martínez cho biết tính đến lúc ông nghỉ việc ở Facebook thì hệ thống quảng cáo định hướng của công ty đang có khoảng 1 triệu từ khóa dùng để nhận biết vấn đề mà người dùng đang trao đổi là gì để mà chọn quảng cáo cho phù hợp. Facebook chẳng thể nào lắng nghe hết 1 triệu từ khóa này vì như vậy điện thoại của bạn không thể chịu nổi, và một lần nữa, bạn sẽ nhanh chóng phát hiện ra những thứ kỳ quái với app Facebook bằng những công cụ đo có sẵn của Android, iOS. Ngay cả khi chiếc điện thoại của bạn là Note8 hay iPhone X mới nhất thì gánh nặng này vẫn là quá lớn với phần cứng của một cái điện thoại.

Bao nhiêu người bị tình trạng này?

Giờ chúng ta sẽ giả sử Facebook thật sự có thể nghe lén bạn và chuyển thể thành đúng mẫu quảng cáo bạn quan tâm. Không có mức CPU bị sử dụng quá cao, không có hiện tượng pin mau hết, không có data bị sử dụng đụng trần... Cứ cho là Facebook đạt được một thành tựu nào đó để luôn luôn lắng nghe và luôn luông thấu hiểu đi. Vậy có bao nhiêu % trong những đoạn hội thoại là thông tin có thể được dùng cho quảng cáo?
Không nhiều.

Chính Martínez đã thử nghiệm điều đó khi ông còn làm ở Facebook. Hãng từng thử nghiệm một dự án tên mã 'Project Chorizo', trong đó Facebook sẽ lấy hết tất cả mọi dữ liệu của người dùng mà họ có trong tay, từ các bài post, link, địa điểm check in... và nhét vào một cỗ máy xử lý để xem liệu những dữ liệu này có cải thiện hiệu quả quảng cáo hay không.

Trước khi tới được bước đánh giá hiệu quả, Facebook rất ngạc nhiên vì lượng thông tin có thể dùng để định hướng quảng cáo trong tất cả mọi dữ liệu nói trên thực ra rất nhỏ, chỉ vài phần trăm, dù cho Facebook có thể nhiều cách khác nhau. Martínez ví von việc này giống như nhét cả một trại nuôi thú vật vào một chiếc máy nghiền để rồi đầu ra là một cây xúc xích bé tí tẹo. Nói cách khác, những nhà quảng cáo đang không hứng thú với bạn nhiều như bạn nghĩ.

Theo Martínez, đây là thứ người dùng thường hiểu nhầm ở Facebook. Chúng ta có xu hướng đặt mình ở trung tâm thế giới và giả định rằng cuộc sống của mình rất quan trọng, người ngoài rất muốn tìm hiểu xem cuộc đời của bạn như thế nào. Nhưng đó không phải là điều đúng đắng. Các nhà quảng cáo không quan tâm đến hầu hết dữ liệu cá nhân của bạn.

Nói ngắn gọn: bạn có một tấm ảnh khỏa thân trên Internet không có nghĩa là mọi người sẽ trả tiền để xem nó.

Thứ mà các nhà quảng cáo thật sự quan tâm đa phần không nằm trong các cuộc hội thoại của bạn ở Facebook. Những dữ liệu quý giá đó nằm trong những món hàng bạn đã mua từ các trang thương mại điện tử như Amazon, trong hồ sơ mua xe, mua nhà, trong dữ liệu khách hàng của cửa hàng bán lẻ gần bạn, nói chung là ở những chỗ mà bạn đã chi tiền ra.

Nó có chạy không?

Giả sử (lại giả sử) Facebook làm được hết tất cả mọi thứ và hệ thống định hướng quảng cáo cũng chạy hoàn hảo. Như vậy chúng ta sẽ có những tình huống như sau:

'Tôi cần bay từ TP.HCM ra Hà Nội ngày 11/11, bạn nào có vé tốt pm' => hiện quảng cáo cho Vietnam Airline hay Vietjet Air hay Traveloka.

'Thằng chó đó nói chuyện chán quá' => hiện quảng cáo cửa hàng thịt chó, ủa khoan, sao kỳ vậy?

Ngôn ngữ của con người là một hệ thống cực kì phức tạp, nó có thể có nhiều nghĩa khác nhau và cũng là bài toán vô cùng nan giải với thuật toán định hướng quảng cáo. Hệ thống AI này không thể nào gợi ý đúng tất cả mọi trường hợp nếu chỉ có những câu từ chung chung như thế.

Lại nói về 'Project Chorizo', sau quá trình nghiền xúc xích nói trên, việc tăng trưởng số lượt click (cũng là cách Facebook tính tiền nhà quảng cáo) nhờ vào các bài post của người dùng cũng không có gì đáng kể. Không phải là không tăng, nhưng không phải là mức mà các nhà quảng cáo sẵn sàng chi thêm để có được.

Vậy điều gì có thể giải thích cho những video giống như cái mà bạn thấy đầu bài?

Cũng giống như việc bạn hay gặp trời mưa sau khi mới rửa xe, bạn đang xem video của một vài người dùng Facebook gặp một số tình huống có vẻ là ngẫu nhiên, bạn đang bỏ qua hàng triệu người dùng khác không gặp vấn đề này.

Và trong đa số trường hợp, Facebook không cần phải thực hiện phép màu gì để nhắm vào bạn cả. Họ có những công cụ mạnh hơn rất nhiều lần để định hướng quảng cáo thay vì sử dụng những câu từ rất chung chung từ đoạn hội thoại nghe lén. Facebook có tất cả dữ liệu về sở thích, bạn bè, các mối quan hệ của bạn, họ có đầy đủ thông tin về thiết bị bạn đang sử dụng, các cửa hàng bạn đã ghé thăm, kể cả những món hàng bạn mua bán mà không qua thẻ tín dụng. Ồ, và tài khoản của bạn được link với số điện thoại cũng có lý do cả đấy

Ngoài Facebook, Twitter, LinkedIn cũng như các mạng lưới quảng cáo khác đều đang thực hiện theo cách này. Nó chỉ là một phần trong thế giới của các công nghệ quảng cáo mà thôi, và bởi vì bạn sử dụng Facebook nhiều nên bạn thấy nó nhiều và để ý nó thường xuyên. Sẽ rất khó để bạn thoát khỏi các hình thức quảng cáo hiện đại ngày nay.

Kết bài: Facebook đang không nghe lén bạn, nhưng vẫn đang theo dõi bạn bằng nhiều cách khác mà có khi bạn còn không ngờ tới. Phát súng mà bạn không nghe thấy tiếng mới thật sự là phát súng kết liễu bạn!

Tham khảo: Wired

TIN LIÊN QUAN

Facebook bắt đầu cho chạy cả video quảng cáo trong Messenger

Cách đây hơn 1 năm, Facebook đã bắt đầu chạy quảng cáo trong ứng dụng Messenger nhưng đấy chỉ là các quảng cáo hình ảnh bình thường, lần này là quảng cáo video tự chạy. Facebook xác nhận đã bắt đầu thử nghiệm quảng cáo video tự chạy trong Messenger

Hướng dẫn chặn quảng cáo trên Facebook đơn giản hiệu quả

Facebook hiện giờ rất nhiều quảng cáo và bán hàng online, chắc hẳn các bạn đều sẽ cảm thấy rất phiền phức khi Facebook của mình xuất hiện nhan nhản những quảng cáo, livestream. Vậy bây giờ Trang Công Nghệ sẽ hướng dẫn chặn quảng cáo Facebook hiệu

Hướng dẫn 4 bước tạo tài khoản Facebook từ A đến Z

Mạng xã hội có nghĩa là nơi kết nối mọi người ở mọi nơi lại với nhau. Nơi các thành viên tương tác với nhau như chat, tải hình ảnh lên, bình luận… Facebook xoá tan mọi khoảng cách địa lý giống như mạng Internet.

Tài khoản facebook của bạn trị giá bao nhiêu tiền?

Hằng ngày, bạn vẫn sử dụng Facebook thường xuyên. Nhưng bạn có biết giá trị thật sự mang lại tiền từ tài khoản của mình không?

Facebook cho rằng chỉ có 2 loại quảng cáo này mang lại giá trị thực

Qua các cuộc thử nghiệm, Facebook thấy rằng các 'quảng cáo gốc' (native ad) - những quảng cáo thực sự có liên quan đến nội dung của website/ứng dụng đang hiển thị - và quảng cáo...

Facebook sẽ tiến hành chạy quảng cáo trên Facebook Stories lẫn Messenger Stories

Với sự phổ biến của mình, theo ước lượng có khoảng 300 triệu người trên khắp thế giới đang sử dụng Facebook Stories hoặc Messenger Stories. Mặc dù thành tích này không thể sánh được những gì mà Instagram đã làm được song đó vẫn là một thành công ấn

Nga phủ nhận liên quan tới quảng cáo Facebook tác động bầu cử Mỹ

Theo AFP, Điện Kremlin ngày 22/9 tuyên bố không dính líu tới những quảng cáo trên mạng xã hội Facebook có thể đã làm ảnh hưởng tới tổng thống Mỹ hồi năm ngoái.

Quảng cáo sắp 'đổ bộ' vào Facebook Stories

Nếu bạn đã từng thắc mắc: “Liệu trong tương lai, quảng cáo có đổ bộ vào Facebook Stories?”. Thì bây giờ là lúc mà các chúng ta bắt đầu chuẩn bị ngân sách vì “cơn bão” Facebook Stories Ads sẽ đổ bộ trong một ngày không xa.

THỦ THUẬT HAY

Cách ứng tiền Viettel từ 5.000 đến 50.000đ nhanh nhất

Khi thuê bao Viettel của bạn đang trong tình trạng hết tiền và bạn chưa thể nào nạp tiền được, lúc đó cần liên lạc gấp thì hãy nhớ đến dịch vụ ứng tiền Viettel nhanh chóng từ 5.000đ đến 50.000đ. Dịch vụ này của Viettel

Hưỡng dẫn chuyển mã Font VNTimes cũ sang Times New Roman

Có thể nói đây là lỗi thông dụng mà người soạn thảo văn bản nào cũng sẽ gặp phải một lần trong đời. Hãy cùng TCN tìm cách giải quyết vấn đề này bằng các bước đơn giản.

Hướng dẫn tải file ISO Windows 7

Tải Win 7 dưới dạng file ISO sẽ giúp bạn có thể tạo USB boot, USB cài Win 7. Đây là một số nguồn tải file ISO Win 7 để bạn tải Win 7 về máy.

Hướng dẫn tải và cài đặt O&O Defrag để chống phân mảnh ổ cứng

O&O Defrag Pro, một phần mềm chống phân mảnh cho ổ cứng tốt nhất hiện nay, giúp cho tốc độ máy tính được tối ưu và hiệu quả hơn rất nhiều dù máy bạn là máy mới hay máy cũ,

9 mẹo dùng Finder trên Mac đạt hiệu suất công việc tốt nhất

Nếu thường xuyên phải làm việc với thư mục cụ thể nào đó, việc Finder mặc định mở Recents thật phiền toái phải không? Bởi sau đó bạn phải điều hướng tới thư mục khác.

ĐÁNH GIÁ NHANH

Đánh giá nhanh LG V30+: Có gì khác biệt so với đàn anh LG V30?

Để nói V20 hay V30+ đâu là sản phẩm hấp dẫn hơn thì thực sự rất khó bởi mỗi sản phẩm đều có những đường nét riêng ưu điểm và nhược điểm khác nhau, cũng như tuỳ vào con mắt thẩm mỹ của người dùng.

Đánh giá Loa Bluetooth Tronsmart Element T6 – Gã black panther châu Á

Tronsmart là cái tên còn khá mới lạ bên cạnh những ông lớn như Sony, JBL,.. nhưng không vì thế mà hãng loa đến từ Trung Quốc này sản xuất nhưng sản phẩm giá rẻ với chất lượng làng nhàng như đồng hương khác. Chất lượng

Đánh giá tai nghe Bluetooth Partron PBH-400: Hoàn toàn bất ngờ và bị thuyết phục

Partron là thương hiệu âm thanh đến từ Hàn Quốc, tuy chỉ xuất hiện chính thức tại thị trường Việt Nam hơn 1 năm nhưng mẫu tai nghe Bluetooth PBH-400 đã là phiên bản nâng cấp thứ 4 với rất nhiều cải tiến nếu so với