大數據下的選擇與被選擇

郭卓靈   |   明光社項目主任(傳媒教育及行動)
27/05/2021

大數據有助於做分析,但資料也只限於數據上的分析,看不到數據以外的行為及態度。例如大數據會計算收集得來的資料,並把人分類,然後找出不同的人喜歡觀看甚麼類型的文章或片段內容,並會集中生產及播放這類作品,減少或不再生產少人喜歡類型的作品,這似乎很合理,但其實這會減少了人們的選擇,也讓人少了機會去體會比較少人喜歡的作品,及排除了人有改變口味的可能。

對準用戶的口味

這代表著甚麼?當大數據在計算你喜歡的東西,代表著它會預測及主動配合,及提供它認為你會喜歡的東西,也許它的預測結果是相當準確的,而它也會不斷學習,會進步,亦會愈來愈能對準大家的口味。但同樣,人們可能會變得愈來愈自我,不會去發掘新事物及作新嘗試,因為愈來愈少機會接觸與自己喜好有所不同的東西。

數據以外的資訊

另一方面,大數據反映出來的結果也不一定完全正確無誤,它也可能有偏差,會存在「偏見」,因為它的分析是基於搜集得來的數據,數據以外的東西,它不會知道。那會引發甚麼問題呢?試想想如公司用網上搜集得來的數據(如社交平台、信用評級)來評定面試者是否合適擔任某崗位的工作,數據可以很仔細,但也可以存在很深的偏見,因為資料會缺少了面試者的態度、他/她會否已改變,及形成數據的因由等資訊。而如果招聘的公司在第一輪面見前先用大數據提供的資訊作過濾的話,一些背景資料不好的人,就早被篩去了,他們可以「翻身」的機會,亦會變得更少。

資料被悄悄收集

事實上,不同的企業、團體正漸漸不動聲色地收集我們的大數據,如駕駛習慣、[1] 觀看電視的習慣,[2] 或醫療數據等,[3] 它們何時會用?會用數據來做甚麼?會不會他日被用作呈堂證供來指證我們?又或者將數據賣去保險公司,讓他們用數據來計算保費,甚至提高保費?另外,不少網友也會經常瀏覽社交平台(如facebook、LinkedIn),並分享自己的行蹤、喜好、習慣、近況及工作經驗等,當這些社交平台意外洩漏用戶資料、[4] 或被黑客入侵時,[5] 受影響的用戶的私隱就會被不法份子掌握,我們再也難以保護自己的私隱免被分析及利用。

明智地行使選擇權

所以各位網友,對於分享或發放訊息,其實我們是有選擇權的,我們可以選擇是否分享及分享甚麼。在「開心share」、快樂地分享個人資訊時,也要細思一下我們每次發放訊息,都會留下「網絡足跡」,如有關資料洩露或被利用,有可能會引發嚴重後果。大家在行動前,要細思,好好運用自己的選擇權,避免私隱洩漏,令自己失去選擇。


[1] 葉琪:〈Tesla公開行車數據指車速達118.5公里 維權女車主丈夫:侵犯私隱〉,《香港01》,2021年4月24日,網站:https://www.hk01.com/即時中國/615951/tesla公開行車數據指車速達118-5公里-維權女車主丈夫-侵犯私隱(最後參閱日期:2021年5月18日)。

[2] 〈智能電視疑未經用戶同意 收集家庭私隱訊息〉,東網,2021年4月27日,網站:https://hk.on.cc/hk/bkn/cnt/cnnews/20210427/bkn-20210427110122459-0427_00952_001.html(最後參閱日期:2021年5月18日)。

[3] 關樹楨:〈商識滿天下——智能立庫 洞燭機微 健康在手〉,《頭條日報》,2021年4月23日,網站:https://hd.stheadline.com/news/columns/81/20210423/922619/專欄-商識滿天下-智能立庫-洞燭機微-健康在手(最後參閱日期:2021年5月18日)。

[4] 張子傑:〈美媒:Facebook5.33億用戶資料外洩 個人私隱全公開〉,《香港01》,2021年4月4日,網站:https://www.hk01.com/即時國際/608036/美媒-facebook5-33億用戶資料外洩-個人私隱全公開(最後參閱日期:2021年5月18日)。

[5] 〈五億LinkedIn用戶私隱 黑客網站大拍賣〉,《星島日報》,2021年4月10日,網站:https://www.singtao.ca/4873605/2021-04-10/post-五億linkedin用戶私隱-黑客網站大拍賣/?variant=zh-hk(最後參閱日期:2021年5月18日)。