大數據下的選擇與被選擇

郭卓靈   |   明光社項目主任(傳媒及生命教育)
27/05/2021

大數據有助於做分析,但資料也只限於數據上的分析,看不到數據以外的行為及態度。例如大數據會計算收集得來的資料,並把人分類,找出不同的人喜歡觀看甚麼類型的文章或影片內容,然後集中生產及播放這類作品,減少或不再生產少人喜歡的類型作品。這似乎很合理,但其實這會減少了人的選擇,也讓人少了機會去體會比較少人喜歡的作品,及排除了人有改變口味的可能。

推送迎合個人口味的內容,對人們帶來甚麼影響?當大數據在計算你喜歡的東西時,這代表著它會預測及主動配合你的喜好,及提供它認為你會喜歡的東西,也許它的預測結果是相當準確的,而它也會不斷學習,會進步,亦會愈來愈能對準你的口味。但同樣,人們可能會變得愈來愈自我,不會去發掘新事物及作新嘗試,因為愈來愈少機會接觸與自己喜好有所不同的東西。

數據以外的資訊

另一方面,大數據反映出來的結果也不一定完全正確無誤,它也可能有偏差,會存在「偏見」,因為它的分析是基於搜集得來的數據,數據以外的東西,它不會知道。那會引發甚麼問題呢?試想想如公司用網上搜集得來的數據(如社交平台、信用評級)來評定面試者是否合適擔任某崗位的工作,數據可以很仔細,但也可以存在很深的偏見,因為資料會缺少了面試者的態度、他/她是否已改變,及形成數據的因素等資訊。而如果招聘的公司在第一輪面試前過濾一下大數據提供的資訊,一些背景資料不好的人,很可能早就被篩去了,他們可以「翻身」的機會,亦會變得更少。

資料被悄悄收集

事實上,不同的企業、團體正漸漸不動聲色地收集我們的大數據,如駕駛習慣、[1] 觀看電視的習慣,[2] 或醫療數據等,[3] 它們何時會用這些數據?會用數據來做甚麼?會不會他日被用作呈堂證供來指證我們?又或者將數據賣去保險公司,讓他們用數據來計算保費,甚至因應數據而提高保費?另外,不少網友也會經常瀏覽社交平台(如facebook、LinkedIn),並分享自己的行蹤、喜好、習慣、近況及工作經驗等,當這些社交平台意外洩漏用戶資料、[4] 或被黑客入侵時,[5] 受影響用戶的私隱就會被不法份子掌握,我們再也難以保護自己的私隱免被分析及利用。

明智地行使選擇權

所以各位網友,對於分享或發放訊息,其實我們是有選擇權的,我們可以選擇是否分享及分享甚麼。在「開心share」、快樂地分享個人資訊時,也要細思一下我們每次發放訊息,都會留下「數碼足跡」,如有關資料洩露或被利用,有可能會引發嚴重後果。大家在行動前,要細思,好好運用自己的選擇權,避免私隱洩漏,令自己失去選擇。

 

(原文於2021年5月27日刊於本社網站,其後曾作修訂。)


[1] 葉琪:〈Tesla公開行車數據指車速達118.5公里 維權女車主丈夫:侵犯私隱〉,《香港01》,2021年4月24日,網站:https://www.hk01.com/即時中國/615951/tesla公開行車數據指車速達118-5公里-維權女車主丈夫-侵犯私隱(最後參閱日期:2023年2月2日)。

[2] 〈智能電視疑未經用戶同意 收集家庭私隱訊息〉,東網,2021年4月27日,網站:https://hk.on.cc/hk/bkn/cnt/cnnews/20210427/bkn-20210427110122459-0427_00952_001.html(最後參閱日期:2023年2月2日)。

[3] 關樹楨:〈商識滿天下——智能立庫 洞燭機微 健康在手〉,《頭條日報》,2021年4月23日,網站:https://hd.stheadline.com/news/columns/81/20210423/922619/專欄-商識滿天下-智能立庫-洞燭機微-健康在手(最後參閱日期:2023年2月2日)。

[4] 張子傑:〈美媒:Facebook5.33億用戶資料外洩 個人私隱全公開〉,《香港01》,2021年4月4日,網站:https://www.hk01.com/即時國際/608036/美媒-facebook5-33億用戶資料外洩-個人私隱全公開(最後參閱日期:2023年2月2日)。

[5] 〈五億LinkedIn用戶私隱 黑客網站大拍賣〉,《星島日報》,2021年4月10日,網站:https://www.singtao.ca/4873605/2021-04-10/post-五億linkedin用戶私隱-黑客網站大拍賣/?variant=zh-hk(最後參閱日期:2023年2月2日)。

關注範疇: 
傳媒