盡信數據不如無數據:由阿富汗、越南到星空奇遇記

余創豪   |   美國亞利桑那州立大學(Arizona State University)教育心理學博士,專門於心理測量與統計學,亦是同校哲學博士,專門於科學哲學與歷史,現在是美國阿蘇薩太平洋大學(Azusa Pacific University)應用行為科學與數據科學教授。
26/08/2021
專欄:有情無國界 (*所有文章只屬作者個人意見,不代表本社立場)
地區:美國

美國的人工智能可以預知未來?

8月15日阿富汗迅速淪陷,震驚了全世界。在此之前10日,亦即是8月初,美國一本名叫CNET的科技雜誌,報道了一宗較少人注意的新聞,其內容如下:7 月中旬,五角大樓宣佈美國國防部正在使用人工智能來預測未來幾天的事件。北美航空航天防禦司令部(NORAD)和美國北方指揮部司令格倫‧範赫克將軍(General Glen VanHerck)在一次簡報會上對記者說:「我們能夠看到更遠,我們再不是被動地回應,而是能夠採取主動。我說的更遠,並不是幾分鐘或者幾小時之前,我說的是幾天之前。」範赫克將軍解釋說,在這個全球警報系統中,五角大樓使用來自全球各地的傳感器,不僅是軍事傳感器,還包括商業的,國防部利用這些數據來預測任何威脅。如果人工智能檢測到在世界某個角落發生不尋常的變化,這個系統會發送警報,建議仔細查看該地區的衛星圖像,看一看是否有可疑活動。

我相信讀者已經猜到下幾句我會說甚麼:說起來天下無敵,做起來有心無力!公平地說,這套人工智能系統仍然處於實驗階段,但美國的情報系統確實已經採用衛星和感應器監察世界上每一個角落。諷刺的是,塔利班沒有人工智能、大數據分析、超級電腦、間諜衛星、無人偵察機、感應器……不過,這一切尖端科技都無法估量到宗教狂熱如何令到塔利班充滿動力,和無法預測到阿富汗政府軍的戰鬥意志是何等脆弱。在阿富汗淪陷之前,拜登總統充滿信心地說,阿富汗政府有30萬大軍,他們裝備精良,受過良好訓練,其戰鬥力足以媲美世界上任何部隊。

管理學教授成為國防部長

現在不少評論家將阿富汗和越南相提並論,這些比較大都是集中在美國政策的失誤,不過,很少人注意到,兩者的共通點之一就是美國決策者對科技和科學的迷信。

在越戰期間,美國的國防部長是羅伯特‧麥克納馬拉(Robert McNamara),他原本是一名會計師,在24 歲時他成為哈佛商學院最年輕的教授,可說是少年得志。美國的商業管理側重於定量方法,亦即是基於統計數字而決定策略,麥克納馬拉大力鼓吹這種科學化商業管理方法。

後來麥克納馬拉進入福特汽車公司工作,在他的領導下,福特公司採用電腦去設計汽車模型,從而找出最有效率的生產方式。麥克納馬拉1961年成為國防部長,他將這種模式帶進軍隊裏面,在策劃越南戰爭時,他用統計方法去作為衡量成功的標準,例如轟炸機的出動次數、發射炮彈的數量、摧毀了敵人幾多個目標、敵我雙方的傷亡人數……按照統計數字,美軍看似大佔上風,北越軍隊的傷亡遠比美軍慘重,但麥克納馬拉無法從統計數字裡面看出無形或者難以測量的決勝因素,例如戰略、領導能力、宣傳戰、團隊凝聚力、軍人的士氣。當時北越及其盟友高舉共産理想、民族主義的鮮明旗幟,士兵士氣高昂。蘋果電腦公司聯合創始人史蒂夫.沃茲尼亞克(Steve Wozniak)在回顧那段歷史時表示,當時左派和反戰陣營的理論非常清晰和有說服力,但主戰陣營卻無法提出合理的反駁。這種思想深度的差别,在統計數字上是無法體現的。

《星空奇遇記》因低收視率被腰斬

越南戰爭期間,美國誕生了《星空奇遇記》這部家傳戶曉的科幻經典(Star Trek也譯為《星際迷航》),這套電視劇集的第一季在1966年由全國廣播公司(NBC)推出,上面提過,統計方法是商業機構的決策基礎,電視台也不例外,收視率決定了一部劇集能否持續下去。根據尼爾森評級 (Nielsen ratings),《星空奇遇記》的收視率只是一般,於是乎,全國廣播公司在播出第三季《星空奇遇記》之後便決定取消該劇集。但傳播學者指出:全國廣播公司忽略了那些收看此劇集的觀眾在情緒上十分投入,尼爾森評級並不能衡量這種痴迷。出乎意料之外,幾年之後,《星空奇遇記》風靡全美,直至今天,這熱潮仍是方興未艾。

除了政府機關和商業機構,美國教育團體也十分重視教學科技和統計數據,以下的例子我已經說過很多次,請讀者包容我的冗贅:美國學校採用了五花八門的高科技,但學生程度卻每況愈下;此外,許多大學採用數據來決定教授的去留升遷,例如出版論文的數目、學生對老師的評分。就像NBC因收視率低而取消《星空奇遇記》一樣,許多大學因學生的評分低而解僱教授。根據斯蒂芬‧本頓(Stephen Benton)及其團隊的研究,其實學生對教師的評價取決於幾個學生的自身因素:學生的工作倫理、原動力、知識基礎。如果班中大多數學生具有上述的良好品質,那麼無論誰教他們,課程評分往往都很高。不幸的是,課程評核數據從來不會顯示學生是否願意努力學習、是否熱衷於知識、是否具有堅實的基礎。

美國出現了一種兩極化的現象:一方面,普羅大眾不信任科學,直至現在,仍然有很多人不相信新冠疫情是真實的,仍然反對戴口罩,反對注射疫苗,仍然相信各式各樣的陰謀論;但同一時間,精英圈子裡面卻彌漫著迷信科技和科學萬能的態度。孟子說:「盡信書不如無書。」雖然我從事數據分析,但我並不是數據至上主義者,套用孟子的說話,盡信數據不如無數據!