由武當張三丰說到生成人工智能

余創豪   |   美國亞利桑那州立大學(Arizona State University)教育心理學博士,專門於心理測量與統計學,亦是同校哲學博士,專門於科學哲學與歷史。現在是夏威夷大學數據科學教授與課程主任。
06/03/2024
專欄:有情無國界 (*所有文章只屬作者個人意見,不代表本社立場)
地區:美國

從前筆者曾經修讀過教育心理學,我最佩服的教育心理學家是誰人呢?可能讀者永遠無法猜出來,那就是在《倚天屠龍記》裡面的武當張三丰,張三丰曾經對張無忌示範太極劍法,示範完畢之後,張三丰問張無忌能夠記得幾多劍招,張無忌說不記得,但張三丰反而讚好。張三丰不愧為一代宗師、世外高人,他要張無忌學習的並不是一板一眼的招式,而是綿綿不絕的劍意,這個更高的境界,並不能通過單純的模仿就可以達到,張無忌必須要拋開細節,用心來感悟在招式以外的劍勢,要神似而不是形似,用現代的術語來說,那就是「追尋模式」(Pattern seeking or pattern recognition)。

第二位我佩服的教育心理學家是陶淵明,他曾經在《五柳先生傳》裡面這樣說「好讀書,不求甚解。每有會意,便欣然忘食。」 很多老師都用「讀書不求甚解」這句話去指責成績低劣的學生,意思是他們渾渾噩噩、馬馬虎虎,相反,我用這句話來稱讚學生。如果陶淵明讀書方法真的是這般不濟,他又怎可能成為偉大的田園詩人呢? 所謂「讀書不求甚解」,是指不應該拘泥於字句的表面意思和細節,而是著眼於微言大義,所以陶淵明領會到深層的意思後,便會興奮到不知飢餓為何物。

第三位我所佩服的教育心理學家是唐朝詩人杜甫,他曾經說:「讀書破萬卷,下筆如有神。」 清代仇兆鳌在《杜詩詳注》中解釋「破萬卷」的意思,是指「識破萬卷之理」,杜甫的詩作在結構、風格和主題上都有其獨特性,難怪他能夠成為一代「詩聖」。

這是筆者一直沿用的學習進路,我很喜歡參觀博物館、畫廊、工藝展覽,但之後幾乎所有看過東西都變成了過眼雲煙,而我所讀過的書,都好像是水過鴨背,但這並不打緊。古人說:「熟讀唐詩三百首,不會吟詩也會偷。」 其實,有時候記性太好反而是一種學習的障礙,若果你很清楚記得唐詩的句子,那麼你的作品便無法擺脫前人的影子。但是,若果你領悟了詩意,便反而可以開創出嶄新的風格。 

不過,假若你依稀記得一些從前瀏覽過的資料內容,便可能會出現問題,心理學上有一種名叫「隱性遺忘症」(Cryptoamnesia)的現象,這情況是一名藝術家或者一名作者在潛移默化之下吸收了人家的主意,但隨後漫不經意地在作品中展現了太過相似的元素,於是乎被指控抄襲。根據1989年發表的一項心理學研究,3%到9%的人會不自覺地將別人的主意當成是自己的原創。美國音樂家傑克.阿什福德 (Jack Ashford)坦然承認:「如果你仔細檢查我所寫的一百多首歌曲,你會發現在每一首裡面我都受了其他歌曲的影響。」 

然而,怎樣去分辨隱性遺忘症和故意抄襲卻並不容易,海倫.凱勒(Helen Keller)是美國著名作家,她在19個月大的時候染上重病,導致她失去了視覺和聽覺,儘管命運是如此坎坷,通過不懈的努力,她終於成為了文壇巨星,一生之中撰寫了14本書,她的奮鬥故事很勵志,但很少人知道她曾經被控告剽竊他人的作品。1891年,凱勒發表了一篇題為《冰霜之王》(Frost King)的小說,但後來人們發現這個故事與瑪格麗特‧坎比(Margaret Canby)寫的另一本小說《霜仙女》(Frost Fairies)有點相似。凱勒自辯說,在小時候曾經有人將坎比的故事讀給她,她只是聽過一次,但隨後忘記了。凱勒受到調查,但專家小組以四比四的分歧意見陷入僵局。因為這事件發生的年代已經久遠,所以現在已經變成了懸案,但我相信海倫‧凱勒應該是清白的。由於她是傷殘人士,故此她沒有可能翻查《霜仙子》的細節,然後有系統地改頭換面。

有趣的是,現在人工智能系統能夠記錄很多資料的細節,但人工智能生成工具在運作過程中卻拋開了具體內容。相信人工智能工具現在已經成為了許多讀者生活的一部份,對人工智能生成系統最強烈的批判之一,就是所謂人工智慧並不是真正的智慧,它並沒有創造新的知識或者新的作品,而是將現有的東西左拼右湊。

其實這是一個誤解,以Midjourney、Stable Diffusion這些人工智能藝術生成工具為例,它們並不是好像「熟讀唐詩三百首」般鸚鵡學舌,簡單地複製和拼貼現有藝術家的作品。相反,它們分析並學習大量藝術作品的表現模式、風格、元素。經過訓練之後,生成工具就可以創造新的藝術作品。說得簡單一點,它們並不是學習具體的內容,而是追求「會意」、「模式」。 

從這個意義上來看,生成式人工智能已經具有了真正智慧的一些特徵,那就是「湧現屬性」(Emergent property)。在心靈哲學和神經科學中,湧現屬性是指大腦由簡單的腦細胞組成,但當這些簡單的物質整合一起而形成神經網路時,我們就有了意識和思想,而這些湧現出來的心靈是無法預測的。換句話說,整體是大於其各部份的總和(The whole is more than the sum of its parts)。同樣道理,當生成式人工智能系統接收到億萬份輸入資料時,它們就可以湧現出無法預測、前所未有的新東西,這類似杜甫所說的「讀書破萬卷,下筆如有神」。

可能會有人批評說:生成式人工智能其實是患上了「隱性遺忘症」,它並不似張無忌或者陶淵明,真的忘記或者漠視細節,其實它比人類更加能夠清楚記住所有具體內容,它展現了似乎是「理解」的行為,其作品看上去富有創作性,但它並不能真正地意會到更高的境界、領悟到更深的層次,充其量人工智能只算是海倫.凱勒。這說法是有點道理的,不過,生成式人工智能現在仍處於草創階段,我相信假以時日必會突飛猛進。

最後,我希望讀者不會發現這篇文章和其他作品有相似之處,在此聲明,如有雷同,實屬巧合,或者我是患上了「隱性遺忘症」。