
機器能否進入人類內心深處去了解她們的性格和情感呢?這些問題在心理學領域已經被思考了上千年。日前,微軟亞洲研究院資深研究員謝幸受邀在劇院式演講平臺“造就”上發表主題演講《如何讓機器擁有像人一樣的思維》。我們整理了謝幸的演講視頻及演講內容,全文如下。
大家好,我是微軟亞洲研究院的謝幸。今天我想和大家探討的是,“如何讓機器擁有像人一樣的思維”。
進入正題之前,我先講一個我自己的故事。最近,我給我三歲的女兒買了一本繪本,名字是“Can I build another me”,她愛不釋手。這本書的主角是一個厭倦了自己規律生活的孩子,他希望能訓練出一個機器人代替自己按時午睡、吃飯、去幼兒園,這樣他就可以自由自在地玩耍。于是,他買來一個最便宜的機器人,帶回家來訓練它。在這個過程中,他遇到的第一個問題就是,怎樣才能讓機器人才能變成他呢?于是,他試圖告訴機器人各種關于自己的信息,包括他的姓名、年齡、身高、體重,父母、兄弟和寵物,甚至包括“左撇子”“易煩躁”“襪子經常破洞”這種信息。
我發現這繪本的作者腦洞很大,他也在思考我們所思考的問題。這個故事也告訴我們,要讓機器人擁有人一般的思維,第一步便是理解自己。因為這樣我們才能告訴機器人,怎樣做才能最像自己。今天,我將從以下幾個方面與大家探討這個問題:
1.人工智能與心理學
2.人格分類及推測
3.如何讓機器人像人一樣思考
在很長一段時間內,我們團隊一直從事用戶畫像的研究。什么是用戶畫像?簡單說來,就是通過用戶產生的大數據,去猜測和理解一個人的年齡、職業、興趣愛好,也可以去描繪一群人的生活規律和移動模式。這讓我們開始思考,我們能不能通過這些數據進一步走到人的內心深處,去了解她們的性格和情感呢?這并不容易。但是在研究的過程中,我們發現這些問題在心理學領域已經被思考了上千年。實際上,人工智能和心理學這兩個領域實際上早就有交叉。
人工智能的早期開拓者之一,Herbert A. Simon,是著名的跨界學者。他既是計算機科學家,也是心理學家,是經濟學家,還是社會學家,甚至還是認知科學家。讓人驚嘆的是,他在每個領域都取得了同樣卓越的成績:他獲得了1975年的圖靈獎、1978年的諾貝爾經濟學獎、1986年的美國國家科學獎章,及1993年美國心理學會的終身成就獎。右邊這位是多倫多大學的Geoffrey E. Hinton教授,深度學習的積極推動者。他既是計算科學家,同時也是一位心理學家。
兩年前,我們便開始拜訪著名的心理學家和教授,試圖進行跨學科合作交流。在這個過程中,我們首先想解決的問題就是人格。從用戶生成的大數據中能否計算出人的性格?
雖然人格這個術語在日常生活中很常見,但是給人格下一個準確清晰的定義卻并非易事,即使是心理學家們在這個術語的定義上也很難達成共識。人格最早的定義可以追溯到2000多年前(公元前400年)古希臘醫學家希波克拉底(Hippocrates)的體液說,他認為人體是由四種體液構成,包括血液、粘液、黃膽汁和黑膽汁,而這四種體液的分布便決定了人的性格:黑色的膽汁產生了憂郁型人格,血液產生了樂觀型人格,黃色膽汁產生了沖動易怒型人格,而粘液產生了冷靜型人格。盡管希波克拉底的體液說已經被現代醫學所否定,但是他關于人格分類的探討是有啟發意義的,以致于后來的心理學家仍然一直探討這個問題。
在我們與心理學家交流時,我們又發現了一個有趣事實:在現代心理學中,人格的定義其實跟語言的使用有著緊密的關系。其實在計算機科學領域,我們對語言也有很多研究,我們稱之為“自然語言理解”。在心理學里面,有一個概念叫“詞匯學假說”。什么叫詞匯學假說?根據這個假說,我們無需通過觀察、研究各種各樣的人來研究人格,我們可以簡單一些,通過直接觀察人類語言中相關詞匯。比如說,你介紹一位朋友給我認識,可能會用一大段話來描述他:“他特別喜歡說話;人很多的時候,他特別高興,話特別多;每次都聽到他在說話,是個話癆”等等。其實,一個詞即可概括這段話:健談。因此,心理學家決定整理這些描述性詞匯。如果這個詞匯不多的話,它們便可成為建立分類體系的基礎。基于這些觀察,人格理論的先驅奧爾波特(Allport)和奧德伯特(Odbert)于1936年對英語詞匯進行了艱難而又系統的調查研究。通過查看詞典,他們按照個人特質、暫時的情緒或者行為以及智力與才干這四個類別發現大約18000個單詞,并進一步從中整理出四千多個描述性格的詞匯。雖然說四千似乎已經很少了,但對于整個用戶語言來說,這仍然是很復雜的。試想下,在描述一個人性格的時候,如果要給這四千個描述維度分別打分,這該是多大的工作量。因此,他們想在此基礎上進一步縮減。在這個過程中,他們發現,這些單詞間其實存在一些相關性。比如說,一般外向的人通常也比較健談,冷靜的人通常也比較理智,但他可能也比較內向。如果能定位這些相關性,便可在此基礎上對四千多個詞進行進一步歸類。
近二十年來,人格研究者關注與支持最多的人格定義是五因素模型,也常常被稱之為“大五人格理論”。如圖所示,大五人格包括了五個高度概括的人格因素:外向性 (Extraversion),盡責性 (Conscientiousness),神經質 (Neuroticism),隨和型(Agreeableness)和開放性(Openness)。每個人格因素下還有一些細分特質(比如外向性下包括了是否經常參加活動、是否熱心腸等)。這樣,以后你在介紹朋友時,可以將他描述為“比較外向,但不太隨和,可能比較情緒化的一個人”。方式很簡單,但是描述很全面。實際上,整理這些詞匯以及生成人格分類體系大多是依賴數據驅動,與計算機科學有很多很緊密的聯系。那我們能不能自動的計算用戶的大五人格呢?其實這也是有可能的。
在傳統人格測量中,心理學家往往采用訪談和調查問卷這種形式,需要耗費大量的人力、財力和時間,受測者往往局限于幾十人到幾百人的規模,不可能實現大規模用戶的測量。在座很多人可能都做過心理問卷調查,一般來說有上百道題。我不知道有多少人會認真填寫這上百道題,可能大家都是一路打“三”——一到五分打個中間分,這樣的結果其實沒什么意義。這個工作的確非常麻煩,并且很多時候受訪者自己其實也不知道該打幾分。比如說,比較內向是打一還是二?其實都非常模糊。但是,心理學中還有一種人格測量的方法,叫做行為測量,通過觀察個體的行為來進行測評。行為測量的理論基礎是人格理論中的人類行為的一致性。既然人格能夠解釋人際之間的穩定的個體差異,那么個體行為表現出的差異性就跟個體的人格息息相關,因此通過觀察個體行為使得預測人格變成了可能。只是在計算機技術得到廣泛應用之前,心理學家很難收集到用戶足夠豐富的行為數據,因此數據的匱乏導致了行為測量在傳統心理學中并沒有被廣泛采用。
然而,近年來,隨著互聯網、智能手機和各種傳感設備的普及,用戶的行為數據被廣泛收集,再加上人工智能方法在建模用戶方面的推進,使得通過行為數據測量人格的方法在計算機和心理學的交叉領域得到了快速的發展。我們的研究工作在此基礎上更進一步,提出“人格推測模型”,利用社交媒體上的異構數據(比如頭像照片、發表的文字、表情符使用以及社交關系等)來預測大五人格。比如說針對圖片,我們可以采用深度殘差網絡的方式,算出語義表示,再將這些圖片聚成某些類別,如卡通、自拍、合影、動植物。其實在這個過程中,我們仍然需要和心理學家合作。用基于行為數據的人工智能方法進行人格預測,首先需要收集少量用戶的調查問卷結果作為標注。通過標注用戶行為特點及人格特征,將它們之間的映射和聯系輸入模型中,以訓練出一個好的模型。
實際上,我們找了一批志愿者,他們提供了自己的數據,并完成了問卷調查,這樣我們便擁有兩方面數據。在訓練完模型后,新的用戶便無需完成用戶調查,模型可以自動計算其人格。我們可以來看看計算結果。聽起來是不是很抽象?但其實也很具體。例如,我們可以計算用戶發表文字和性格間的關系。大五人格有五個維度,我們可以計算出文字和每一個維度間是特別正相關或者特別負相關。例如一個經常在朋友圈寫青春和自我的人可能比較外向,而常寫失敗和面對的用戶外向性得分便很低。還有一些用戶可能會寫時代、社會、成功這些聽起來非常正能量的詞匯,我們發現這些人盡責性比較高。相反,有些人可能經常寫隨便、萌萌、氣質這些詞,我們發現他們盡責性比較低。盡責性低并不是一個貶義詞:在這個模型中,在乎結果的人盡責性比較高,在乎過程的人盡責性比較低。這兩個極端都有它的優勢,并無好壞之分。
我們還通過計算大五人格和用戶頭像類簇的皮爾遜系數,展示了與大五人格強烈正相關或者負相關的類簇(每個類簇選取了2張圖片顯示)。這樣的計算揭示了一些有趣的現象:比如外向性得分高的用戶喜歡使用包含笑臉的頭像,而得分低的用戶往往在頭像中遮擋了面部表情或者使用側臉;開放性得分高的用戶往往使用和朋友在一起的照片作為頭像,而開放性得分低的用戶的頭像很多是自拍照。我們的實驗結果表明單單使用頭像照片,就能使個體性格預測的準確性到達0.6。我們不僅對每種維度上的行為數據提出了針對性的特征提取策略,而且使用集成學習技術(Ensemble)有效融合了不同維度的行為數據來提升大五人格預測的準確率,使得個體大五人格預測的準確性到達0.75以上。
在理解用戶之后,下一步就是如何利用這些知識來幫助機器人產生像人一樣的思維。人類希望機器人能實現的重要行為之一就是聊天,微軟也提出了“Conversation as a Platform(對話即平臺)”的概念,認為未來所有人機界面都將轉變為對話界面。
兩年前我看過一部電視劇,至今記憶猶新,是英劇《黑鏡(Black Mirror)》第二季第一集“be right back”。這部電視劇描述了一家人工智能公司,它可以通過一個人的社交媒體和在線聊天數據合成一個虛擬人,來模仿人物原型的性格特點和他的女友進行對話。這看起來很科幻,但實際上離我們已經并不遙遠。2016年10月一篇新聞報道中也提到,來自俄羅斯的創業者Kuyda為了紀念去世的朋友Roman,用他的8000條短信數據訓練了一個聊天機器人,并于2016年5月正式發布。
盡管技術已經前進了一大步,但就算是目前最好的聊天機器人也還無法讓人感覺他是一個具有穩定性格和情感、活生生的人。這就涉及到如何讓機器人的語言和行為更具有個性。
隨著社交網絡盛行,帶有用戶標簽的語言數據變得容易獲取。就像前面提到的新聞報道描述一樣,如果我們有足夠的關于某個人的數據,就有可能訓練出一個和他個性一樣的聊天機器人。當然,我們還可以通過一群人,例如兒童、學生、甚至詩人的數據來訓練出具有一類人特點的機器人。例如,我們是否可以收集所有現代詩人的數據,用這些數據來訓練一個出口成詩的機器人?其實現在也是可以做到的。但是,隨著研究的深入,我相信最終我們還會遇到瓶頸,例如到底如何才能讓機器人具備更加真實的人類性格與情感,這還是需要和心理學家合作。
其實,最早的聊天機器人Eliza就是一個心理咨詢師。大概50多年前,MIT的一位研究員Joseph開發了Eliza,在與用戶聊天時,Eliza引入了心理學家羅杰斯提出的個人中心療法(Person-Centered Therapy),更多強調對話態度,比如尊重與同理心。Eliza其實自己并不主動說新內容,它更多的是一直在引導用戶說話盡可能傾訴。看似討巧的Eliza項目取得了意外的成功,它的效果讓當時的用戶非常震驚,其中就包括了它的創造者Joseph。其實,Joseph當時給這個項目起名字為ELIZA是有出處的。不知大家是否看過《賣花女》?在這個戲劇里,Eliza處在社會底層。為了進入社會上層社會,她努力學習上層人民用的語言,使她看起來像一個上層人士,但最終偽裝被拆穿。Joseph將這個機器人命名為ELIZA,就是希望機器能夠偽裝成人,但他沒想到的是,這個偽裝竟還不容易被拆穿。以致于后來產生一個詞匯,叫ELIZA效應,即高估了機器人能力的一種心理感覺。ELIZA效應其實現在也很常見,比如擊敗頂尖高手的AlphaGo一出現,人們便覺得電腦已經具有下圍棋的靈感,人工智能馬上要超越人類。但其實,AlphaGo背后所有的程序都是人寫的。所謂的靈感,所謂的智能,實際最終都是程序實現的。
受ELIZA項目啟發,微軟亞洲研究院也開展了DiPsy項目,這個項目的目標是讓機器人能夠和人聊天,幫助他們克服心理上的問題。在這個項目中,我們借鑒了心理咨詢中常用的認知行為療法(Cognitive Behavior Therapy) 和正念療法(Mindfulness)。DiPsy的特點是以自然、有效的方式引導對話,讓用戶盡情傾訴。它還會研究用戶心理過程,在數據驅動下,對用戶的心理特質與精神障礙作出診斷。我們采取認知行為療法(CBT)或早期干預,在各種治療性的語境中,改變用戶的思維與行為方式,幫助存在風險的用戶緩解并管理心理問題。
在未來,我們期待這個項目能幫助解決實際的社會問題,例如農村留守兒童的心理疏導。在前不久舉辦的未來論壇上,微軟全球執行副總裁沈向洋說,他想要解決三個和人腦息息相關的疾病:兒童自閉癥、中年憂郁癥、老年癡呆癥。我希望我們的技術能幫助他做到這一點。
當然,這些研究項目很多都還在起步階段,我們希望最終能實現讓機器擁有像人一樣的思維,并在人需要時能提供不僅幫助,還能陪伴。當你孤獨時,至少有個AI與你在一起。