科技日報北京7月6日電 (記者張佳欣)德國亥姆霍茲慕尼黑研究中心開(kāi)發(fā)出一款名為“半人馬”(Centaur)的人工智能(AI)模型,能在幾乎所有心理學(xué)實(shí)驗中準確預測人類(lèi)行為,甚至超越了科學(xué)家數十年來(lái)打造的傳統認知模型,堪稱(chēng)“數字讀心術(shù)”。這項研究發(fā)表在最新一期《自然》雜志上,被認為是AI與心理學(xué)融合的重要突破。
心理學(xué)家長(cháng)期以來(lái)渴望找到一種既能解釋人類(lèi)思維方式,又能準確預測人類(lèi)行為的工具?,F有模型往往局限于其中之一,“半人馬”的出現改變了這一現狀。
“半人馬”的核心是Psych-101,這是一個(gè)包含160項心理實(shí)驗中6萬(wàn)多人作出的超1000萬(wàn)個(gè)決策的數據集。這些決策涵蓋從簡(jiǎn)單的記憶任務(wù)到復雜的道德困境。每個(gè)實(shí)驗都經(jīng)過(guò)精心標準化,并用自然語(yǔ)言重寫(xiě),以便AI能夠理解并從中學(xué)習。
在模型構建上,團隊選用了Meta公司最新的Llama 3.1語(yǔ)言模型,并基于海量人類(lèi)決策數據集進(jìn)行了微調,使其能預測一系列典型的行為,而不僅僅是單一行為。團隊用Psych-101數據集對模型進(jìn)行訓練,整個(gè)過(guò)程在高端計算機處理器上僅耗時(shí)5天。
訓練完成后,團隊將“半人馬”模型與十余種行為預測模型進(jìn)行了比較,測試對象是未參與最初訓練集的全新受試者。在32項任務(wù)中,“半人馬”在31項中都是預測最有效的模型,唯一的例外是一個(gè)語(yǔ)法判斷任務(wù),即參與者需判斷句子的語(yǔ)法是否正確。
“半人馬”與眾不同之處在于其“舉一反三”的泛化能力,也就是說(shuō),它在面對全新場(chǎng)景時(shí)仍能給出準確預測,無(wú)論是情境設定變化(如將“太空尋寶”改為“魔毯探險”)、任務(wù)結構調整(從雙選變?yōu)槿x),還是完全陌生的推理任務(wù),表現都很出色。
團隊還發(fā)現,“半人馬”的內部處理機制與人類(lèi)大腦活動(dòng)驚人一致。盡管模型從未接觸過(guò)腦神經(jīng)數據,但其內部狀態(tài)與執行同類(lèi)任務(wù)時(shí)的人類(lèi)腦電圖有高度相關(guān)性。這意味著(zhù)在學(xué)習預測人類(lèi)行為的過(guò)程中,AI演化出了類(lèi)似人腦的信息處理方式。
除了行為預測,“半人馬”還能用于模擬人類(lèi)決策過(guò)程,幫助發(fā)現新的心理學(xué)策略。在一項模擬實(shí)驗中,它甚至提出了一種比現有理論更優(yōu)的探索策略,展現出輔助科學(xué)發(fā)現的潛力。
心理學(xué)是研究人類(lèi)心理活動(dòng)及其規律的學(xué)科。既然有規律可循,那就有可能將海量心理學(xué)知識和規律納入數據集,用來(lái)對人工智能進(jìn)行訓練,讓人工智能也“學(xué)會(huì )”這些知識和規律。在心理健康日益受到重視的今天,人工智能在心理學(xué)領(lǐng)域的應用潛力巨大。比如,可以推廣專(zhuān)業(yè)又靠譜的AI心理咨詢(xún)師,幫助用戶(hù)解答日常的心理困惑和疑問(wèn);也可以讓聊天和陪伴機器人掌握心理學(xué)知識,為用戶(hù)提供更多“情緒價(jià)值”。期待看到人工智能為人類(lèi)心理健康貢獻更多力量。