中文字幕亚洲在线观看,综合Av,亚洲成人自拍

分析預(yù)訓(xùn)練語言模型如何利用歸因方法來獲取事實性知識

《Knowledge-Based Systems》：Analyzing how pre-trained language models capture factual knowledge using attribution methods

【字體：大中小】 時間：2026年02月25日 來源：Knowledge-Based Systems 7.6

編輯推薦：

　　預(yù)訓(xùn)練語言模型（PLMs）通過位置鄰近詞和高共現(xiàn)詞而非知識依賴詞捕獲事實知識，依賴知識依賴詞的模式更有效。分析表明，PLMs過度依賴無效模式導(dǎo)致知識捕獲不充分，為優(yōu)化預(yù)訓(xùn)練策略提供依據(jù)。

李少波|孫成杰|劉冰泉|李曉光|尚立峰|董振華|紀振洲|姜欣|劉群

哈爾濱工業(yè)大學(xué)（威海）計算機科學(xué)與技術(shù)系，中國山東省威海市文華西路2號，264209

摘要

最近的研究表明，預(yù)訓(xùn)練的語言模型（PLMs）能夠正確完成諸如“但丁出生于____”這樣的填空式事實查詢，這表明PLMs通過大規(guī)模的預(yù)訓(xùn)練數(shù)據(jù)捕獲了事實知識。這一現(xiàn)象引起了研究人員的興趣，他們希望分析這些捕獲的事實知識，例如其準確性、一致性和偏見。本文從另一個角度進行研究：PLMs在預(yù)訓(xùn)練過程中是如何保留事實知識的。具體來說，本文提出的分析量化了PLMs用于從預(yù)訓(xùn)練樣本中捕獲事實知識的詞級模式。本文使用了兩種特征歸因方法——基于擾動的方法和基于梯度的方法——來互補地揭示這種依賴性。然后，分析這種依賴性與事實知識捕獲性能（即在填空式查詢中的準確性和一致性）之間的關(guān)系。分析結(jié)果表明：（1）PLMs更多地依賴于位置接近且高頻率共現(xiàn)的詞匯來捕獲事實知識，而不是依賴于知識本身的詞匯；（2）依賴于知識本身的詞匯的依賴性比依賴于位置接近且高頻率共現(xiàn)的詞匯更有效。基于上述觀察，我們可以得出結(jié)論：對不適當(dāng)模式的依賴性使得PLMs在捕獲事實知識方面效果不佳。本文的分析揭示了事實知識捕獲過程的奧秘，提供了實證觀察和討論，為改進知識密集型任務(wù)的預(yù)訓(xùn)練策略奠定了基礎(chǔ)。

引言

預(yù)訓(xùn)練的語言模型（PLMs）展現(xiàn)了令人驚訝的能力，例如生成合理的文本并通過少量提示完成任務(wù)[1]、[2]、[3]。隨著研究人員繼續(xù)探索和研究預(yù)訓(xùn)練技術(shù)，一些研究[4]、[5]表明，PLMs在預(yù)訓(xùn)練后也學(xué)到了一些事實知識。例如，PLMs能夠正確回答填空式查詢“但丁出生于[mask]？”，答案是“佛羅倫薩”。這表明PLMs在預(yù)訓(xùn)練過程中捕獲了一些事實知識，并在之后能夠回憶起來。隨后，更多詳細的研究致力于分析這些捕獲的事實知識的具體屬性[6]、[7]，或者尋找更好的提示來從PLMs中提取更多知識[5]、[8]，主要集中在已經(jīng)捕獲的事實知識上。

本文的分析并不關(guān)注捕獲的事實知識的歸因，而是試圖理解PLMs是如何捕獲這些事實知識的，即研究PLMs依賴的模式及其有效性。PLMs在預(yù)訓(xùn)練階段捕獲了事實知識。然后，我們通過探究預(yù)訓(xùn)練模型來研究這些模式及其有效性。

具體來說，對于使用掩碼語言建模任務(wù)[9]、[10]預(yù)訓(xùn)練的模型，我們可以明確地指定預(yù)訓(xùn)練階段和探究階段如下：

定義1 預(yù)訓(xùn)練階段：

PLMs通過恢復(fù)預(yù)訓(xùn)練樣本中缺失的事實詞匯來捕獲事實知識。

定義2 探究階段：

通過用填空題來查詢PLMs，檢查它們是否成功捕獲了事實知識。

圖1展示了這兩個階段。在預(yù)訓(xùn)練階段，語言模型需要根據(jù)剩余的上下文預(yù)測缺失的詞匯。當(dāng)缺失的詞匯代表事實信息時，模型可以通過學(xué)習(xí)預(yù)測這些事實詞匯來學(xué)習(xí)和存儲這些知識。正如之前的研究[4]、[7]所定義的，這些事實詞匯對應(yīng)于知識庫（KB）中的實體。

在圖1提供的例子中，PLM通過被訓(xùn)練來預(yù)測事實詞匯“佛羅倫薩”，從而捕獲了“但丁的出生地”。基于這一范式，我們可以通過揭示PLMs用于捕獲缺失事實詞匯的模式來研究捕獲過程。因此，我們提出了關(guān)于預(yù)訓(xùn)練階段的第一個問題：

研究問題1

PLMs在預(yù)訓(xùn)練過程中依賴哪些詞級模式來捕獲事實知識？

具體來說，我們選擇了三種詞級模式，作為PLMs可能依賴的模式來捕獲缺失的事實詞匯：

依賴知識詞匯 KD

這些詞匯可以根據(jù)知識庫（KB）確定性地推斷出缺失的事實詞匯。

位置接近詞匯 PC

這些詞匯在位置上接近缺失的事實詞匯。

高頻率共現(xiàn)詞匯 HC

這些詞匯與缺失的事實詞匯在語料庫中的共現(xiàn)頻率較高。

圖2展示了例子中的不同詞級模式。“1506年5月20日”對應(yīng)于“哥倫布的死亡日期”這一事實知識，而其他與“1506年5月20日”有不同關(guān)聯(lián)的詞匯則是不同的詞級模式。

為了分析上述模式對事實知識捕獲的影響程度，我們引入了特征歸因方法[11]、[12]來量化PLMs對每種模式的依賴性。我們收集了470萬個預(yù)訓(xùn)練樣本來計算每種模式的歸因值。結(jié)果表明：

觀察1

PLMs在捕獲事實知識時更依賴于位置接近且高頻率共現(xiàn)的詞匯，而不是依賴于知識本身的詞匯。

觀察1揭示了預(yù)訓(xùn)練階段用于捕獲事實知識的模式。接下來，探究階段評估了捕獲性能，即PLMs正確捕獲的事實知識的數(shù)量。如果某種模式有效，那么對這種模式的依賴性應(yīng)該與捕獲性能呈正相關(guān)。這就引出了第二個研究問題：

研究問題2

PLMs依賴的模式對于捕獲事實知識是否有效？

計算每種模式的依賴性與PLMs捕獲性能之間的相關(guān)性可以幫助我們確定詞級模式的有效性。具體來說，我們使用相關(guān)性系數(shù)[13]來衡量模式的有效性。更正的相關(guān)性表示模式更有效/無效。相關(guān)結(jié)果表明：

觀察2

依賴知識本身的詞匯比依賴位置接近且高頻率共現(xiàn)的詞匯更有效。

結(jié)合觀察1和觀察2，我們可以得出結(jié)論：PLMs在捕獲事實知識時更依賴于無效的PC和HC詞匯，而不是有效的KD詞匯。我們的實證結(jié)論為PLMs中的事實錯誤或幻覺[14]提供了明確的解釋。

總之，本文的貢獻如下：

•

分析結(jié)果提供了明確的證據(jù)，解釋了為什么PLMs無法穩(wěn)健地捕獲事實知識，并為如何提高事實知識捕獲能力提供了啟示。

•

本文詳細討論了不同的PLMs、歸因方法和模式（見第5節(jié)），為解釋PLMs提供了更多見解。

•

本文提出了一個雙層次分析框架，明確地將預(yù)訓(xùn)練中學(xué)習(xí)的模式與事實知識捕獲性能聯(lián)系起來。該框架可以推廣到其他下游任務(wù)的錯誤分析中。

概述

本節(jié)詳細介紹了用于回答問題1和問題2的分析框架。圖3提供了一個運行示例來闡明兩階段分析。圖3的左側(cè)部分指的是預(yù)訓(xùn)練階段，其中預(yù)訓(xùn)練樣本包含了關(guān)于“哥倫布”死亡日期的事實知識。利用特征歸因方法，我們量化了每個詞匯在捕獲“1506年5月20日”這一日期方面的貢獻。我們將剩余的詞匯分為三組：KD、PC和HC，每組代表一種

主要結(jié)果

我們選擇了四個使用MLM任務(wù)預(yù)訓(xùn)練的代表性PLMs系列：BERT [9]、RoBERTa [36]、SpanBERT [44] 和 ALBERT [37]。

我們選擇這些PLMs是因為它們涵蓋了不同的預(yù)訓(xùn)練數(shù)據(jù)規(guī)模、模型架構(gòu)和訓(xùn)練策略，使得本文的分析結(jié)果更加可靠。具體來說，BERT作為基礎(chǔ)模型，通過隨機掩碼單個標記來生成預(yù)訓(xùn)練樣本。

討論

本節(jié)提供了從提出的分析框架和結(jié)果中得出的額外見解。它深入探討了不同PLMs捕獲的事實知識的差異，對PLMs中事實知識的歸因方法進行了實證比較，并進行了進一步討論以提供更深入的見解。

結(jié)論

本文提出了一個新穎的兩階段分析框架，專門用于識別和評估PLMs在捕獲事實知識時使用的模式。首先，我們使用兩種典型的歸因方法來衡量PLMs在捕獲事實知識時對三種詞級模式（依賴知識詞匯、位置接近詞匯和高頻率共現(xiàn)詞匯）的依賴性。結(jié)果表明，PLMs更依賴于位置接近且高頻率共現(xiàn)的詞匯，而忽略了依賴于知識本身的線索。

CRediT作者貢獻聲明

李少波：概念化、數(shù)據(jù)整理、調(diào)查、方法論、可視化、撰寫原始稿件、撰寫審稿與編輯。孫成杰：調(diào)查、方法論、監(jiān)督、撰寫審稿與編輯。劉冰泉：調(diào)查、方法論、撰寫審稿與編輯。李曉光：調(diào)查、方法論、撰寫原始稿件、撰寫審稿與編輯。尚立峰：調(diào)查、方法論、撰寫審稿與編輯。董振華：概念化、調(diào)查，

利益沖突聲明

作者聲明他們沒有已知的可能會影響本文報告工作的競爭性財務(wù)利益或個人關(guān)系。

作者同意聲明

本手稿是原創(chuàng)的，之前未發(fā)表過，目前也沒有在其他地方考慮發(fā)表。我們確認所有列出的作者都已閱讀并批準了本手稿，并且沒有其他符合作者資格但未列出的人。我們進一步確認手稿中列出的作者順序已經(jīng)得到批準。我們理解通訊作者是編輯流程的唯一聯(lián)系人。

CRediT作者貢獻聲明

李少波：調(diào)查、可視化、撰寫-審稿與編輯、數(shù)據(jù)整理、撰寫-原始稿件、方法論、概念化。孫成杰：方法論、調(diào)查、撰寫-審稿與編輯、監(jiān)督。劉冰泉：調(diào)查、撰寫-審稿與編輯、方法論。李曉光：撰寫-審稿與編輯、撰寫-原始稿件、方法論、調(diào)查。尚立峰：方法論、撰寫-

利益沖突聲明

作者聲明他們沒有已知的可能會影響本文報告工作的競爭性財務(wù)利益或個人關(guān)系。

致謝

本工作得到了中國國家自然科學(xué)基金（項目編號62406087）、山東省自然科學(xué)基金（項目編號ZR2024QF139）、中國科學(xué)院信息與通信技術(shù)研究院國家重點實驗室（項目編號CLQ202406）以及中國科學(xué)院計算機體系結(jié)構(gòu)國家重點實驗室（項目編號CARCHA202104）的支持。

相關(guān)新聞

生物通微信公眾號

微信

新浪微博

我要投稿

搜索
國際
國內(nèi)
人物
產(chǎn)業(yè)
熱點
科普

熱搜：預(yù)訓(xùn)練語言模型|知識捕獲模式|位置鄰近詞|高共現(xiàn)詞|知識依賴詞

知名企業(yè)招聘

摘要

引言

相關(guān)研究

相關(guān)工作

概述

主要結(jié)果

討論

結(jié)論

CRediT作者貢獻聲明

利益沖突聲明

作者同意聲明

CRediT作者貢獻聲明

利益沖突聲明

致謝

熱點排行

新聞專題