<tt id="vwe5b"></tt>
      1. <tfoot id="vwe5b"><progress id="vwe5b"></progress></tfoot><abbr id="vwe5b"></abbr>

      2. 91人人妻,99偷拍,碰碰免费视频,亚洲中文字幕AV,丝袜a片,91纯肉动漫,中文无码日,伊人福利导航

        分析預(yù)訓(xùn)練語言模型如何利用歸因方法來獲取事實性知識

        《Knowledge-Based Systems》:Analyzing how pre-trained language models capture factual knowledge using attribution methods

        【字體: 時間:2026年02月25日 來源:Knowledge-Based Systems 7.6

        編輯推薦:

          預(yù)訓(xùn)練語言模型(PLMs)通過位置鄰近詞和高共現(xiàn)詞而非知識依賴詞捕獲事實知識,依賴知識依賴詞的模式更有效。分析表明,PLMs過度依賴無效模式導(dǎo)致知識捕獲不充分,為優(yōu)化預(yù)訓(xùn)練策略提供依據(jù)。

          
        李少波|孫成杰|劉冰泉|李曉光|尚立峰|董振華|紀振洲|姜欣|劉群
        哈爾濱工業(yè)大學(xué)(威海)計算機科學(xué)與技術(shù)系,中國山東省威海市文華西路2號,264209

        摘要

        最近的研究表明,預(yù)訓(xùn)練的語言模型(PLMs)能夠正確完成諸如“但丁出生于____”這樣的填空式事實查詢,這表明PLMs通過大規(guī)模的預(yù)訓(xùn)練數(shù)據(jù)捕獲了事實知識。這一現(xiàn)象引起了研究人員的興趣,他們希望分析這些捕獲的事實知識,例如其準確性、一致性和偏見。本文從另一個角度進行研究:PLMs在預(yù)訓(xùn)練過程中是如何保留事實知識的。具體來說,本文提出的分析量化了PLMs用于從預(yù)訓(xùn)練樣本中捕獲事實知識的詞級模式。本文使用了兩種特征歸因方法——基于擾動的方法和基于梯度的方法——來互補地揭示這種依賴性。然后,分析這種依賴性與事實知識捕獲性能(即在填空式查詢中的準確性和一致性)之間的關(guān)系。分析結(jié)果表明:(1)PLMs更多地依賴于位置接近且高頻率共現(xiàn)的詞匯來捕獲事實知識,而不是依賴于知識本身的詞匯;(2)依賴于知識本身的詞匯的依賴性比依賴于位置接近且高頻率共現(xiàn)的詞匯更有效。基于上述觀察,我們可以得出結(jié)論:對不適當(dāng)模式的依賴性使得PLMs在捕獲事實知識方面效果不佳。本文的分析揭示了事實知識捕獲過程的奧秘,提供了實證觀察和討論,為改進知識密集型任務(wù)的預(yù)訓(xùn)練策略奠定了基礎(chǔ)。

        引言

        預(yù)訓(xùn)練的語言模型(PLMs)展現(xiàn)了令人驚訝的能力,例如生成合理的文本并通過少量提示完成任務(wù)[1]、[2]、[3]。隨著研究人員繼續(xù)探索和研究預(yù)訓(xùn)練技術(shù),一些研究[4]、[5]表明,PLMs在預(yù)訓(xùn)練后也學(xué)到了一些事實知識。例如,PLMs能夠正確回答填空式查詢“但丁出生于[mask]?”,答案是“佛羅倫薩”。這表明PLMs在預(yù)訓(xùn)練過程中捕獲了一些事實知識,并在之后能夠回憶起來。隨后,更多詳細的研究致力于分析這些捕獲的事實知識的具體屬性[6]、[7],或者尋找更好的提示來從PLMs中提取更多知識[5]、[8],主要集中在已經(jīng)捕獲的事實知識上。
        本文的分析并不關(guān)注捕獲的事實知識的歸因,而是試圖理解PLMs是如何捕獲這些事實知識的,即研究PLMs依賴的模式及其有效性。PLMs在預(yù)訓(xùn)練階段捕獲了事實知識。然后,我們通過探究預(yù)訓(xùn)練模型來研究這些模式及其有效性。
        具體來說,對于使用掩碼語言建模任務(wù)[9]、[10]預(yù)訓(xùn)練的模型,我們可以明確地指定預(yù)訓(xùn)練階段和探究階段如下:

        定義1 預(yù)訓(xùn)練階段:

        PLMs通過恢復(fù)預(yù)訓(xùn)練樣本中缺失的事實詞匯來捕獲事實知識。

        定義2 探究階段:

        通過用填空題來查詢PLMs,檢查它們是否成功捕獲了事實知識。
        圖1展示了這兩個階段。在預(yù)訓(xùn)練階段,語言模型需要根據(jù)剩余的上下文預(yù)測缺失的詞匯。當(dāng)缺失的詞匯代表事實信息時,模型可以通過學(xué)習(xí)預(yù)測這些事實詞匯來學(xué)習(xí)和存儲這些知識。正如之前的研究[4]、[7]所定義的,這些事實詞匯對應(yīng)于知識庫(KB)中的實體。
        在圖1提供的例子中,PLM通過被訓(xùn)練來預(yù)測事實詞匯“佛羅倫薩”,從而捕獲了“但丁的出生地”。基于這一范式,我們可以通過揭示PLMs用于捕獲缺失事實詞匯的模式來研究捕獲過程。因此,我們提出了關(guān)于預(yù)訓(xùn)練階段的第一個問題:

        研究問題1

        PLMs在預(yù)訓(xùn)練過程中依賴哪些詞級模式來捕獲事實知識?
        具體來說,我們選擇了三種詞級模式,作為PLMs可能依賴的模式來捕獲缺失的事實詞匯:

        依賴知識詞匯 KD

        這些詞匯可以根據(jù)知識庫(KB)確定性地推斷出缺失的事實詞匯。

        位置接近詞匯 PC

        這些詞匯在位置上接近缺失的事實詞匯。

        高頻率共現(xiàn)詞匯 HC

        這些詞匯與缺失的事實詞匯在語料庫中的共現(xiàn)頻率較高。
        圖2展示了例子中的不同詞級模式。“1506年5月20日”對應(yīng)于“哥倫布的死亡日期”這一事實知識,而其他與“1506年5月20日”有不同關(guān)聯(lián)的詞匯則是不同的詞級模式。
        為了分析上述模式對事實知識捕獲的影響程度,我們引入了特征歸因方法[11]、[12]來量化PLMs對每種模式的依賴性。我們收集了470萬個預(yù)訓(xùn)練樣本來計算每種模式的歸因值。結(jié)果表明:

        觀察1

        PLMs在捕獲事實知識時更依賴于位置接近且高頻率共現(xiàn)的詞匯,而不是依賴于知識本身的詞匯。
        觀察1揭示了預(yù)訓(xùn)練階段用于捕獲事實知識的模式。接下來,探究階段評估了捕獲性能,即PLMs正確捕獲的事實知識的數(shù)量。如果某種模式有效,那么對這種模式的依賴性應(yīng)該與捕獲性能呈正相關(guān)。這就引出了第二個研究問題:

        研究問題2

        PLMs依賴的模式對于捕獲事實知識是否有效?
        計算每種模式的依賴性與PLMs捕獲性能之間的相關(guān)性可以幫助我們確定詞級模式的有效性。具體來說,我們使用相關(guān)性系數(shù)[13]來衡量模式的有效性。更正的相關(guān)性表示模式更有效/無效。相關(guān)結(jié)果表明:

        觀察2

        依賴知識本身的詞匯比依賴位置接近且高頻率共現(xiàn)的詞匯更有效。
        結(jié)合觀察1和觀察2,我們可以得出結(jié)論:PLMs在捕獲事實知識時更依賴于無效的PC和HC詞匯,而不是有效的KD詞匯。我們的實證結(jié)論為PLMs中的事實錯誤或幻覺[14]提供了明確的解釋。
        總之,本文的貢獻如下:
      3. 分析結(jié)果提供了明確的證據(jù),解釋了為什么PLMs無法穩(wěn)健地捕獲事實知識,并為如何提高事實知識捕獲能力提供了啟示。
      4. 本文詳細討論了不同的PLMs、歸因方法和模式(見第5節(jié)),為解釋PLMs提供了更多見解。
      5. 本文提出了一個雙層次分析框架,明確地將預(yù)訓(xùn)練中學(xué)習(xí)的模式與事實知識捕獲性能聯(lián)系起來。該框架可以推廣到其他下游任務(wù)的錯誤分析中。
      6. 相關(guān)研究

        相關(guān)工作

        本文研究了PLMs用于捕獲事實知識的模式,使用了解釋方法。它涉及兩個方面的工作:(1)PLMs中事實知識的探究;(2)神經(jīng)模型的解釋方法。本節(jié)分別對這些工作進行了概述。

        概述

        本節(jié)詳細介紹了用于回答問題1和問題2的分析框架。圖3提供了一個運行示例來闡明兩階段分析。圖3的左側(cè)部分指的是預(yù)訓(xùn)練階段,其中預(yù)訓(xùn)練樣本包含了關(guān)于“哥倫布”死亡日期的事實知識。利用特征歸因方法,我們量化了每個詞匯在捕獲“1506年5月20日”這一日期方面的貢獻。我們將剩余的詞匯分為三組:KD、PC和HC,每組代表一種

        主要結(jié)果

        我們選擇了四個使用MLM任務(wù)預(yù)訓(xùn)練的代表性PLMs系列:BERT [9]、RoBERTa [36]、SpanBERT [44] 和 ALBERT [37]。
        我們選擇這些PLMs是因為它們涵蓋了不同的預(yù)訓(xùn)練數(shù)據(jù)規(guī)模、模型架構(gòu)和訓(xùn)練策略,使得本文的分析結(jié)果更加可靠。具體來說,BERT作為基礎(chǔ)模型,通過隨機掩碼單個標記來生成預(yù)訓(xùn)練樣本。

        討論

        本節(jié)提供了從提出的分析框架和結(jié)果中得出的額外見解。它深入探討了不同PLMs捕獲的事實知識的差異,對PLMs中事實知識的歸因方法進行了實證比較,并進行了進一步討論以提供更深入的見解。

        結(jié)論

        本文提出了一個新穎的兩階段分析框架,專門用于識別和評估PLMs在捕獲事實知識時使用的模式。首先,我們使用兩種典型的歸因方法來衡量PLMs在捕獲事實知識時對三種詞級模式(依賴知識詞匯、位置接近詞匯和高頻率共現(xiàn)詞匯)的依賴性。結(jié)果表明,PLMs更依賴于位置接近且高頻率共現(xiàn)的詞匯,而忽略了依賴于知識本身的線索。

        CRediT作者貢獻聲明

        李少波:概念化、數(shù)據(jù)整理、調(diào)查、方法論、可視化、撰寫原始稿件、撰寫審稿與編輯。孫成杰:調(diào)查、方法論、監(jiān)督、撰寫審稿與編輯。劉冰泉:調(diào)查、方法論、撰寫審稿與編輯。李曉光:調(diào)查、方法論、撰寫原始稿件、撰寫審稿與編輯。尚立峰:調(diào)查、方法論、撰寫審稿與編輯。董振華:概念化、調(diào)查,

        利益沖突聲明

        作者聲明他們沒有已知的可能會影響本文報告工作的競爭性財務(wù)利益或個人關(guān)系。

        作者同意聲明

        本手稿是原創(chuàng)的,之前未發(fā)表過,目前也沒有在其他地方考慮發(fā)表。我們確認所有列出的作者都已閱讀并批準了本手稿,并且沒有其他符合作者資格但未列出的人。我們進一步確認手稿中列出的作者順序已經(jīng)得到批準。我們理解通訊作者是編輯流程的唯一聯(lián)系人。

        CRediT作者貢獻聲明

        李少波:調(diào)查、可視化、撰寫-審稿與編輯、數(shù)據(jù)整理、撰寫-原始稿件、方法論、概念化。孫成杰:方法論、調(diào)查、撰寫-審稿與編輯、監(jiān)督。劉冰泉:調(diào)查、撰寫-審稿與編輯、方法論。李曉光:撰寫-審稿與編輯、撰寫-原始稿件、方法論、調(diào)查。尚立峰:方法論、撰寫-

        利益沖突聲明

        作者聲明他們沒有已知的可能會影響本文報告工作的競爭性財務(wù)利益或個人關(guān)系。

        致謝

        本工作得到了中國國家自然科學(xué)基金(項目編號62406087)、山東省自然科學(xué)基金(項目編號ZR2024QF139)、中國科學(xué)院信息與通信技術(shù)研究院國家重點實驗室(項目編號CLQ202406)以及中國科學(xué)院計算機體系結(jié)構(gòu)國家重點實驗室(項目編號CARCHA202104)的支持。
        相關(guān)新聞
        生物通微信公眾號
        微信
        新浪微博
        • 搜索
        • 國際
        • 國內(nèi)
        • 人物
        • 產(chǎn)業(yè)
        • 熱點
        • 科普

        知名企業(yè)招聘

        熱點排行

          今日動態(tài) | 人才市場 | 新技術(shù)專欄 | 中國科學(xué)人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術(shù)快訊 | 免費試用

          版權(quán)所有 生物通

          Copyright© eBiotrade.com, All Rights Reserved

          聯(lián)系信箱:

          粵ICP備09063491號