人妻丝袜,香蕉视频在线国产,中文字幕日韩有码

首頁今日動態人才市場新技術專欄中國科學人云展臺
BioHot
云講堂直播會展中心特價專欄技術快訊免費試用

生物通官微
陪你抓住生命科技
跳動的脈搏

生物通首頁 > 今日動態 > 正文

CLERK：一款用于建模監管知識的大型語言模型輔助工具

《Data & Knowledge Engineering》：CLERK: A Companion Large Language Model Expert for modeling Regulatory Knowledge

【字體：大中小】 時間：2026年03月03日 來源：Data & Knowledge Engineering 2.6

編輯推薦：

　　法律目標要求語言（GRL）建模助手CLERK通過Tree-of-Thought框架分解任務并自評估中間結果，結合少樣本學習和格式化輸出提升法律監管文本建模的準確性和效率。實驗表明其在醫療和能源領域顯著優于先前方法，尤其在識別相關角色、目標及模態關系方面表現突出。

喬納森·席爾瓦·梅爾卡多（Jonathan Silva Mercado）|秦馬（Qin Ma）|西布倫·德·金德倫（Sybren de Kinderen）|卡羅琳·溫特（Karolin Winter）|喬迪·卡博特（Jordi Cabot）

盧森堡大學，埃施-蘇爾-阿爾澤特（Esch-sur-Alzette），盧森堡

摘要

大型語言模型（LLMs）有潛力支持將自然語言法律文本轉換為規范模型，這一任務傳統上被認為是耗時且容易出錯的。

在本文中，我們介紹了CLERK：一個用于建模自然語言法律文本中存在的規范知識的輔助大型語言模型專家（CLERK）。CLERK以法律目標需求語言（Legal Goal Requirements Language, GRL）模型的形式捕獲規范知識。

CLERK提供了三項關鍵貢獻，利用了成熟的提示技術：（1）采用思維樹（Tree-of-Thought, ToT）提示框架，通過將復雜步驟分解為可管理的任務并僅關注構建法律GRL模型所必需的步驟，從而簡化了規范建模過程。（2）ToT框架允許對中間輸出進行自我評估。（3）CLERK通過利用額外的上下文學習提示技術（如少量樣本提示和具有明確語法定義的輸出格式化）來提高一致性和清晰度。

通過對來自兩個領域（醫療保健和能源行業）的八篇規范文章的實驗表明，與之前的方法相比，CLERK帶來了顯著的改進。這種改進體現在識別相關參與者、目標及其義務模態，以及目標之間的關系方面。

引言

由于監管環境迅速變化[1]以及隨之而來的監管文件數量的增長[2],[3]，合規性已成為組織日益關注的問題。相關的監管文件往往內容廣泛且復雜[1],[2]，這使得其分析工作既費力又容易出錯[2]。

在眾多支持合規性相關任務的方法中（例如，從監管文本中提取軟件需求[1],[4]，或檢查軟件需求是否符合監管要求[5],[6]），存在許多基于模型的方法[3],[7]。由于這些方法的半正式性質，它們能夠為合規性檢查任務提供自動化支持[8]。憑借其概念性和可視化特性，它們還有潛力作為分析工具，例如分析監管對組織目標或業務流程的影響[3],[7]。此外，作為基于模型的方法，它們還可以促進例如旨在實現合規軟件系統的需求工程師之間的共同理解。

以法律目標為導向的需求語言（Legal Goal Requirements Language, Legal GRL）就是這樣一種基于模型的合規性方法。作為一種以目標為導向的語言[7]，Legal GRL提供了一種可視化的建模符號和方法來檢查組織目標和流程的合規性。憑借其可視化符號，Legal GRL有可能使需求工程師更容易理解合規性問題[9]。在建立在堅實的監管概念基礎上的成熟法律目標需求語言（GRL）之上，并得到成熟軟件工具的支持[11]，Legal GRL為支持合規性提供了一種有前景的建模方法。

然而，目前使用Legal GRL進行規范建模和分析還缺乏自動化輔助，這使得其使用既耗時又容易出錯[12],[13]。此外，我們的經驗表明，對于新用戶來說，Legal GRL的學習曲線較為陡峭，主要是因為除了建模方法本身外，還需要掌握其背后的監管框架。這種概念復雜性與缺乏自動化輔助的結合降低了新用戶的可訪問性。

因此，有人呼吁自動化使用Legal GRL進行規范建模和分析[9],[12],[13]。早期的工作[12],[13]提出了一種基于邏輯的自動化方法，但尚未完全實現。最近，[9]提出了使用大型語言模型（LLMs）自動創建Legal GRL模型的方法。核心思想是依靠提示模式[14, p. 7]來輔助法律文本的規范分析。例如，在要求LLM分析法規時，應用了基于角色的提示來突出特定參與者。

盡管如此，[9]僅初步嘗試利用LLMs進行Legal GRL的自動化建模。如第2節所述，它采用了一個詳盡的、順序的提示列表，嚴格遵循原始的Legal GRL方法，但沒有評估每個步驟的真正必要性，也沒有糾正中間錯誤的機制。此外，某些建模概念（如貢獻鏈接）在提示設計中規定得不夠充分。

作為回應，我們在本文中提出了CLERK：一個用于建模規范知識的輔助大型語言模型專家（CLERK）。CLERK結合了精心挑選的提示技術來支持從監管文本中創建Legal GRL模型的任務。具體來說，CLERK在以下方面改進了現有工作：（1）它通過將復雜步驟分解為可管理的任務來簡化規范建模，僅關注構建Legal GRL模型所必需的步驟。為此，CLERK使用了思維樹（ToT）提示框架[14, p. 13]，該框架允許將建模問題分解為一組子任務。（2）ToT框架允許對中間輸出進行自我反思和評估[15]，從而選擇構建最終Legal GRL模型時最有前途的分支。（3）CLERK利用額外的上下文學習提示技術來提高一致性和清晰度。這些提示技術包括少量樣本提示[14, p. 13]和具有明確語法定義的輸出格式化。

為了開發和評估CLERK，我們采用了設計科學研究方法[16]，具體遵循圖1中所示的規范周期[17, p. 28]。我們從問題識別開始，基于文獻回顧和第2.1節和第2.2節中概述的先前工作。在第2.3節中提出了CLERK的設計考量。在治療驗證階段（也在第2.3節中），我們評估了可以從早期工作中保留哪些組件，并確定實現設計目標所需的額外元素。在第3節中詳細介紹了CLERK的實現，包括（1）使用名為ToT4DM的框架（第3.2節）來定制LLMs以適應建模問題，（2）使用上下文學習（第3.3節），以及（3）支持軟件實現（第3.4節）。最后，在第4節中，我們采用了雙重評估方法。首先，我們進行了兩項實驗：一項使用[9]中的能源領域監管文章數據集進行基線比較，另一項實驗使用包含醫療保健法規的擴展數據集。其次，我們根據之前確定的設計考量對CLERK進行了評估。

除了執行規范周期外，我們在第5節還討論了我們在兩個關鍵領域的經驗：選擇合適的提示技術和設計這兩個實驗。這些反思提供了我們選擇背后的理由、遇到的挑戰以及未來改進的考慮因素。

小節片段

利用LLMs支持規范建模

接下來，我們分析了有關使用LLMs進行概念建模的相關工作，并詳細介紹了我們之前在LLM支持的規范建模方面的工作。這使我們能夠得出設計考量，從而指導CLERK的設計。

CLERK用于規范建模支持

本節報告了圖1中規范周期治療實施階段的執行情況。基于治療設計階段得出的設計考量（參見表2和第2.3節），我們介紹了CLERK的配置和實現。

圖2提供了CLERK的概覽。利用成熟的提示技術，CLERK將主流LLMs定制為AI助手，以自動從法律文章中創建Legal GRL模型。

評估

根據圖1中的規范周期治療評估階段，我們采用兩種互補的方法對CLERK進行了評估。首先，我們進行了基于兩個不同領域數據集的實證評估（第4.1節）。其次，我們進行了概念評估（第4.2節），以評估在治療設計階段確定的設計考量的滿足情況。這種綜合策略全面地說明了CLERK的表現

選擇合適的提示技術配置

兩項實驗表明，當提示技術根據當前任務的需求進行配置時，LLM（特別是選定的GPT 4o mini）可以支持將監管文本轉換為Legal GRL模型。在第一個實驗中，我們發現CLERK和[9]中的提示可以共同使用角色提示和上下文管理器來突出特定參與者和主題，從而對監管文章進行有針對性的分析。

結論

本文介紹了CLERK，這是一個用于建模規范知識的輔助大型語言模型專家，以Legal GRL作為示例規范建模語言。CLERK繼承了早期工作的優勢，特別是使用了角色提示和上下文管理器來突出給定監管文本中的參與者和主題。CLERK通過增加額外的提示技術（1）進一步完善了這些工作，提供了更加成熟的分解方法

CRediT作者貢獻聲明

喬納森·席爾瓦·梅爾卡多（Jonathan Silva Mercado）：撰寫 – 審稿與編輯，撰寫 – 原稿，軟件開發，形式分析，概念化。秦馬（Qin Ma）：撰寫 – 審稿與編輯，撰寫 – 原稿，可視化，方法論，形式分析，概念化。西布倫·德·金德倫（Sybren de Kinderen）：撰寫 – 審稿與編輯，撰寫 – 原稿，方法論，形式分析，概念化。卡羅琳·溫特（Karolin Winter）：撰寫 – 審稿與編輯，撰寫 – 原稿，形式分析，概念化。喬迪·卡博特（Jordi Cabot）：

利益沖突聲明

作者聲明他們沒有已知的財務利益或個人關系可能影響本文所述的工作。

喬納森·席爾瓦·梅爾卡多（Jonathan Silva Mercado）是盧森堡大學的博士研究員，專注于領域建模和自然語言處理的交叉領域。在他的職業生涯中，他曾從事軟件開發、IT服務和項目管理工作。

熱點排行

新聞專題

聯系信箱：

粵ICP備09063491號