關于基于人工智能的數字貸款信用評估的綜合性文獻綜述:探討模型、透明度、替代數據以及實時學習機制
《Expert Systems with Applications》:A comprehensive literature review on ai-based credit assessment in digital lending: exploring models, transparency, alternative data, and real-time learning
【字體:
大
中
小
】
時間:2026年03月03日
來源:Expert Systems with Applications 7.5
編輯推薦:
AI驅動的信用評分研究進展:通過PRISMA框架系統分析2018-2025年間118篇文獻,揭示機器學習與混合模型主導領域,但存在實時流學習框架缺失、替代數據偏見未解、可解釋AI標準不足及合規治理薄弱四大缺口,強調跨學科合作構建可信、透明、包容的數字信貸系統。
Saeid Bahadori | Alireza Hassanzadeh
信息技術管理系,管理與經濟學院,塔比亞特莫達雷斯大學,賈拉勒·艾哈邁德高速公路,德黑蘭,伊朗
摘要
在線貸款和“先買后付”(BNPL)服務的迅速擴張增加了對準確、適應性強且透明的信用評分模型的需求。傳統模型在處理異構數據和實時決策要求時往往表現不佳,而新的方法則引發了關于公平性、隱私性和合規性的擔憂。為應對這些挑戰,本研究對2018年至2025年間發表的118篇經過同行評審的文章進行了系統文獻綜述(SLR),采用了PRISMA框架,并結合了文獻計量分析和主題綜合方法。綜述涵蓋了五個關鍵領域的發展:機器學習和混合模型、替代數據、實時學習、可解釋人工智能(XAI)以及以公平為導向的治理機制。主要結果表明,集成和混合深度學習模型在該領域占據主導地位,始終展現出強大的預測性能。雖然SHAP和LIME等工具在提高模型可解釋性方面得到了廣泛應用,但它們的穩定性和實際操作性仍需進一步研究。替代數據來源(包括心理測量數據和交易流)對信用記錄較少的借款人明顯有益,但偏見、隱私和文化適用性問題仍未得到解決。此外,關于自適應框架的研究大多停留在概念驗證階段,大規模應用中的概念漂移問題也很少被提及。公平性和合規性方面的研究也較為薄弱,很少有研究將信用評分系統與GDPR或巴塞爾協議等法規要求相結合。主要結論指出了當前研究中的四個關鍵空白:缺乏適用于流處理的數據框架、行為數據集的驗證不足、缺乏標準化的XAI評估指標,以及公平性和治理要求整合不充分。填補這些空白需要跨學科合作,以設計出既技術可靠又值得信賴、透明且具有包容性的信用評分系統。
引言
在線貸款和“先買后付”(BNPL)服務的迅速發展迫切需要既準確又能適應新類型數據源的信用評分模型(Turiel和Aste,2020)。盡管邏輯回歸等傳統方法仍被廣泛使用,但在處理異構借款人特征和實時決策需求時常常面臨困難(Xia等人,2020)。為此,可解釋人工智能工具(如SHAP和LIME)因提高透明度和增強監管機構及消費者信任而受到關注(Bücker等人,2021;Ariza-Garzon等人,2020)。行業的一個重要趨勢是整合替代數據(從心理測量評估到“超級應用”的交易流數據),這為評估缺乏正式信用記錄的借款人提供了有效途徑(Duman等人,2023;Mu?oz-Cancino等人,2023;Roa等人,2021)。同時,貸款方式已從周期性決策周期轉變為持續決策環境,在這種環境下,“實時”的技術含義變得至關重要。因此,本綜述根據兩個操作標準(推理延遲(從請求到決策的時間)和學習延遲(從新證據到影響后續決策的模型更新的時間)區分了僅頻繁更新的系統與能夠持續從數據流中學習的系統。這一分類在第4.3節中定義,并在整個文獻綜述中得到一致應用(附錄7)。
2018年至2025年間,基于人工智能的信用評分研究迅速發展,但研究內容在預測建模、可解釋性、替代數據和實時決策方面仍存在碎片化現象(Bücker等人,2021;Ariza-Garzon等人,2020;Duman等人,2023;Zhang等人,2020)。盡管許多研究聲稱具備實時處理能力,但并未明確說明是指低延遲推理、快速模型更新還是兩者兼有。因此,接近實時的處理流程(例如微批次更新)與真正的在線流處理之間的界限往往不明確,導致研究之間的可比性受限,從業者缺乏關于學習延遲和適應性的實用基準(Zhang等人,2020)。
替代數據相關研究也存在明顯不足。雖然心理測量數據和行為特征可以提升預測能力,但它們受到自我報告偏差、有限的文化適用性和隱私問題的限制(Duman等人,2023;Nallakaruppan等人,2024)。此外,事后解釋通常被認為足以提高透明度,但這些模型在實際應用中的穩定性和操作有效性仍存在疑問(Bücker等人,2021;Ariza-Garzon等人,2020)。最后,與治理框架(如GDPR或巴塞爾協議相關的規定)的明確對齊程度較低,特別是在審計能力和非傳統數據的倫理使用方面(Kozodoi等人,2022;van Braak等人,2025)。
這些不足促使我們進行了一次系統文獻綜述(SLR),并在PRISMA框架的指導下,為數字貸款和BNPL環境中的自適應信用評分系統制定了更清晰、更具合規性的研究路線圖(Moher等人,2009;Page等人,2020)。
本綜述有三個主要目標。首先,利用基于PRISMA的工作流程,梳理文獻中報告的方法、數據類型、驗證方法和透明度實踐,以確保研究的嚴謹性和可重復性(Moher等人,2009;Page等人,2020)。其次,評估模型質量,不僅關注預測準確性,還考慮可解釋性、穩定性和實際效用(Ribeiro等人,2016)。第三,基于在線學習領域的有限但重要證據,提出前瞻性的研究議程,特別強調流處理驗證和治理機制(Zhang等人,2020)。在系統綜述標準的指導下,探討了以下幾個關鍵問題:
- 1.
人工智能和機器學習如何通過平衡準確性、可解釋性和合規性來改進信用評分?
- 2.
替代數據和行為數據如何幫助評估信用記錄較少的借款人?如何減少偏見和隱私風險?
- 3.
實時信用評分系統如何處理概念漂移,并支持BNPL和即時貸款中的公平、合規決策?
這些問題有助于深入理解當前實踐,并指出需要進一步創新的領域。
PRISMA框架和流程
本綜述遵循了系統文獻綜述和元分析的優先報告項(PRISMA)標準,以確保研究的透明性和可重復性(Moher等人,2009;Page等人,2020)。整個過程包括四個標準階段:識別、篩選、資格評估和納入。
出版趨勢
經過質量篩選和全文檢查后,共有118篇文章被納入深入分析。自2018年以來,相關出版活動穩步增長,反映出學術界和業界對在線貸款背景下基于人工智能的信用評分的興趣日益濃厚。如圖5所示,各研究領域的論文數量均有所增加,其中機器學習領域的論文數量尤為突出。然而,在可解釋性(XAI)和實時學習等領域的發展仍相對滯后。
主題綜合與討論
本節對五個領域的證據進行了綜合分析和解讀:(1)機器學習和混合架構;(2)可解釋人工智能;(3)替代數據和行為數據;(4)實時和自適應學習;(5)公平性、監管和治理機制。討論圍繞三個分析問題展開:主導方法、最具影響力的方法論貢獻,以及持續制約實際應用的局限性。
研究空白與未來議程
基于描述性分析和關鍵綜合結果(第3節和第4節),本節指出了四個核心空白,并提出了推進可靠、適用于行業的信用評分系統的未來議程。盡管在方法論方面取得了顯著進展,但現有研究主要集中在準確性方面,而在適應性、公平性和治理機制方面的發展相對滯后——而這些能力對于BNPL和銷售點(POS)貸款環境至關重要。
結論
本綜述系統分析了2018年至2025年間發表的118篇關于基于人工智能的信用評分的研究。通過PRISMA框架和文獻計量分析,追蹤了該領域在五個主要方面的發展:機器學習和混合模型、替代數據和行為數據、實時和自適應學習、可解釋性以及以公平為導向的治理機制。研究發現表明,在集成學習和混合模型方面取得了顯著的方法論進步。
關于寫作過程中使用生成式人工智能和人工智能輔助技術的聲明
在撰寫本文期間,作者使用了ChatGPT-4工具輔助翻譯和語法優化。使用該工具后,作者對內容進行了必要的審核和編輯,并對最終科學內容的準確性負全責。
CRediT作者貢獻聲明
Saeid Bahadori:概念構建、方法論設計、初稿撰寫。
Alireza Hassanzadeh:項目監督、行政管理、數據分析、審閱與編輯。
利益沖突聲明
作者聲明沒有已知的可能影響本文研究的財務利益或個人關系。
致謝
作者感謝塔比亞特莫達雷斯大學信息技術管理系為這項研究提供必要的資源支持。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號