亚洲人妻网,苍井空大战黑人,3P免费视频

AI生成的虛假評(píng)論檢測(cè)

《Decision Support Systems》：AI-generated fake review detection

【字體：大中小】 時(shí)間：2026年03月03日 來(lái)源：Decision Support Systems 6.8

編輯推薦：

　　生成式人工智能加速了電商虛假評(píng)論的泛濫，本研究提出融合累積概率密度與AdaBoost分類器的新檢測(cè)方法。通過(guò)構(gòu)建傳統(tǒng)語(yǔ)言學(xué)特征和新穎語(yǔ)言統(tǒng)計(jì)量，結(jié)合概率密度閾值優(yōu)化技術(shù)，有效提升了AI生成虛假評(píng)論的識(shí)別準(zhǔn)確率。

Jiwei Luo|Guofang Nan|Dahui Li

海南大學(xué)國(guó)際商學(xué)院，海口570228，中華人民共和國(guó)

摘要

長(zhǎng)期以來(lái)，電子商務(wù)平臺(tái)的在線評(píng)論一直被認(rèn)為是影響消費(fèi)者購(gòu)買決策的重要因素。然而，生成式人工智能（GAI）的出現(xiàn)加速了虛假在線評(píng)論的傳播，這會(huì)顯著降低消費(fèi)者對(duì)這些平臺(tái)的信任。本研究提出了一種新穎的監(jiān)督學(xué)習(xí)方法，可以靈活地集成到?jīng)Q策支持系統(tǒng)中，幫助平臺(tái)有效檢測(cè)由AI生成的虛假評(píng)論。在該方法中，我們首先構(gòu)建了兩種類型的變量來(lái)區(qū)分人工撰寫的真實(shí)評(píng)論和AI生成的虛假評(píng)論。然后，我們引入了一種基于累積概率密度的異常值檢測(cè)方法來(lái)計(jì)算AI生成虛假評(píng)論的概率。最后，我們使用上述計(jì)算出的評(píng)論的累積概率密度值訓(xùn)練AdaBoost模型，以獲得能夠準(zhǔn)確檢測(cè)AI生成虛假評(píng)論的分類器。數(shù)值實(shí)驗(yàn)表明，所提出的方法比幾種最先進(jìn)的基線方法能夠更準(zhǔn)確地檢測(cè)出AI生成的虛假評(píng)論。我們通過(guò)運(yùn)用統(tǒng)計(jì)理論為相關(guān)文獻(xiàn)做出了貢獻(xiàn)，該理論認(rèn)為異常值作為小概率事件，通常位于特征分布的尾部，這一原則在檢測(cè)AI生成的虛假評(píng)論時(shí)得到了有效應(yīng)用。

引言

“在線產(chǎn)品評(píng)論正成為現(xiàn)代AI的戰(zhàn)場(chǎng)”。——Annie Probert/ NBC News [1]

在線評(píng)論在塑造消費(fèi)者在電子商務(wù)平臺(tái)上的行為方面繼續(xù)發(fā)揮著關(guān)鍵作用，因?yàn)橄M(fèi)者在做出購(gòu)買決策時(shí)會(huì)依賴這些評(píng)論，這一點(diǎn)在先前的研究[2]、[3]、[4]中得到了證明。值得注意的是，近90%的在線購(gòu)物者表示，真實(shí)的評(píng)論會(huì)影響他們的購(gòu)買選擇，并且他們比產(chǎn)品的價(jià)格本身更信任同行反饋。¹然而，某些商家的不道德行為破壞了評(píng)論系統(tǒng)的可靠性，這些商家使用工具來(lái)抬高產(chǎn)品排名并損害競(jìng)爭(zhēng)對(duì)手的聲譽(yù)[5]，從而侵蝕了消費(fèi)者的信任，并損害了評(píng)論系統(tǒng)的完整性和效率[6]。

為了解決這一日益嚴(yán)重的問(wèn)題，平臺(tái)公司已經(jīng)部署了決策支持系統(tǒng)來(lái)檢測(cè)和過(guò)濾掉欺詐性評(píng)論[7]、[8]。這些技術(shù)干預(yù)不僅旨在遏制虛假內(nèi)容的傳播，還旨在減輕其對(duì)平臺(tái)生態(tài)系統(tǒng)的更廣泛負(fù)面影響[9]、[10]。通過(guò)增強(qiáng)用戶生成內(nèi)容的真實(shí)性，這些系統(tǒng)在維護(hù)數(shù)字市場(chǎng)的可信度和功能性方面發(fā)揮著關(guān)鍵作用。

近年來(lái)，GAI的出現(xiàn)加速了虛假評(píng)論在數(shù)字平臺(tái)上的傳播，因?yàn)樯碳铱梢岳肎AI快速生成大量虛假評(píng)論，而且?guī)缀醪毁M(fèi)吹灰之力。²³與傳統(tǒng)的虛假評(píng)論不同，由GAI生成的評(píng)論往往更具說(shuō)服力，也更難以檢測(cè)。這是因?yàn)镚AI具有生成連貫、與上下文相關(guān)且類似人類語(yǔ)言的高級(jí)能力，這種語(yǔ)言緊密模仿了真實(shí)用戶反饋的語(yǔ)氣和結(jié)構(gòu)[11]、[12]。因此，這些由GAI制作的評(píng)論對(duì)消費(fèi)者信任和平臺(tái)完整性構(gòu)成了更大的威脅。GAI提供的高級(jí)語(yǔ)言特性吸引了更多惡意行為者利用GAI生成欺騙性內(nèi)容，從而加劇了電子商務(wù)平臺(tái)上虛假評(píng)論的傳播。

同時(shí)，那些真正希望分享自己的體驗(yàn)并推薦產(chǎn)品或商家的普通消費(fèi)者也開(kāi)始使用AI工具來(lái)生成他們的評(píng)論。雖然這可能簡(jiǎn)化了評(píng)論撰寫過(guò)程，但它引入了一個(gè)關(guān)鍵的限制：AI缺乏完全理解個(gè)別消費(fèi)者微妙現(xiàn)實(shí)生活經(jīng)驗(yàn)的能力。⁴因此，AI生成的評(píng)論可能比人類撰寫的評(píng)論表現(xiàn)出更高的偏見(jiàn)程度。圖1展示了一個(gè)在ChatGPT的幫助下生成的評(píng)論（注意：產(chǎn)品細(xì)節(jié)是虛構(gòu)的）。AI生成內(nèi)容中的這種固有偏見(jiàn)可能會(huì)削弱消費(fèi)者對(duì)產(chǎn)品和相關(guān)商家的信任。³鑒于這些挑戰(zhàn)，迫切需要提出一種專門設(shè)計(jì)用于識(shí)別AI生成的虛假評(píng)論的新檢測(cè)方法。這樣的系統(tǒng)使平臺(tái)能夠迅速標(biāo)記或過(guò)濾掉不真實(shí)的內(nèi)容，從而維護(hù)用戶反饋的完整性，并保持平臺(tái)生態(tài)系統(tǒng)內(nèi)的信任。

盡管AI生成的虛假評(píng)論可能與人類撰寫的評(píng)論難以區(qū)分，但它們通常表現(xiàn)出微妙但可識(shí)別的語(yǔ)言模式，表明它們是人工生成的[13]。值得注意的是，這些評(píng)論經(jīng)常復(fù)制企業(yè)在傳統(tǒng)欺騙性內(nèi)容中常用的風(fēng)格標(biāo)記。例如，偽造的評(píng)論往往具有夸張的情感表達(dá)，因?yàn)樗鼈兊闹饕康氖沁^(guò)度贊揚(yáng)或不公正地批評(píng)產(chǎn)品的聲譽(yù)[14]。同樣，當(dāng)商家使用AI工具時(shí)，評(píng)論通常表現(xiàn)出強(qiáng)烈的情感強(qiáng)度。這種模式強(qiáng)調(diào)了將傳統(tǒng)語(yǔ)言線索納入檢測(cè)策略的重要性。通過(guò)分析這些文本特征，平臺(tái)可以更有效地識(shí)別和標(biāo)記AI生成的虛假評(píng)論，即使這些評(píng)論與真實(shí)用戶反饋非常相似。

此外，AI生成的評(píng)論中的詞匯選擇通常是通過(guò)選擇由底層大型語(yǔ)言模型（LLM）計(jì)算出的概率最高的單詞來(lái)確定的。因此，這些評(píng)論的文本輸出與人類撰寫的文本相比，隨機(jī)性較低。這種語(yǔ)言變異性的減少可以使用兩個(gè)先進(jìn)的語(yǔ)言指標(biāo)來(lái)定量評(píng)估：困惑度和突發(fā)性[15]、[16]。這些指標(biāo)評(píng)估了文本的可預(yù)測(cè)性和分布不規(guī)則性，提供了對(duì)LLM生成行為的洞察。鑒于它們的診斷潛力，將這些新穎的語(yǔ)言特征納入AI生成的虛假評(píng)論檢測(cè)框架中是至關(guān)重要的。這樣做可以通過(guò)識(shí)別區(qū)分合成內(nèi)容和真實(shí)人類表達(dá)的微妙統(tǒng)計(jì)模式來(lái)提高檢測(cè)系統(tǒng)的精度。

除了基于語(yǔ)言的方法外，特別是利用深度學(xué)習(xí)算法的自動(dòng)化技術(shù)在檢測(cè)AI生成內(nèi)容方面也取得了進(jìn)展。一個(gè)值得注意的例子是OpenAI，它對(duì)LLM進(jìn)行了微調(diào)，開(kāi)發(fā)了一種能夠識(shí)別高達(dá)95%由GPT-2生成的文本的檢測(cè)器。⁵盡管這種性能很有前景，但這些模型面臨兩個(gè)關(guān)鍵限制：缺乏可解釋性以及在應(yīng)用于在線評(píng)論等短文本時(shí)的有效性降低。這些限制阻礙了它們?cè)诂F(xiàn)實(shí)世界中的實(shí)際應(yīng)用。

先前的研究通過(guò)將非典型的評(píng)論者行為建模為識(shí)別偽造評(píng)論的手段來(lái)探索異常值檢測(cè)方法[6]、[9]。例如，Kumar等人提出了一種技術(shù)，該技術(shù)構(gòu)建了代表各種評(píng)論者行為特征的最優(yōu)子分布，然后將它們匯總成一個(gè)復(fù)合分布來(lái)檢測(cè)異常評(píng)論者[17]。同樣，Li等人引入了一種基于累積概率密度的方法，將異常值識(shí)別為位于分布尾部的罕見(jiàn)事件[18]。然而，這些方法的一個(gè)持續(xù)挑戰(zhàn)在于確定一個(gè)適當(dāng)?shù)母怕书撝祦?lái)區(qū)分異常值和正常行為。如果沒(méi)有明確的界限，這些模型的準(zhǔn)確性仍然受到限制。因此，迫切需要開(kāi)發(fā)一種創(chuàng)新的異常值檢測(cè)方法，特別是通過(guò)改進(jìn)閾值校準(zhǔn)和可解釋性，以實(shí)現(xiàn)更精確地識(shí)別AI生成的虛假評(píng)論。

為了解決這些限制，我們提出了一個(gè)多方面的方法論框架。首先，我們構(gòu)建了一組綜合變量，整合了傳統(tǒng)的語(yǔ)言特征和新型的語(yǔ)言指標(biāo)。這一豐富的特征集使得對(duì)評(píng)論真實(shí)性的分析更加細(xì)致。接下來(lái)，我們引入了一種基于累積概率密度（CPD）的創(chuàng)新技術(shù)來(lái)估計(jì)給定評(píng)論由AI生成的可能性。這種概率度量作為后續(xù)分類階段的基礎(chǔ)輸入。最后，我們使用計(jì)算出的CPD值來(lái)訓(xùn)練一系列已建立的分類模型。然后使用這些模型來(lái)開(kāi)發(fā)能夠準(zhǔn)確識(shí)別AI生成的虛假評(píng)論的分類器。據(jù)我們所知，這項(xiàng)研究是首次嘗試開(kāi)發(fā)專門用于檢測(cè)AI生成的虛假評(píng)論的可解釋機(jī)器學(xué)習(xí)方法之一。通過(guò)提供透明有效的檢測(cè)機(jī)制，我們的方法為平臺(tái)運(yùn)營(yíng)商提供了關(guān)鍵的決策支持，以標(biāo)記不真實(shí)的內(nèi)容。這一貢獻(xiàn)對(duì)于電子商務(wù)平臺(tái)的聲譽(yù)至關(guān)重要。

本研究的其余部分組織如下。首先，我們回顧了現(xiàn)有的關(guān)于檢測(cè)AI生成的虛假評(píng)論的方法的文獻(xiàn)。其次，我們介紹了本研究中構(gòu)建的兩種變量類別——傳統(tǒng)語(yǔ)言特征和新型語(yǔ)言特征。第三，我們介紹了基于累積概率密度的異常檢測(cè)方法。接下來(lái)，我們使用三個(gè)真實(shí)世界數(shù)據(jù)集評(píng)估了所提出方法的性能。最后，我們討論了研究結(jié)果，并總結(jié)了啟示和未來(lái)的研究方向。

部分片段

虛假評(píng)論檢測(cè)

電子商務(wù)平臺(tái)上的虛假評(píng)論是指由個(gè)人故意編寫的誤導(dǎo)性評(píng)價(jià)，目的是操縱產(chǎn)品認(rèn)知或抬高評(píng)分[14]、[19]。這些評(píng)論通常表現(xiàn)出可識(shí)別的語(yǔ)言和行為模式，如夸張的情感表達(dá)、不自然的語(yǔ)法或評(píng)論者歷史中的不一致性[10]、[17]、[20]。研究人員利用這些可疑線索開(kāi)發(fā)了多種虛假評(píng)論檢測(cè)方法，旨在區(qū)分

研究框架

在本節(jié)中，我們介紹了一種稱為AGFRDCP（通過(guò)累積概率檢測(cè)AI生成的虛假評(píng)論）的AI生成虛假評(píng)論檢測(cè)方法，如圖3所示。整個(gè)框架包括三個(gè)關(guān)鍵階段。

首先，我們構(gòu)建了兩類不同的變量，包括前面章節(jié)討論的傳統(tǒng)和新型語(yǔ)言特征。然后將這些變量轉(zhuǎn)換為最優(yōu)的單變量分布，以便進(jìn)行統(tǒng)計(jì)區(qū)分

數(shù)據(jù)集和特征

在本研究中，使用了三個(gè)數(shù)據(jù)集來(lái)評(píng)估所提出方法的性能。GPT-3驗(yàn)證數(shù)據(jù)集包含12,003條AI生成的虛假評(píng)論和11,997條人工撰寫的評(píng)論，其中人工撰寫的評(píng)論由Yelp.com驗(yàn)證，而虛假評(píng)論則是基于這些真實(shí)樣本由GPT-3生成的[33]。GPT-2驗(yàn)證數(shù)據(jù)集包括來(lái)自Amazon的20,216條真實(shí)評(píng)論和由微調(diào)的GPT-2模型生成的20,215條虛假評(píng)論。此外，Llama 2

任務(wù)1

任務(wù)1涉及進(jìn)行消融研究，以評(píng)估NLV對(duì)AGFRDCP檢測(cè)性能的貢獻(xiàn)。具體來(lái)說(shuō)，我們使用三種特征配置評(píng)估模型：混合變量集（TLV + NLV）、TLV和NLV，在三個(gè)基準(zhǔn)數(shù)據(jù)集上進(jìn)行測(cè)試。結(jié)果如表10、11和12所示，混合特征集始終比單獨(dú)使用TLV或NLV產(chǎn)生更好的檢測(cè)性能。這表明兩種特征的整合

結(jié)果總結(jié)

設(shè)計(jì)有效的算法來(lái)防止LLM（如ChatGPT）被濫用來(lái)傳播虛假信息，對(duì)于電子商務(wù)平臺(tái)來(lái)說(shuō)變得越來(lái)越重要和緊迫[26]。所提出方法的范圍是檢測(cè)AI生成的虛假評(píng)論，認(rèn)識(shí)到在線評(píng)論對(duì)于消費(fèi)者、商家和整個(gè)平臺(tái)生態(tài)系統(tǒng)中的平臺(tái)起著關(guān)鍵作用[53]、[54]、[55]。主要發(fā)現(xiàn)和潛在的替代解釋總結(jié)如下

CRediT作者貢獻(xiàn)聲明

Jiwei Luo：撰寫——原始草稿、方法論、正式分析、數(shù)據(jù)整理。Guofang Nan：撰寫——審閱與編輯、監(jiān)督、方法論、概念化。Dahui Li：撰寫——審閱與編輯、監(jiān)督。

利益沖突聲明

作者聲明他們沒(méi)有已知的競(jìng)爭(zhēng)財(cái)務(wù)利益或個(gè)人關(guān)系可能影響本文報(bào)告的工作。

資金來(lái)源聲明

本研究得到了國(guó)家自然科學(xué)基金（資助編號(hào)72171163和72571077）、海南省哲學(xué)和社會(huì)科學(xué)重點(diǎn)實(shí)驗(yàn)室專項(xiàng)基金以及教育部人文社會(huì)科學(xué)重點(diǎn)研究基地重大項(xiàng)目（資助編號(hào)22JJD630004）的支持。

Jiwei Luo（jiweiluo@hainanu.edu.cn)目前正在海南大學(xué)國(guó)際商學(xué)院攻讀工商管理博士學(xué)位。他目前的研究重點(diǎn)是生成式AI的應(yīng)用和實(shí)證研究。他的最新論文發(fā)表在《決策支持系統(tǒng)》和《旅游管理》期刊上。

相關(guān)新聞

生物通微信公眾號(hào)

微信

新浪微博

我要投稿

搜索
國(guó)際
國(guó)內(nèi)
人物
產(chǎn)業(yè)
熱點(diǎn)
科普

熱搜：生成式人工智能|虛假評(píng)論檢測(cè)|累積概率密度|AdaBoost分類器|在線評(píng)論系統(tǒng)

知名企業(yè)招聘

摘要

引言