<tt id="vwe5b"></tt>
      1. <tfoot id="vwe5b"><progress id="vwe5b"></progress></tfoot><abbr id="vwe5b"></abbr>

      2. 91人人妻,99偷拍,碰碰免费视频,亚洲中文字幕AV,丝袜a片,91纯肉动漫,中文无码日,伊人福利导航

        綜述:基于自適應(yīng)關(guān)聯(lián)規(guī)則的K-Means算法及其在商品細(xì)分中的應(yīng)用研究

        《Egyptian Informatics Journal》:Research on K-Means algorithm based on adaptive association rules and its application in commodity segmentation

        【字體: 時間:2026年02月16日 來源:Egyptian Informatics Journal 4.3

        編輯推薦:

          本文創(chuàng)新性地提出了一種結(jié)合自適應(yīng)關(guān)聯(lián)規(guī)則挖掘與K-Means聚類的混合算法(AAP-KM)。該算法通過自適應(yīng)調(diào)整關(guān)聯(lián)規(guī)則參數(shù)并重定義最優(yōu)規(guī)則,解決了傳統(tǒng)K-Means對初始聚類中心敏感、無法處理混合屬性數(shù)據(jù)以及忽略屬性間關(guān)系等問題。實驗證明,AAP-KM在多個UCI數(shù)據(jù)集上具有顯著的性能優(yōu)勢,并能有效應(yīng)用于零售商品細(xì)分,幫助企業(yè)識別高價值商品并制定精準(zhǔn)營銷策略。

          
        在當(dāng)今互聯(lián)網(wǎng)經(jīng)濟(jì)時代,消費者的購物方式已從主動購買轉(zhuǎn)變?yōu)橐灾鲃铀阉鳌⒃诰直播購物為主的新模式。為了提升用戶轉(zhuǎn)化率,銷售企業(yè)亟需針對不同商品制定精準(zhǔn)的營銷策略,而精確的商品細(xì)分在其中扮演著至關(guān)重要的角色。目前,零售行業(yè)廣泛采用聚類分析和關(guān)聯(lián)規(guī)則算法進(jìn)行商品細(xì)分與數(shù)據(jù)挖掘。
        傳統(tǒng)的K-Means算法因其簡單、收斂快且適用于大規(guī)模數(shù)據(jù)集而被廣泛應(yīng)用。然而,它存在幾個顯著缺點:對初始聚類中心的選擇敏感,可能導(dǎo)致無法收斂到全局最優(yōu)解,造成結(jié)果不穩(wěn)定;其次,它專為純數(shù)值數(shù)據(jù)集設(shè)計,無法直接處理現(xiàn)實世界中常見的混合型(數(shù)值與分類)數(shù)據(jù);最后,該算法僅從樣本點間的距離/密度角度進(jìn)行聚類,完全忽略了樣本屬性之間的內(nèi)在關(guān)聯(lián)。盡管關(guān)聯(lián)規(guī)則挖掘能有效發(fā)現(xiàn)屬性間關(guān)系,但它通常僅適用于分類或離散化數(shù)據(jù),且可能生成過多的候選規(guī)則,計算復(fù)雜度高。
        為克服這些挑戰(zhàn),本文提出了一種名為AAP-KM的新型聚類算法。該算法的核心思想是巧妙地融合了關(guān)聯(lián)規(guī)則在發(fā)現(xiàn)屬性關(guān)系上的優(yōu)勢與K-Means在數(shù)值空間劃分上的效率。AAP-KM首先提出一種自適應(yīng)關(guān)聯(lián)規(guī)則算法。該算法通過自助采樣(Bootstrap Sampling)處理大規(guī)模數(shù)據(jù)以降低計算成本,通過多重排序(按置信度、規(guī)則前件長度和支持度)重定義了最優(yōu)關(guān)聯(lián)規(guī)則(BestRule)的選擇標(biāo)準(zhǔn),并自適應(yīng)地更新最小支持度(MinS)和最小置信度(MinC)參數(shù),從而解決了傳統(tǒng)Apriori算法規(guī)則集爆炸和結(jié)果不穩(wěn)定的問題。基于此,AAP利用自適應(yīng)規(guī)則對數(shù)據(jù)集進(jìn)行初始劃分。
        對于混合型數(shù)據(jù),AAP-KM采用了二次屬性轉(zhuǎn)換技術(shù)來增強其適應(yīng)性。具體流程分為三個階段:首先,在初始劃分階段,算法將數(shù)值變量按上下四分位數(shù)轉(zhuǎn)換為分類數(shù)據(jù),形成數(shù)據(jù)集B,并利用上述AAP算法獲得初始劃分集合。接著,在生成初始聚類中心階段,將原始數(shù)據(jù)集A中的分類數(shù)據(jù)通過獨熱編碼轉(zhuǎn)換為數(shù)值數(shù)據(jù),得到數(shù)據(jù)集C,并根據(jù)初始劃分計算各類別的均值作為初始聚類中心。最后,在K-Means聚類階段,利用這些更具代表性的初始中心對數(shù)據(jù)集C執(zhí)行標(biāo)準(zhǔn)K-Means聚類,獲得最終結(jié)果。
        為了評估AAP-KM的有效性,研究在八個UCI數(shù)據(jù)集上進(jìn)行了數(shù)值實驗,并將其與K-Means、K-Means++、AP(關(guān)聯(lián)規(guī)則聚類)以及PSO-KM(粒子群優(yōu)化K-Means)等算法進(jìn)行對比。評價指標(biāo)包括分類準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)和F1-Score。實驗結(jié)果表明,在大多數(shù)數(shù)據(jù)集上,AAP-KM算法的性能優(yōu)于或與其他先進(jìn)算法持平。特別是在Iris、Adult、Heart Disease和Teaching Assistant Evaluation數(shù)據(jù)集上,AAP-KM展現(xiàn)出顯著更高的聚類精度。例如,在Adult數(shù)據(jù)集上,AAP-KM的準(zhǔn)確率達(dá)到0.7560,優(yōu)于K-Means的0.6779和PSO-KM的0.7546。統(tǒng)計分析(t檢驗)證實了AAP-KM與對比算法之間的性能差異具有統(tǒng)計顯著性。這證明了AAP-KM能夠選擇出更有效的初始聚類中心,從而提升聚類質(zhì)量。而對于Sonar、Credit Card和Vote等數(shù)據(jù)集,各算法性能相當(dāng),表明這些數(shù)據(jù)集對初始中心的選擇不敏感。值得注意的是,AP算法在處理不平衡數(shù)據(jù)集(如Credit和Adult)時表現(xiàn)出一定優(yōu)勢,而AAP-KM在繼承其挖掘?qū)傩躁P(guān)系能力的同時,通過改進(jìn)獲得了更穩(wěn)定可靠的性能。
        最后,研究將AAP-KM算法應(yīng)用于一個真實的Online Retail數(shù)據(jù)集進(jìn)行商品細(xì)分實踐。在完成數(shù)據(jù)探索、異常值處理(如剔除負(fù)數(shù)量和零單價記錄)及特征提取(包括商品總銷量、總銷售額、退貨率、購買人數(shù)、平均購買次數(shù)、銷售天數(shù)等)后,利用AAP-KM進(jìn)行聚類分析。算法自動確定聚類數(shù)k=4,二維可視化結(jié)果顯示各類別樣本區(qū)分度良好。
        對聚類中心的深入分析揭示了有意義的商業(yè)洞察:第一類商品(共108種)平均銷售額最高,消費者粘性強(年銷售天數(shù)達(dá)222天),被定義為高利潤、暢銷的“優(yōu)質(zhì)核心商品”。第二類商品(92種)平均銷量低但退貨率極高(42.4%),屬于“高退貨率低價值商品”。第三類商品(734種)具有中等銷量和銷售額。數(shù)量最多的第四類商品(2689種)各項指標(biāo)均處于較低水平。這種細(xì)分有助于企業(yè)識別核心盈利產(chǎn)品,優(yōu)化庫存和營銷資源分配,例如對高價值商品進(jìn)行重點推廣,同時審查并改善高退貨率商品的品質(zhì)或銷售策略。
        綜上所述,本研究提出的AAP-KM算法通過自適應(yīng)關(guān)聯(lián)規(guī)則與K-Means的有效結(jié)合,不僅降低了K-Means對初始中心的依賴,還能自適應(yīng)估計聚類數(shù)目,并成功應(yīng)用于混合型數(shù)據(jù)的聚類分析。在商品細(xì)分場景下的應(yīng)用驗證了其實際價值,為銷售企業(yè)進(jìn)行數(shù)據(jù)驅(qū)動的精細(xì)化運營提供了有力的工具。未來的研究可進(jìn)一步探索該算法在更復(fù)雜數(shù)據(jù)場景(如流數(shù)據(jù)、高維數(shù)據(jù))下的應(yīng)用與優(yōu)化。
        相關(guān)新聞
        生物通微信公眾號
        微信
        新浪微博

        知名企業(yè)招聘

        熱點排行

          今日動態(tài) | 人才市場 | 新技術(shù)專欄 | 中國科學(xué)人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術(shù)快訊 | 免費試用

          版權(quán)所有 生物通

          Copyright© eBiotrade.com, All Rights Reserved

          聯(lián)系信箱:

          粵ICP備09063491號