一種基于人口統計的、結合Q學習算法的協作式迭代貪婪算法,用于解決分布式無等待作業車間問題
《Computers & Operations Research》:A population-based and Q-learning-cooperative iterated greedy algorithm for distributed no-wait job shop problem
【字體:
大
中
小
】
時間:2026年03月02日
來源:Computers & Operations Research 4.3
編輯推薦:
本文針對分布式無等待作業車間調度問題(DNWJSP),提出混合整數線性規劃(MILP)模型和群體智能協作迭代 greedy(PQIG)算法,通過Q學習動態調整破壞強度和局部搜索策略優化全局搜索。實驗結果表明PQIG算法在解決大規模DNWJSP時顯著優于傳統啟發式算法和基準方法。
Jie Yin|Shuning Zhang|Li Liu|Guanlong Deng
魯東大學計算機與人工智能學院,中國煙臺
摘要
作為經典調度問題的擴展,分布式無等待作業車間調度問題(DNWJSP)在制造領域具有重要的研究價值。它通過結合多工廠環境和無等待約束來捕捉現實世界生產的復雜性。本研究旨在解決DNWJSP問題,目標是最小化總加權延遲。我們首先構建了一個混合整數線性規劃(MILP)模型作為精確求解框架。鑒于MILP模型在處理大規模實例時的計算限制,我們提出了一種基于種群的Q學習協作迭代貪婪(PQIG)算法。PQIG算法包括破壞-構建階段和局部搜索階段。在破壞-構建階段,引入了Q學習機制來動態選擇適當的破壞程度參數。對于局部搜索階段,設計了兩種局部搜索策略,并結合了變鄰域搜索機制,進一步增強了搜索多樣性并降低了陷入局部最優解的風險。此外,為了生成高質量的初始解,我們提出了一種預測延遲成本(FTC)規則,并將其與Nawaz-Enscore-Ham2(NEH2)啟發式方法相結合,從而開發了FTC_NEH2啟發式方法。最后,我們應用PQIG算法以及幾種競爭性元啟發式算法來解決多個基準實例,并對結果進行了統計分析。實驗結果表明,PQIG算法的性能優于其他比較算法。
引言
在傳統的作業車間調度問題中,生產任務通常依賴于單一工廠的資源,這往往導致資源瓶頸和靈活性受限。隨著制造業的全球化以及市場需求的日益多樣化,單一工廠生產模式的局限性變得越來越明顯。為了解決這些挑戰,分布式生產得到了廣泛應用。通過將生產任務分配到多個工廠,這種方法不僅提高了資源利用率,還增強了生產系統的靈活性和適應性。此外,在某些現實世界的制造系統中,生產過程必須滿足嚴格的無等待約束,即作業處理過程中連續操作之間不能有等待時間。這一要求源于生產的連續性,任何中斷或延遲都可能導致產品質量下降甚至整個過程失敗。典型的例子包括:鋼鐵行業(Yüksel等人,2024年),其中熱軋需要連續處理以避免冷卻;制藥行業(Tonizza Pereira和Seido Nagano,2022年),某些化學反應和配制過程需要在指定的時間窗口內連續完成,以避免化學成分的損失、效力降低或污染風險;食品行業(Avci,2023年),生產過程中的等待可能導致風味和質地的惡化,甚至帶來質量和安全風險;以及混凝土制造(Smutnicki等人,2022年),混合和澆筑之間的延遲可能導致材料固化。這些實際生產過程可以自然地抽象為分布式無等待作業車間調度問題(DNWJSP),這突顯了本研究考慮的問題的實際意義和廣泛應用性。
DNWJSP結合了分布式生產的挑戰和無等待約束。在這個問題中,作業被分配到多個工廠,在每個工廠內必須嚴格遵守無等待約束。有效解決DNWJSP問題不僅需要管理這些無等待約束,還需要優化工廠網絡中的作業分配和調度。總體目標是實現最優資源分配并最大化生產效率。
在本研究中,我們專注于最小化DNWJSP的總加權延遲(TWT)。我們開發了一個混合整數線性規劃(MILP)模型來更精確地表示這個問題。由于迭代貪婪(IG)算法在調度問題中的簡單性、靈活性和強大性能,我們采用了它作為優化器的基礎。其破壞-構建機制在探索和利用之間提供了有效的平衡。在此基礎上,我們提出了基于種群的Q學習協作迭代貪婪(PQIG)算法。PQIG算法包括兩個階段:破壞-構建階段和局部搜索階段。在破壞-構建階段,我們引入了一種基于種群狀態的Q學習方法,使算法能夠在進化過程中動態選擇適當的破壞程度,從而提高全局搜索效率。在局部搜索階段,我們設計了兩種鄰域搜索策略:一種用于工廠內部鄰域搜索,另一種用于關鍵工廠基礎鄰域搜索。關鍵工廠被定義為目標值最高的工廠。此外,我們提出了一種預測延遲成本(FTC)規則,并將其與Nawaz-Enscore-Ham2(NEH2)啟發式方法相結合,從而開發了FTC_NEH2啟發式方法來生成高質量的初始解。具體來說,本研究的主要貢獻如下:
(1) 我們研究了以最小化TWT為目標的DNWJSP問題。為了提供精確的數學表示,我們為這個問題構建了一個MILP模型。
(2) 我們提出了三個方法論組成部分來提高解決方案的質量和搜索效率。基于Q學習的動態調整策略自適應地控制破壞強度,兩種嵌入在變鄰域搜索中的局部搜索策略增強了局部搜索的多樣性和效率,FTC_NEH2啟發式方法生成了高質量的初始解。通過整合這些組成部分,我們開發了用于解決DNWJSP的PQIG算法。
(3) 在多樣化的基準實例上進行了廣泛的計算實驗。結果表明,所提出的PQIG算法在解決方案質量和魯棒性方面顯著優于幾種先進的元啟發式算法。
本文的結構如下:第2節回顧了相關工作。第3節制定了帶有TWT標準的DNWJSP問題,并建立了問題的MILP模型。第4節介紹和描述了所提出的PQIG算法。此外,它還介紹了FTC規則。然后將FTC規則與NEH2啟發式方法結合,用于PQIG算法的種群初始化。第5節提供了實驗結果和相應的分析。第6節總結了本文并討論了未來的研究方向。
章節片段
無等待作業車間調度問題
作業車間調度問題(JSP)是工業工程領域的一個重要研究課題,主要關注如何合理安排單個車間內的作業處理順序以優化生產效率和資源利用。多年來,JSP已廣泛應用于半導體、機械制造、汽車生產、供應鏈、冶金、紡織、化工、制藥和食品加工等行業
符號說明
包括集合、索引、參數和變量在內的符號列在表2中。
問題描述
基本的JSP涉及在單個工廠內對作業進行排序和分配機器。NWJSP進一步要求作業的所有操作必須連續進行,不得有任何等待時間。當NWJSP擴展到多工廠環境時,就變成了DNWJSP,每個工廠獨立調度其分配到的作業。本研究專注于DNWJSP,而這個問題尚未得到系統的
用于DNWJSP的PQIG
為了解決以TWT為目標 的DNWJSP問題,我們提出了一種PQIG算法,該算法結合了基于種群的框架、IG算法和Q學習方法。附錄A提供了基本IG算法和Q學習方法的概述,這些構成了所提算法的方法論基礎。該算法通過基于種群的框架維護多個候選解,以增強搜索多樣性并避免陷入局部最優解。破壞-構建(DC)
實驗準備
本研究在其實驗設計中使用了Tillard基準集Ta1-80(Taillard,1993)。盡管Taillard基準集最初是為作業車間調度問題設計的,但它已被普遍擴展到分布式環境中,用于分布式作業車間調度的研究(Huang等人,2024a;Wang等人,2024;Xie等人,2024)。本研究也采用了這種常見做法,以確保結果的可比性和可重復性
結論
本研究解決了以最小化TWT為目標的DNWJSP問題,這是一個之前未被探索的問題。為了解決這個問題,我們首先構建了一個MILP模型。隨后,我們設計了PQIG算法來解決問題,該算法通過兩個關鍵階段進行操作:破壞-構建和局部搜索。在破壞-構建階段,使用Q學習機制動態選擇破壞程度。在局部搜索階段,采用了兩種鄰域搜索策略
出版同意
作者確認手稿已由所有署名作者閱讀并批準,且沒有其他符合作者資格標準但未列出的人。作者確認該工作之前未發表過,也沒有在其他地方考慮發表,其發表已獲得所有合作者的批準,并且已經獲得了開展該工作的機構的負責部門的批準。
資金信息
作者感謝山東省自然科學基金支持的ZR2019QF008項目,以及山東省科技創新能力提升計劃支持的2023TSGC0862項目。
CRediT作者貢獻聲明
Jie Yin:撰寫 – 原始草稿、可視化、軟件、形式分析、數據整理。Shuning Zhang:驗證、資源獲取、調查。Li Liu:項目管理、概念化。Guanlong Deng:撰寫 – 審稿與編輯、監督、方法論、資金獲取。
利益沖突聲明
作者聲明他們沒有已知的競爭性財務利益或個人關系可能影響本文報告的工作。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號