《Frontiers in Oncology》:Knowledge-based planning for intensity-modulated proton therapy of the breast and chest wall with regional lymph nodes: development, validation, and comparative evaluation of two models
引言
當前的放射治療計劃制定方法通常依賴于耗時且高度依賴計劃者專業知識的試錯過程。這些局限性可能導致計劃質量不一致,并推動了人們對自動化計劃方法的日益關注。知識驅動規劃(KBP)作為一種數據驅動的調強放射治療(IMRT)計劃方法,正越來越多地被臨床采納,以生成更一致、客觀且高效的放射治療計劃。KBP利用先前創建的高質量計劃來指導未來的計劃,通過學習這些歷史計劃,KBP可以生成能夠為新計劃預測劑量體積直方圖(DVHs)和優化目標的模型。KBP模型創建的計劃具有固有的客觀性,有助于減少規劃過程中的主觀性并提高一致性。這些方法已在多種疾病部位實現了與傳統方法相當甚至更優的計劃。由于KBP在可接受的靶區覆蓋指標、改善的危及器官(OAR)保護以及減少優化時間方面表現出優勢,其臨床應用持續擴大。
KBP在調強質子治療(IMPT)中的應用也顯示出良好的臨床潛力,因為KBP模型在預測治療結果時可以考慮到質子的獨特物理特性。KBP已被證明是IMPT規劃的一個有價值的起點,能夠以顯著減少的優化時間生成臨床可比的計劃。規劃時間的縮短在自適應放射治療中尤其有利,因為必須快速創建新計劃以適應治療期間的解剖結構變化。先前的研究已成功證明了KBP在多種疾病部位(如前列腺、頭頸、肝臟和胃食管癌)的IMPT中的應用。
盡管先前的研究表明,KBP模型可以為乳腺癌的IMRT生成臨床可比或更優的計劃,但據我們所知,目前尚無關于KBP在乳腺癌IMPT中應用的研究。考慮到IMPT在乳腺癌治療中已確立的優勢、其日益增加的使用以及IMPT規劃固有的復雜性,這是該領域的一個重大空白。本研究旨在通過開發、驗證和比較兩種用于胸壁與乳腺癌(包括區域淋巴結)IMPT的KBP模型的性能,填補這一主要研究空白。這些模型旨在適應一系列的劑量處方和解剖變異,反映了乳腺癌病例的臨床多樣性。此外,將模型生成的計劃與手動創建的計劃進行比較,以評估其臨床可接受性和整體質量。
材料與方法
患者隊列
這項經機構審查委員會(IRB)批準的研究納入了50名先前接受過胸壁或全乳(包括區域淋巴結)IMPT治療的患者(25例左側,25例右側)。一個獨立的20名患者隊列用于驗證KBP模型。研究包含了多種劑量處方,以反映該治療背景下典型的臨床實踐。胸壁或全乳及區域淋巴結的臨床靶體積(CTV)處方劑量為:15次分割的40.05Gy,25次分割的45Gy,25次分割的50Gy,或28次分割的50.4Gy。
治療計劃
所有計劃均在瓦里安ProBeam筆形束掃描系統上生成。計劃使用36×50 cm的射野尺寸,質子能量范圍為70–220 MeV,點束斑西格瑪為4–7 mm,點間距0.4 cm,適用時使用3 cm或5 cm射程移位器。臨床計劃是使用魯棒優化(Eclipse 16.1)手動生成的,考慮了6個方向上5 mm的平移誤差和±3.5%的質子射程不確定性。這導致每個計劃有12個魯棒性場景,應用于所有CTV,以解決IMPT固有的不確定性。
對于大多數患者,CTV的處方是至少95%的體積(V95%)接受至少95%的處方劑量。對于內乳(IM)淋巴結,一部分患者的處方是V90%≥ 90%。
所有納入本研究的患者均采用多野優化(MFO),通常使用來自可變機架角度的3到5個對穿射束(通常在10到70度之間有2-4個,一個在345度)。優化使用非線性通用質子優化器(NUPO 16.1)進行,劑量計算使用質子卷積疊加(PCS 16.1)算法,劑量網格為0.2cm×0.2cm×0.2cm。臨床計劃旨在滿足所有相關的計劃約束。然而,由于患者特定的解剖變異,并不總是能同時實現完全的靶區覆蓋和最佳的OAR保護。在這種情況下,最終計劃的可接受性基于計劃者和治療醫師的臨床判斷。
模型訓練
使用商業KBP軟件(RapidPlanPTv.16.1)創建了兩個KBP模型。第一個是結合模型,在所有50名乳腺癌患者(25例左側,25例右側)上進行訓練。第二個是分側模型——一個用于左側病變,一個用于右側病變;每個模型僅使用相應側的病例進行訓練,并在同側的驗證病例上進行評估。
每個計劃都處方給主要靶區CTV_All,定義為所有CTV(胸壁或全乳以及各淋巴結靶區)的布爾并集。對于訓練集中的每個計劃,在CTV_All周圍生成一個1厘米的環形結構(Ring)以限制熱點外溢。另外生成一個環形結構(NS_Ring),其內壁為CTV_All向內-1厘米,外壁為向外+3厘米。
為建立模型性能的基線,使用20名患者(10例左側,10例右側)的子集作為調整隊列。對于每個病例,使用KBP模型生成計劃,射束角度、劑量處方和魯棒性設置與相應的臨床計劃相同。在模型開發過程中,每個體積的優化目標要么自動生成,要么由用戶手動定義,為模型驅動的計劃生成提供基線。我們調整了模型(即預設的目標/優先級模板),使自動生成的目標列表與我們機構的臨床權衡和規劃方案保持一致,因為目標設置和相對優先級分配取決于用戶偏好,并且可以被覆蓋。
將模型生成計劃的劑量-體積直方圖(DVHs)與原始臨床計劃的DVHs進行比較。調整是通過一個迭代的試錯過程進行的:當模型生成的計劃未能達到臨床標準時,調整優化目標并生成新計劃。重復此過程,直到大多數調整病例產生的計劃在臨床上與原始臨床計劃相當或更好。在優化過程中,除了BODY結構外,所有優化目標均保持不變。我們觀察到初始KBP計劃往往會產生增加的熱點。因此,在第一次優化運行中,BODY目標優先級設置為0,以允許優化器在沒有強BODY懲罰的情況下收斂。然后將BODY優先級增加到1000后進行第二次迭代重新優化。這種兩步法有助于減少劑量熱點。
一旦所有調整病例都獲得了可接受的結果,這些最終確定的優化目標就被用于生成最終的KBP模型。魯棒優化應用于所有CTV,然后使用由這個迭代調整過程確定的同一組優化目標創建兩個模型。
模型驗證
使用一個獨立的20名患者(10例左側,10例右側)隊列(未包含在訓練隊列中)來驗證兩個KBP模型。對于每位患者,生成兩個計劃——一個使用結合模型,一個使用分側模型——并與彼此以及原始手動生成的臨床計劃進行比較。僅執行一次優化迭代,不進一步更改目標列表。
使用DVH指標評估計劃性能,以評估靶區覆蓋和OAR保護,包括CTV_All的選擇性最差情況魯棒性場景。使用配對t檢驗對模型生成計劃和臨床計劃進行統計比較,顯著性定義為p < 0.05。
邀請了一位乳腺癌專家醫師進行盲法審閱,比較臨床計劃和每個KBP模型生成的計劃。對于20個驗證患者中的每一個,醫師評估靶區覆蓋和OAR保護,按照1-3級對每個計劃進行排名,1表示臨床最可接受,3表示最不可接受。
結果
所有KBP生成的計劃都滿足臨床約束。兩種模型實現了與臨床計劃相當的靶區覆蓋。結合模型在腋窩、鎖骨上和內乳淋巴結中產生了較低的熱點,在OAR保護(心臟、食管、氣管、甲狀腺)方面有適度的改善。分側模型顯示出類似的益處,特別是在食管和甲狀腺保護方面。在模型之間比較時,分側計劃具有較低的熱點,而結合模型在OAR保護方面略好。醫師審閱認為所有KBP計劃在臨床上都可接受,在20個病例中有11個病例更傾向于KBP計劃。
具體而言,結合模型生成的計劃在靶區覆蓋的任何劑量學參數上均無顯著差異。平均而言,結合模型創建的計劃在靶體積(包括腋窩淋巴結、鎖骨上淋巴結和內乳淋巴結)上顯示出較低的熱點。這些計劃的魯棒性與臨床計劃非常可比,因為在CTV_All最差情況下的覆蓋沒有顯著差異。此外,結合模型生成的計劃證明了對幾個OAR的改善保護,包括心臟、食管、氣管和甲狀腺。結合模型與臨床計劃之間沒有其他統計顯著的差異。
分側模型產生的計劃在靶區覆蓋方面與手動生成的臨床計劃相比也沒有顯著差異。在腋窩淋巴結、鎖骨上淋巴結和內乳淋巴結的熱點方面觀察到顯著降低。分側模型還顯示出對食管和甲狀腺保護的改善。在最差情況覆蓋場景中沒有顯著差異,進一步證明了可比的靶區覆蓋。分側模型生成的計劃與臨床計劃之間的所有其他差異均不具有統計學意義。
當直接比較分側模型和結合模型時,發現任何指標的靶區覆蓋均無顯著差異。值得注意的是,分側模型在每個CTV(包括CTV_All、胸壁、腋窩淋巴結、鎖骨上淋巴結和內乳淋巴結)上導致了較低的熱點。在最差情況不確定性場景中的覆蓋沒有差異,證明兩個模型之間的魯棒性相當。結合模型創建的計劃總體上具有改善的保護,特別是對食管、氣管和甲狀腺。總體而言,分側模型的性能與結合模型相當,具有完全可比的靶區覆蓋、改善的熱點劑量和略差的OAR保護結果。
在對20名驗證患者的盲法審閱中,專家醫師在11個病例中更傾向于模型生成的計劃。在這11個計劃中,結合模型在7個病例中比分側模型更受青睞。所有由兩個KBP模型生成的計劃在總體靶區覆蓋和OAR保護方面都被認為是臨床可接受的。平均而言,模型生成計劃的魯棒性與臨床計劃相當。
討論
本研究的主要目的是開發和比較兩種用于伴區域淋巴結受累的胸壁或乳腺癌IMPT的KBP模型。鑒于目前關于乳腺癌IMPT的KBP研究有限,本研究還旨在評估模型設計策略,為未來標準化方法的發展提供參考。
考慮到胸壁和乳腺癌IMPT是單側進行的,最初尚不清楚開發側別特異性KBP模型還是單個結合模型會產生更好的性能。為此,對兩種方法都進行了實施和評估。所有三個模型都顯示出對OAR DVH估計的良好擬合,具有可比的平均χ2值。平均而言,結合模型在靶體積中具有略高的熱點,但改善了OAR保護。與手動生成的臨床計劃相比,兩種模型都實現了較低的熱點和改善的OAR保護。結合模型可能在臨床上更受歡迎,因為它提供了可比的靶區覆蓋,同時提供了更優的OAR保護,特別是對食管、氣管和甲狀腺。一個額外的實際優勢是,單個結合模型允許所有患者得到一致的規劃,無需按側別分離隊列。
兩種模型之間差異的原因尚不完全清楚。一個可能的解釋在于迭代調整過程,在此期間優化目標被細化以為左右側病例生成可接受的計劃。這可能導致了一組更通用、更穩健的目標,其本質上更適合在兩側數據上訓練的模型,而不是針對單側進行狹義優化。因此,結合模型受益于在50名患者的完整數據集上進行訓練,使其能夠從更廣泛的解剖變異和治療場景中學習。相比之下,分側模型的訓練數據每側僅限25個病例,這可能會降低其泛化能力并限制模型性能。這實際上將每個分側模型的訓練隊列減少到只有25名患者,這可能限制了其在驗證期間的性能。在未來的研究中,增加每個側的訓練病例數量,理想情況下使用每個至少50個病例的兩個分側模型,將更準確地評估分側模型的潛在性能。然而,在本研究中,為了確保兩種模型的公平和受控比較,保持兩個建模方法的隊列大小相同是重要的。盡管如此,先前的研究表明訓練隊列大小對計劃結果的影響很小甚至沒有。
獨立評估時,結合模型生成的所有20個驗證計劃均被認為在臨床上可接受,并與手動優化的對應計劃相當。在這20個病例中,有3個在技術上超出了平均心臟劑量(Dmean<1Gy)的臨床約束。然而,進一步審查發現,原始臨床計劃也未滿足此約束。在這些情況下,解剖限制可能阻止了同時實現完全的靶區覆蓋和心臟約束。因此,臨床計劃者優先考慮了靶區覆蓋,基于臨床判斷接受了增加的心臟劑量。KBP模型似乎反映了類似的優先級,傾向于CTV覆蓋而犧牲了心臟保護。盡管超出了心臟約束,模型生成的計劃與臨床對應計劃相比仍然顯示出改善的心臟保護,因此被認為是臨床可比的。
平均而言,結合模型生成的計劃在臨床上與手動優化的對應計劃相當,甚至更優。平均而言,任何劑量學參數的靶區覆蓋均無顯著差異。大多數計劃在腋窩、鎖骨上和內乳淋巴結中具有較低的熱點。重要的是,結合模型始終如一地實現了顯著更好的OAR保護,特別是對心臟、食管、氣管和甲狀腺。這些OAR結構在胸壁和乳腺癌IMPT病例中特別需要保護。CTV_All最差情況覆蓋場景也沒有顯著差異,證明了結合模型創建的計劃具有臨床可比的魯棒性。改善的OAR保護,結合完全可比的靶區覆蓋和魯棒性,支持了結合模型的整體臨床實用性。
與手動生成的計劃相比,使用分側模型創建的計劃在大多數指標上表現出臨床相當或更優的性能。值得注意的是,在腋窩、鎖骨上和內乳淋巴結中熱點較低。結合模型計劃還顯示出對幾個OAR(包括心臟、食管和甲狀腺)的改善保護。這些OAR約束在胸壁和乳腺癌IMPT中高度相關,因此這種改善的保護在計劃過程中非常理想。
盲法醫師審閱的結果進一步支持了模型生成的計劃與手動生成的計劃高度可比的結論。在20名患者中有11名患者選擇了模型生成的計劃作為更優。促使傾向于模型生成計劃的因素包括改善的靶區覆蓋、增強的心臟保護和減少的靶區內熱點劑量。可能替代的模型目標可以產生更有利的計劃。為了標準化比較,每個驗證計劃都經過標準化以滿足所有靶區的最低覆蓋標準。雖然模型使用廣泛適用的目標進行訓練以增強通用性,但臨床偏好可能因審閱者和機構而異;因此,目標集和權重可以微調以反映當地的實踐優先級。
本研究的結果與先前關于乳腺癌IMRT(而非IMPT)的研究結果一致。據我們所知,之前沒有研究像本研究這樣,在同一患者隊列上訓練并直接比較兩種乳腺癌/胸壁癌癥模型的性能。我們的研究結果表明,KBP是胸壁和乳腺癌IMPT規劃的一個有價值的工具。我們建議創建包含左右側患者的結合模型,因為這種方法似乎能提供更好的規劃結果。盡管如此,分側模型(僅左側或僅右側)仍然是臨床可行的替代方案。
每個由KBP模型生成的計劃從優化到最終劑量計算大約需要20分鐘。這明顯快于傳統的手動IMPT規劃,后者通常需要兩到四個小時。盡管本研究發現了KBP生成計劃的某些局限性,但應注意模型生成計劃僅完成了一次優化迭代,并且在優化過程中沒有調整目標列表。在實踐中,此類模型可以作為治療計劃的寶貴起點。規劃者可以使用模型生成的計劃作為基線,并將更多時間用于解決復雜的、患者特定的問題,而不是從零開始。需要強調的是,雖然KBP模型可以提高治療計劃的效率和一致性,但它們不能替代專家的臨床判斷。最終,經驗豐富的計劃者的專業知識對于評估和完善模型生成的計劃仍然是必不可少的,以確保其滿足個體化的臨床要求并堅持最高的護理標準。
先前相關研究通常只在其模型中納入具有單一側別或劑量處方的患者。雖然這可能會提高其模型的整體穩健性,但它沒有考慮到臨床實施計劃中更現實的偏差。不同的患者將需要不同的處方和治療方案,我們的模型旨在通過使用具有不同劑量處方的患者來考慮這些差異。雖然大多數患者對所有靶體積(CTV)采用了標準的50 Gy處方,但一部分患者接受了45 Gy,一名患者處方為50.4 Gy。這種變異性被有意納入,以反映臨床實踐中遇到的劑量處方范圍,目的是增強模型的穩健性。然而,包含不同處方劑量可能通過在學習過程中引入噪聲而阻礙模型的泛化能力。此外,未排除離群值,以保留我們診所患者群體的代表性樣本,從而提高模型對未來計劃生成的通用性。這種方法與先前的報告一致,即對于一個精心策劃的KBP模型庫,離群值移除對最終計劃質量的影響很小。
本研究的一個局限性是未對KBP生成的計劃進行患者特定的IMPT質量保證(QA),這增加了一些計劃可能更難實施的可能性。未來的工作將結合實施驗證(患者特定QA和/或日志文件分析)和計劃復雜性指標,以系統評估可實施性并減輕潛在的庫選擇偏差。本研究的另一個潛在局限性是所有50個訓練病例和20個驗證病例均來自單一機構。因此,這些模型可能反映了機構特定的臨床實踐、勾畫風格和機器性能,這可能會限制研究結果的通用性。雖然先前的一項研究表明,在一個機構開發的用于頭頸癌IMPT的KBP模型能夠為來自外部機構的驗證病例生成臨床可比的計劃,但尚不清楚這種通用性是否適用于胸壁和乳腺癌IMPT。考慮到解剖、規劃和實踐的差異,每個機構根據其特定的患者群體和工作流程創建和調整自己的KBP模型可能仍然是可取的。
KBP模型提供了幾個優勢,包括DVH估計和顯著縮短的優化時間,使其成為在胸壁和乳腺癌IMPT中臨床實施的一個實用工具。特別是,KBP提供的效率和自動化可能對自適應放射治療特別有益,因為必須在緊迫的時間范圍內生成高質量的計劃。
未來的工作應側重于開發和改進KBP模型,以進一步提高單側(左側或右側)胸壁和乳腺癌治療的計劃質量。增加每個分側模型的訓練隊列規模可能會提高性能和穩健性。盡管存在這些局限性,但本研究中兩個模型在大多數情況下生成的計劃在臨床上與手動生成的計劃相當。此外,為雙側乳腺癌的IMPT開發KBP模型(本研究有意排除)是未來研究的一個重要領域。鑒于兩個模型的強勁性能,KBP很可能在這一領域對生成高質量計劃非常有用。
結論
本研究評估了KBP模型在伴區域淋巴結受累的胸壁或乳腺癌IMPT治療中的應用。開發了兩種KBP模型:一種是為單側分別訓練的分側模型,另一種是在兩側數據上一起訓練的聯合模型。兩種模型生成的計劃在臨床上與手動生成的臨床計劃相當,甚至在某些情況下更優,所有計劃均被認為是臨床可接受的。
總體而言,兩種KBP模型為治療計劃提供了穩健的起點,提供了大量的時間節省和改善的規劃效率。隨著進一步的驗證,特別是在多個機構之間,KBP模型具有更廣泛實施的潛力,可增強IMPT規劃在臨床實踐中的一致性和質量。