《Forensic Science International: Genetics》:Salience, legitimacy and credibility of single-cell sperm data and their evaluation
編輯推薦:
研究推薦:在法醫DNA混合樣本分析中,難以確定精子捐獻者人數、身份及精子數量。本研究將此前為二倍體細胞開發的單細胞電泳圖(scEPG)概率模型擴展至單倍體(精子)數據,并集成到EESCItTM系統。研究利用顯著性-合法性-可信度(SLC)框架評估該單細胞精子分析系統。結果證實模型具有良好的保真度與校準性,能夠準確估計精子捐獻者數量、對每個捐獻者的精子進行正確聚類,并計算穩健的證據權重(WoE)。該系統不依賴于實際貢獻者數量,展現出單細胞數據獨特的魯棒性,為精子細胞DNA分析從研究走向實踐提供了有力工具。
在傳統的法醫DNA分析中,實驗室人員通常從包含未知數量細胞的混合物中提取DNA,進行短串聯重復序列(STR)擴增和電泳分析,最終得到一張混合了未知數量貢獻者(有時是部分貢獻)DNA信號的單一電泳圖。這種方法有兩個固有的短板:其一,混合裂解細胞可能導致姐妹染色單體分離,造成等位基因完全丟失(即drop-out);其二,無法將DNA與特定的細胞類型(如上皮細胞、血液、精子)相關聯。例如,從混合樣本中,我們可以估算出貢獻者1和2分別貢獻了0.5 ng和0.25 ng的DNA,但卻無法知曉這0.5 ng DNA是來自貢獻者1的精子,而那0.25 ng來自貢獻者2的血液。
單細胞分析技術的興起為破解這些難題帶來了曙光。這項技術的關鍵在于,在裂解之前就將單個細胞分離到獨立的容器中。這樣一來,細胞的全部內容物(即兩個染色單體)都有機會被共同擴增,大大降低了等位基因丟失的風險。同時,結合顯微成像技術,我們可以明確分離出的細胞是精子、上皮細胞還是白細胞,從而將每張單細胞電泳圖(scEPG)與特定的細胞類型關聯起來。隨著單細胞分析在法醫學中受到越來越多的關注,一個核心問題隨之浮現:這項新技術,特別是針對精子(單倍體細胞)的分析模型,是否已經足夠成熟,能夠跨越研究與實際應用的邊界,為法庭提供可靠的科學證據?
由Catherine M. Grgicak等人發表在《Forensic Science International: Genetics》上的研究,正是為了回答這一問題。研究人員的目標是描述一個能夠刻畫精子scEPG中DNA信號的概率模型,并將其整合到一個端到端的分析系統中。這個系統不僅要能夠計算特定捐獻者(或不)貢獻的證據權重(WoE),還要能同時估計精子捐獻者的人數以及每個捐獻者被分離出的精子數量。為了系統評估這項新方法的“可轉化性”,研究者們采用了顯著性(Salience)、合法性(Legitimacy)和可信度(Credibility)——即SLC框架。這個框架為評估技術創新是否已具備從研究邁向實踐操作的條件,提供了一個結構化的評估體系。
關鍵技術方法概述:研究人員從6名個體獲取精液樣本,使用DEPArrayTMNxT系統精確分離單個精子細胞。細胞在含有PicoPureTM提取試劑和二硫蘇糖醇(DTT)的溶液中裂解,使用GlobalFilerTM試劑盒進行STR擴增(半反應體積,30個循環)。擴增產物在3500遺傳分析儀上電泳,得到單細胞電泳圖(scEPG)。使用Osiris軟件在5 RFU的分析閾值下分析數據,并手動去除由內標、染料斑等引起的偽跡信號。為評估模型性能,研究人員構建了121個來自已知個體的“單聯體”(singlet,即單個精子scEPG)用于模型驗證,并在此基礎上,通過隨機抽樣模擬構建了33個包含2至5名捐獻者、17至75個細胞的精子混合物用于系統測試。所有數據分析均通過集成單倍體感知模型的EESCItTM軟件完成。
研究結果:
- •
模型構建與驗證:研究構建了一個計算單倍體scEPG(E)在給定(二倍體)基因型(G)下的似然值P(E|G)的概率模型。該模型考慮了配子形成過程中的等位基因分離,并通過位點間條件獨立的假設進行簡化計算,同時為避免基因連鎖的潛在影響,在分析中每個染色體上僅使用一個基因座,共使用了17個常染色體基因座。通過對121個精子單聯體的測試,證實模型返回的預測值與經驗結果之間的均方誤差在任何基因座均不超過3.1×10-5,表明模型具有極佳的保真度。
- •
證據權重的校準性分析:利用LR離散度分析評估證據權重(WoE,即logLR)的校準性。結果顯示,H1(PoI是貢獻者)和H2(PoI非貢獻者)兩種情況下的LR相對頻率和幅度與聲明值一致,在WoE區間[1, 2]內最大離散度僅為0.3。可信度分析表明,沒有單聯體產生誤導性的WoE,并且平均每攜帶約1200 RFU峰高的單倍體,能產生1個WoE單位。
- •
混合樣本的聚類與估計性能:將EESCItTM應用于33個精子混合物(2-5名捐獻者)。系統能夠準確估計捐獻者數量,并將每個捐獻者的scEPG正確聚類。當真實貢獻者(PoI)僅貢獻兩個單倍體時,系統常能產生WoE為10的證據;當貢獻10個單倍體時,WoE值接近25。值得注意的是,WoE值在不同混合復雜度下保持穩定,不依賴于真實的貢獻者數量(n),這展現了單細胞數據獨特的魯棒性。計算時間主要取決于分離的細胞數量,而受貢獻者人數n的影響較小。
- •
SLC框架下的系統性評估:
- •
顯著性:研究明確了單細胞精子數據能夠解決的法醫學相關問題,包括確定精子捐獻者人數、身份及其貢獻的精子數量,這些是傳統體細胞DNA分析無法直接回答的。
- •
合法性:通過使用已知來源的單聯體構建混合物,研究設計保留了對“真實情況”的追蹤能力。對單聯體基因型后驗概率的校準分數評估顯示,模型預測具有高度的可靠性。LR校準分析進一步證實了模型返回的似然比可以有效地用于貝葉斯更新。
- •
可信度:研究表明,基于單倍體細胞的WoE具有良好的判別能力,并且系統的計算效率高。與之前的二倍體單細胞結果相比,單倍體系統在保持性能的同時,擴展了分析能力。
研究結論與意義:本項研究成功地開發并驗證了一個用于分析精子單細胞電泳圖(scEPG)的單倍體概率模型,并將其整合到端到端的單細胞評估系統EESCItTM中。通過嚴格的SLC框架評估,證實該系統在處理精子單細胞數據時,在顯著性、合法性和可信度三個方面均表現出色。具體而言,系統能夠合法且可信地區分競爭假設,準確估計精子捐獻者數量并進行正確的細胞聚類,所產生的證據權重(WoE)數值穩健,不受混合物中貢獻者人數多少的影響。這項工作的意義在于,它首次建立了一個能夠評估單倍體單細胞數據的完整分析系統,為法醫科學中涉及精子細胞的DNA混合物解釋提供了全新的、強有力的工具。它標志著單細胞法醫分析在解決精子特異性問題方面,已經具備了從研究方法向實際操作性應用過渡的堅實理論基礎與技術驗證。