伏隔核殼區(qū)鈣活動(dòng)跨巴甫洛夫與操作性學(xué)習(xí)動(dòng)態(tài)編碼獎(jiǎng)賞大小:纖維光度法解析訓(xùn)練與情境依賴的信號(hào)演變
《Neurobiology of Learning and Memory》:Nucleus accumbens shell activity reflects reward magnitude and training duration during Pavlovian and operant conditioning
編輯推薦:
伏隔核殼區(qū)(NAcs)是獎(jiǎng)賞引導(dǎo)行為的關(guān)鍵腦區(qū),但其如何在不同學(xué)習(xí)模式和訓(xùn)練階段編碼獎(jiǎng)賞大小尚不清楚。研究人員通過光纖光度法記錄大鼠在巴甫洛夫與操作性任務(wù)中的NAcs鈣活動(dòng)。結(jié)果發(fā)現(xiàn),NAcs活動(dòng)在接受獎(jiǎng)賞后持續(xù)反映獎(jiǎng)賞大小,但信號(hào)的時(shí)間和形式取決于任務(wù)類型與訓(xùn)練經(jīng)驗(yàn)。研究表明,NAcs神經(jīng)元主要在獎(jiǎng)賞接收點(diǎn)編碼獎(jiǎng)賞大小,且這種編碼隨學(xué)習(xí)類型與訓(xùn)練時(shí)長(zhǎng)動(dòng)態(tài)調(diào)整,為理解其在獎(jiǎng)賞驅(qū)動(dòng)行為中的動(dòng)態(tài)、情境特異性作用提供了新見解。
想象一下,你的大腦里有一個(gè)負(fù)責(zé)處理“獎(jiǎng)勵(lì)”信息的關(guān)鍵區(qū)域,它就像一個(gè)精明的財(cái)務(wù)顧問,時(shí)刻評(píng)估著不同行動(dòng)可能帶來(lái)的“收益”大小,并據(jù)此指導(dǎo)你的行為。這個(gè)區(qū)域就是位于大腦深處的伏隔核(Nucleus Accumbens, NAc),尤其是其殼區(qū)(shell, NAcs)。無(wú)論是聞到美食的香味(條件刺激)讓你流口水,還是學(xué)會(huì)按按鈕獲得零食(操作性行為),NAcs都深度參與其中。然而,盡管我們知道NAcs對(duì)獎(jiǎng)賞至關(guān)重要,但一個(gè)核心問題長(zhǎng)期懸而未決:它究竟如何編碼不同大小的獎(jiǎng)賞?這種編碼方式是否會(huì)因?yàn)槲覀兪潜粍?dòng)接受信號(hào)(如巴甫洛夫條件反射)還是主動(dòng)做出選擇(如操作性條件反射)而不同?又是否會(huì)隨著我們學(xué)習(xí)經(jīng)驗(yàn)的積累而發(fā)生改變?理解這些動(dòng)態(tài)過程,對(duì)于揭示我們?nèi)绾胃鶕?jù)預(yù)期價(jià)值調(diào)整行為、乃至成癮和抑郁癥等涉及獎(jiǎng)賞系統(tǒng)失調(diào)的疾病機(jī)制都至關(guān)重要。
發(fā)表在《Neurobiology of Learning and Memory》上的這項(xiàng)研究,正是為了回答這些問題。研究團(tuán)隊(duì)的核心目標(biāo)是探究NAcs神經(jīng)元群體活動(dòng)(通過鈣信號(hào)反映)在編碼獎(jiǎng)賞大小時(shí),如何受到學(xué)習(xí)模式(巴甫洛夫 vs. 操作性)和訓(xùn)練階段(早期 vs. 晚期)的影響。他們假設(shè),NAcs對(duì)獎(jiǎng)賞大小的編碼并非一成不變,而是具有高度的情境依賴性和動(dòng)態(tài)演變特性。
為了系統(tǒng)性地回答這些問題,研究人員設(shè)計(jì)了一套精巧的多階段行為學(xué)實(shí)驗(yàn)。他們使用光纖光度法(fibre photometry)這一關(guān)鍵技術(shù),在大鼠執(zhí)行任務(wù)時(shí),實(shí)時(shí)記錄其NAcs內(nèi)表達(dá)鈣指示劑jGCaMP7f的神經(jīng)元群體的鈣離子活動(dòng)變化。這種方法可以反映大群神經(jīng)元的總體活動(dòng)水平。實(shí)驗(yàn)對(duì)象為長(zhǎng)埃文斯大鼠,所有程序均符合澳大利亞動(dòng)物倫理規(guī)范。行為實(shí)驗(yàn)分為五個(gè)連續(xù)階段:1)雜志訓(xùn)練;2)巴甫洛夫條件反射階段,大鼠學(xué)習(xí)將不同音調(diào)(條件刺激, CS)與不同數(shù)量(1粒或3粒,代表小獎(jiǎng)賞和大獎(jiǎng)賞)的蔗糖顆粒關(guān)聯(lián);3)操作性訓(xùn)練階段,大鼠學(xué)會(huì)用鼻觸(nose-poke)動(dòng)作獲取單粒獎(jiǎng)賞;4)強(qiáng)迫選擇訓(xùn)練階段,大鼠學(xué)習(xí)根據(jù)提示光選擇正確的鼻觸孔;5)獎(jiǎng)賞大小決策任務(wù)階段,不同鼻觸孔對(duì)應(yīng)不同獎(jiǎng)賞大小(1粒或3粒)。在整個(gè)過程中,研究人員在早期和晚期訓(xùn)練階段分別記錄了NAcs的鈣信號(hào),并分析了其與線索呈現(xiàn)、動(dòng)作執(zhí)行以及獎(jiǎng)賞接收等關(guān)鍵事件的關(guān)系。
主要技術(shù)方法概述:本研究主要采用了光纖光度法,通過在大鼠的伏隔核殼區(qū)(NAcs)表達(dá)基因編碼的鈣指示劑jGCaMP7f,并植入光纖探針,以記錄神經(jīng)元群體的鈣活動(dòng)。行為實(shí)驗(yàn)在Med-Associates操作箱中進(jìn)行,訓(xùn)練大鼠依次完成巴甫洛夫條件反射和操作性條件反射(包括鼻觸訓(xùn)練、強(qiáng)迫選擇及獎(jiǎng)賞大小決策)等多階段任務(wù)。數(shù)據(jù)分析采用自定義MATLAB腳本處理鈣信號(hào),并使用自助法(bootstrapping)和置換檢驗(yàn)(permutation tests)進(jìn)行統(tǒng)計(jì)推斷,以確定信號(hào)相對(duì)于基線的變化以及不同條件間的差異。
研究結(jié)果
3.1. 階段1:雜志訓(xùn)練與階段2:巴甫洛夫條件反射
- •
行為:大鼠成功建立了條件反射。在晚期訓(xùn)練中,對(duì)大獎(jiǎng)賞線索的條件性反應(yīng)(接近雜志的行為)更強(qiáng),表明它們學(xué)會(huì)了區(qū)分線索預(yù)測(cè)的獎(jiǎng)賞大小。
- •
神經(jīng)元活動(dòng):在訓(xùn)練早期,無(wú)論線索預(yù)測(cè)大獎(jiǎng)賞還是小獎(jiǎng)賞,其呈現(xiàn)都會(huì)引起NAcs鈣活動(dòng)的瞬時(shí)增加。然而到了訓(xùn)練晚期,情況發(fā)生了戲劇性變化:預(yù)測(cè)小獎(jiǎng)賞的線索仍引起活動(dòng)增加,但預(yù)測(cè)大獎(jiǎng)賞的線索卻引發(fā)了NAcs活動(dòng)的抑制。在獎(jiǎng)賞交付后,早期訓(xùn)練時(shí)大小獎(jiǎng)賞都引起活動(dòng)增加(大獎(jiǎng)賞更持久),而晚期訓(xùn)練則都轉(zhuǎn)為活動(dòng)抑制,且大獎(jiǎng)賞引起的抑制更強(qiáng)、更持久。
3.2. 階段3:操作性訓(xùn)練
- •
行為:大鼠學(xué)會(huì)了通過鼻觸動(dòng)作獲取獎(jiǎng)賞,消耗的顆粒數(shù)隨訓(xùn)練增加。
- •
神經(jīng)元活動(dòng):在鼻觸動(dòng)作發(fā)生前,NAcs活動(dòng)出現(xiàn)明顯的“爬升”(ramp-up),這在早期和晚期訓(xùn)練中均有出現(xiàn)。不同的是,在晚期訓(xùn)練中,鼻觸動(dòng)作后的NAcs活動(dòng)會(huì)降至基線以下,而早期訓(xùn)練后則是活動(dòng)增加。
3.3. 階段4:強(qiáng)迫選擇訓(xùn)練
- •
行為:大鼠能夠高準(zhǔn)確率地根據(jù)提示光選擇正確的鼻觸孔,且在自由選擇試次中沒有表現(xiàn)出對(duì)某一側(cè)的群體偏好。
- •
神經(jīng)元活動(dòng):無(wú)論選擇正確、錯(cuò)誤或是自由選擇,在鼻觸動(dòng)作前都觀察到NAcs活動(dòng)的增加。只有在做出正確反應(yīng)(即獲得獎(jiǎng)賞)后,NAcs活動(dòng)才會(huì)出現(xiàn)顯著的、持續(xù)的抑制。這表明動(dòng)作后的抑制與獎(jiǎng)賞接收密切相關(guān)。
3.4. 階段5:獎(jiǎng)賞大小決策任務(wù)
- •
行為:大鼠在自由選擇中迅速形成了對(duì)大獎(jiǎng)賞的強(qiáng)烈偏好,但在強(qiáng)迫選擇試次中,對(duì)小獎(jiǎng)賞線索的反應(yīng)速度更快。
- •
神經(jīng)元活動(dòng):在提示光(線索)出現(xiàn)后,晚期訓(xùn)練中NAcs活動(dòng)有小幅增加,但與獎(jiǎng)賞大小無(wú)關(guān)。在鼻觸動(dòng)作前,同樣在晚期訓(xùn)練中出現(xiàn)活動(dòng)爬升,也不編碼獎(jiǎng)賞大小。最關(guān)鍵的發(fā)現(xiàn)在動(dòng)作之后:無(wú)論是早期還是晚期訓(xùn)練,鼻觸動(dòng)作后NAcs活動(dòng)均呈現(xiàn)雙相性抑制(先短暫抑制,后持續(xù)抑制)。更重要的是,大獎(jiǎng)賞比小獎(jiǎng)賞引發(fā)了更強(qiáng)、更長(zhǎng)時(shí)間的抑制,且這種差異在訓(xùn)練晚期更為明顯。
研究結(jié)論與意義
這項(xiàng)研究系統(tǒng)性地揭示了伏隔核殼區(qū)(NAcs)編碼獎(jiǎng)賞大小的動(dòng)態(tài)且依賴于情境的神經(jīng)機(jī)制。主要結(jié)論可歸納為以下幾點(diǎn):
- 1.
NAcs編碼獎(jiǎng)賞大小的主要節(jié)點(diǎn)在獎(jiǎng)賞接收時(shí)刻:無(wú)論在巴甫洛夫還是操作性任務(wù)中,NAcs鈣活動(dòng)在接受獎(jiǎng)賞后都清晰地區(qū)分了大獎(jiǎng)賞和小獎(jiǎng)賞,表現(xiàn)為大獎(jiǎng)賞引起更強(qiáng)、更持久的抑制。這支持了NAcs在獎(jiǎng)賞消費(fèi)中的核心作用,其抑制可能通過解除對(duì)下丘腦等下游進(jìn)食環(huán)路的抑制來(lái)驅(qū)動(dòng)消費(fèi)行為。
- 2.
線索相關(guān)的獎(jiǎng)賞大小編碼具有可塑性且依賴于學(xué)習(xí)模式:在巴甫洛夫任務(wù)中,NAcs對(duì)獎(jiǎng)賞預(yù)測(cè)線索的反應(yīng)隨訓(xùn)練發(fā)生根本性轉(zhuǎn)變:從早期不區(qū)分大小到晚期,大獎(jiǎng)賞線索特異性地誘發(fā)抑制,而小獎(jiǎng)賞線索仍引起激活。這種神經(jīng)活動(dòng)的分化與行為上對(duì)大獎(jiǎng)賞線索更強(qiáng)的條件反應(yīng)同步,提示其可能參與調(diào)節(jié)基于獎(jiǎng)賞大小的條件性行為強(qiáng)度。然而,在操作性任務(wù)中,盡管行為上存在明確偏好,線索(提示光)或動(dòng)作前的NAcs活動(dòng)均未檢測(cè)到獎(jiǎng)賞大小編碼信號(hào)。
- 3.
訓(xùn)練經(jīng)驗(yàn)深刻重塑NAcs活動(dòng)模式:無(wú)論是巴甫洛夫還是操作性任務(wù),NAcs的活動(dòng)模式在早期和晚期訓(xùn)練階段均存在顯著差異。例如,獎(jiǎng)賞接收后的反應(yīng)從早期的激活為主轉(zhuǎn)變?yōu)橥砥诘囊种茷橹鳎粍?dòng)作前的活動(dòng)爬升在操作性任務(wù)晚期更規(guī)則;獎(jiǎng)賞大小引起的抑制差異在晚期也更顯著。這表明NAcs的獎(jiǎng)賞處理功能并非靜態(tài),而是隨著學(xué)習(xí)進(jìn)程不斷優(yōu)化和調(diào)整。
- 4.
NAcs在獎(jiǎng)賞處理中的作用具有情境特異性:本研究直接對(duì)比了兩種基本學(xué)習(xí)范式,發(fā)現(xiàn)NAcs對(duì)獎(jiǎng)賞大小的編碼策略因其所在的“情境”(被動(dòng)關(guān)聯(lián)學(xué)習(xí) vs. 主動(dòng)行動(dòng)-結(jié)果學(xué)習(xí))而異。這凸顯了大腦獎(jiǎng)賞系統(tǒng)的高度靈活性,其信息處理方式取決于行為需求的本質(zhì)。
重要意義:這項(xiàng)工作超越了以往多在單一任務(wù)或訓(xùn)練階段的研究,首次在同一個(gè)體上縱向比較了NAcs跨不同學(xué)習(xí)模式編碼獎(jiǎng)賞大小的動(dòng)態(tài)過程。它證實(shí)了NAcs是獎(jiǎng)賞信息的一個(gè)動(dòng)態(tài)處理器,其編碼策略(何時(shí)編碼、如何編碼)緊密依賴于行為情境和個(gè)體經(jīng)驗(yàn)。這一發(fā)現(xiàn)為理解獎(jiǎng)賞系統(tǒng)如何適應(yīng)復(fù)雜多變的環(huán)境、靈活指導(dǎo)決策和行為提供了更精細(xì)的神經(jīng)基礎(chǔ)。此外,研究強(qiáng)調(diào)的“獎(jiǎng)賞消費(fèi)期抑制”及其與獎(jiǎng)賞大小的比例關(guān)系,深化了我們對(duì)NAcs在動(dòng)機(jī)性行為中“制動(dòng)”作用的理解。未來(lái)的研究可以進(jìn)一步解析NAcs內(nèi)不同神經(jīng)元類型(如D1R與D2R中型多棘神經(jīng)元)在此過程中的特異性貢獻(xiàn),以及這些動(dòng)態(tài)編碼異常如何導(dǎo)致如成癮、暴食癥等獎(jiǎng)賞相關(guān)精神疾病。