摘要:研究表明,基于獎勵的學習需要兩種神經調節劑來平衡彼此的影響。
如果你聽說過大腦中的兩種化學神經遞質,那可能是多巴胺和血清素。別管谷氨酸和伽馬氨基丁酸起了大部分的作用,吸引所有頭條新聞的一直都是多巴胺和血清素。多巴胺是 “快樂化學物質”,而血清素則是穩定情緒的 “溫柔劑”。
當然,頭條新聞大多是錯誤的。多巴胺在塑造行為方面的作用遠遠超出了“快樂”甚至“獎勵”這樣的簡單概念。事實上,提高血清素的SSRI抗抑郁藥需要幾周或幾個月的時間才能起作用,這表明,實際上并不是血清素水平的立即上升,而是下游大腦回路中一些仍然神秘的變化。
圖1 紋狀體多巴胺和血清素對強化的相反控制
斯坦福大學吳蔡神經科學研究所的一項新研究揭示了這些情緒管理分子的另一個新方面。這項研究在線發表在《自然》雜志上,首次準確地展示了多巴胺和血清素是如何共同作用的——或者更準確地說,是如何對立作用,來塑造我們的行為。
該研究的資深作者、斯坦福大學精神病學和行為科學普利茲克教授Robert Malenka說:“除了與我們的日常行為有關外,多巴胺和血清素還與多種神經和精神疾病有關:成癮、自閉癥、抑郁癥、精神分裂癥、帕金森癥等等。”“如果我們要在治療這些疾病方面取得進展,了解它們之間的相互作用對我們來說至關重要。”
理論:多巴胺和血清素對塑造行為都很重要——但如何影響呢?
長期以來的研究表明,多巴胺和血清素在不同物種的學習和決策中起著至關重要的作用。然而,這些神經遞質之間的確切相互作用仍不清楚。多巴胺與獎勵預測和尋求有關,而血清素似乎可以調節這些沖動,促進長期思考。
目前出現了兩種主要理論:“協同假說”(synergy hypothesis),認為多巴胺處理短期回報,而血清素管理長期利益;“對立假說”(antagonency hypothesis),認為兩者是平衡我們決策的對立力量,多巴胺敦促立即行動,血清素建議耐心。
斯坦福大學的這項新研究是吳蔡神經計劃的一部分,為這些相互競爭的假設提供了第一個直接的實驗測試。
實驗:多巴胺和血清素在聯想學習中的雙重控制
Daniel Cardozo Pinto等人組成的研究小組創造了經過特殊改造的小鼠,使他們能夠觀察和控制同一動物體內的多巴胺和血清素系統。
這種創新的方法幫助他們確定了這兩個系統在大腦中相互作用的位置——特別是在一個被稱為伏隔核的邊緣區域,它在情感、動機和獎勵處理中起著關鍵作用。
Cardozo Pinto說:“這是一個技術要求很高的項目,需要我們開發新的策略來記錄和操縱清醒、行為正常的動物體內多種神經調節劑的活動。”然而,他補充說,“我堅持了下來,因為我強烈懷疑多巴胺和血清素系統之間會有令人著迷的相互作用,而其他研究一次只關注一種神經調節劑,而事實證明正是如此。”
Cardozo Pinto等人用他們的創新工具觀察了當小鼠學會將音調和閃光與甜蜜的獎勵聯系起來時,伏隔核中的多巴胺和血清素信號是如何變化的。他們發現,多巴胺和血清素系統的反應方向相反——多巴胺信號隨著獎勵而上升,而血清素信號則下降。
然后,研究人員使用光遺傳學操作(一種利用光來控制轉基因神經元的技術)在獎勵學習過程中選擇性地減弱每個系統的正常信號——無論是單獨的還是聯合的。
可以預見的是,考慮到將這些信號系統與獎勵學習聯系起來的研究歷史,阻斷多巴胺和血清素信號使小鼠無法將聲音和光線線索與含糖獎勵聯系起來。更令人驚訝的是,恢復多巴胺或血清素信號本身并不足以讓動物重新學習。只有兩個系統都在線,動物才能成功地利用這些線索預測獎勵的到來。
Cardozo Pinto回憶說:“這個項目中最令人驚訝和難忘的時刻是當我進行我的第一個光遺傳學實驗時,我測試了小鼠是喜歡多巴胺增加、血清素下降,還是兩者兼而有之。我們將小鼠放在一個盒子里,并將盒子的不同部分與每種體驗配對,這樣老鼠就可以用腳投票選擇他們喜歡的體驗。我永遠不會忘記在實驗結束時走進房間,看到所有的小鼠都站在盒子的一邊,共同代表兩種操作方法時的興奮。在科學上,得到一個如此驚人的結果是非常罕見的,你可以立即看到它,這是我們第一個直接證據來支持幾十年前的多巴胺-血清素對立假說。”
即將到來的:調控多巴胺和血清素以改善精神病治療
研究人員說,研究結果表明,多巴胺和血清素以相反的方式共同作用,幫助大腦從獎勵中學習。
基于他們的研究結果,他們提出這兩個系統的作用有點像汽車上的油門和剎車。當事情比預期的好時,多巴胺通過發出信號來鼓勵尋求獎勵的行為,產生“行動”信號。相比之下,血清素似乎在這一過程中踩了剎車,產生“停止”或“等待”的信號,潛在地幫助我們更有耐心,考慮長期后果,而不僅僅是眼前的回報。研究表明,有效的學習既需要多巴胺發出的“開始”信號,也需要血清素發出的“等待”信號,這樣生物體才能正確地評估和應對有益的機會。
這一發現也對涉及多巴胺和血清素功能障礙的疾病有啟示,比如成癮,其中多巴胺能超敏反應和血清素能缺陷會導致強迫性的尋求獎勵,以及包括抑郁和焦慮在內的情緒障礙,其中血清素信號的減少可能會損害行為靈活性和長期計劃。
“隨著多巴胺在獎勵學習中的作用越來越清楚,多巴胺系統已經成為一個自然的起點,用于研究涉及獎勵處理中斷的疾病,如成癮和抑郁。我們的研究表明,多巴胺和血清素系統形成了一個獎勵的‘剎車’系統,這表明,未來關注這兩個系統之間的相對平衡將是富有成效的。”
例如,在成癮治療中,治療可能旨在抑制過度活躍的多巴胺信號,同時提高血清素的活性。在抑郁癥中,目標可能是增強這兩個系統,以改善動機和長期規劃。
此外,該團隊為完成這項研究而取得的技術進步,可能會長期應用于神經科學研究,Malenka補充道。“我們為這項研究開發的新方法現在可以應用于一系列有趣的問題,這些問題涉及大腦如何調節適應性行為,以及在成癮、抑郁和自閉癥譜系障礙等普遍的腦部疾病中,這些神經調節系統出了什么問題。”
參考資料
[1] Opponent control of reinforcement by striatal dopamine and serotonin