“在許多情況下,lncRNA調(diào)控活性更可能源自基因座中的轉(zhuǎn)錄行為和DNA元件,而不是實(shí)際lncRNA轉(zhuǎn)錄本本身,RNA僅僅是存在或者產(chǎn)生并不一定意味就能體現(xiàn)它的功能。”
——— Joshua T. Mendell教授
在1月25日的《細(xì)胞》(Cell)雜志上,來自德克薩斯大學(xué)西南醫(yī)學(xué)中心的Joshua T. Mendell教授和Florian Kopp博士發(fā)表了題為“Functional Classification and Experimental Dissection of Long Noncoding RNAs”的綜述文章,從lncRNA的in cis和in trans兩種作用方式進(jìn)行概念性的闡述,并對lncRNA功能試驗(yàn)方法框架進(jìn)行了深入剖析。
作者首先回顧目前對lncRNA功能的理解,將這些轉(zhuǎn)錄本大致歸類為順式(in cis)調(diào)控局部染色質(zhì)結(jié)構(gòu)和/或基因表達(dá)的lncRNA,以及那些離開轉(zhuǎn)錄位點(diǎn)并反式(in trans)執(zhí)行細(xì)胞功能的lncRNA。
順式
lncRNA在局部基因調(diào)控中的功能
對于順式作用的lncRNA來說,將RNA分子自身的功能與所轉(zhuǎn)錄的DNA區(qū)分開來非常具有挑戰(zhàn)性。作者設(shè)想三種潛在的機(jī)制可以通過lncRNA基因座調(diào)節(jié)局部染色質(zhì)或者基因表達(dá)。
序列相關(guān)的lncRNA順式調(diào)控
lncRNA轉(zhuǎn)錄本本身可以通過招募調(diào)控因子到基因座和/或調(diào)節(jié)其功能,進(jìn)而調(diào)控鄰近基因的表達(dá)
lncRNA最顯著的功能,就是順式調(diào)控抑制或激活染色質(zhì)。
代表基因:Xist
轉(zhuǎn)錄或剪切相關(guān)的順式調(diào)控lncRNA
lncRNA轉(zhuǎn)錄和/或拼接的過程會產(chǎn)生一種基因調(diào)控功能,這種調(diào)控與RNA轉(zhuǎn)錄本的序列無關(guān)
與其他轉(zhuǎn)錄單位不重疊的lncRNA轉(zhuǎn)錄,可能也會改變RNA聚合酶II(Pol II)在附近的啟動子和基因體上的占用空間,以及影響局部染色質(zhì)狀態(tài)和轉(zhuǎn)錄因子對啟動子和增強(qiáng)子區(qū)域的結(jié)合。
代表基因:Igf2r、linc1319、Blustr、Uph、
lncRNA基因座內(nèi)的功能性DNA元件
cis順式調(diào)控完全取決于lncRNA啟動子或基因位點(diǎn)中的DNA元件,完全獨(dú)立于編碼的RNA或其蛋白產(chǎn)物
還有一種lncRNA順式調(diào)控活性的情況必需要考慮,其內(nèi)部的DNA元件的功能與轉(zhuǎn)錄RNA的產(chǎn)生或序列沒有相關(guān)性。
代表基因:lincRNA-p21、Bendr
反式
lncRNA的功能
lncRNA反式調(diào)控基因
調(diào)控遠(yuǎn)離其轉(zhuǎn)錄位點(diǎn)的染色質(zhì)狀態(tài)和基因表達(dá)的lncRNA
HOX antisense intergenic RNA, HOTAIR 是首個被發(fā)現(xiàn)能反式調(diào)控基因表達(dá)的lncRNA。
代表基因: HOTAIR、Ttc39aos1、SLERT
構(gòu)成細(xì)胞核架構(gòu)的lncRNA
影響細(xì)胞核結(jié)構(gòu)和功能的lncRNA
一些lncRNAs似乎影響了核結(jié)構(gòu)來編排轉(zhuǎn)錄、RNA加工以及基因表達(dá)中的其他步驟,以及賦予在這些過程中空間調(diào)控。
代表基因:MALAT1、NEAT1、Firre、
調(diào)控相互作用蛋白質(zhì)和RNA的lncRNA
與蛋白質(zhì)或/和其他RNA分子相互作用和調(diào)控的lncRNA
反式作用lncRNA也可以通過調(diào)節(jié)與其結(jié)合的蛋白質(zhì)或RNA活性和豐度來發(fā)揮功能。這些lncRNA的關(guān)鍵特性就是需要化學(xué)計(jì)量與它們相互作用的靶分子,為了發(fā)揮可測量的調(diào)控作用。因此,在研究這類轉(zhuǎn)錄本時,必須仔細(xì)地對lncRNA及其靶基因的細(xì)胞內(nèi)拷貝數(shù)進(jìn)行定量,以確定該機(jī)制的合理性。一般而言,這些調(diào)節(jié)相互作用可以發(fā)生在細(xì)胞核或者細(xì)胞質(zhì)中,文章暫先關(guān)注細(xì)胞質(zhì)研究案例,以對上文中提到的許多細(xì)胞核案例作為補(bǔ)充。除了RNA結(jié)合蛋白,lncRNA也能通過堿基對相互結(jié)合調(diào)節(jié)其他RNA的豐度和活性。這類中最突出的就是調(diào)節(jié)microRNA活性的非編碼RNA,一種被稱為競爭性內(nèi)源性RNA(ceRNAs)的轉(zhuǎn)錄本。
代表基因:NORAD、CDR1-AS
lncRNA
lncRNA基因座的識別和初步鑒定
試驗(yàn)方法 關(guān)鍵詞:
CRISPR/Cas9、RACE、RT-PCR、CAGE、RNA-Seq、PAS-Seq、Northern-blotting、PhyloCSF/Pfam預(yù)測、Ribosome profiling
挑選一個lncRNA深入研究,通常需要將這個lncRNA與特定的發(fā)育、生理或病理生理狀態(tài)相關(guān)聯(lián)。例如許多l(xiāng)ncRNA的表達(dá)水平在發(fā)育和細(xì)胞分化和疾病狀態(tài)下中表現(xiàn)出動態(tài)變化。
在諸如癌癥等疾病中,許多l(xiāng)ncRNA都容易發(fā)生拷貝數(shù)改變和表達(dá)水平變化,因?yàn)樵诓煌{迫條件或信號通路激活后,lncRNA的表達(dá)受到了差異調(diào)控。
作為鑒定改變表型的lncRNA位點(diǎn)的互補(bǔ)性方法,近期出現(xiàn)利用多重CRISPR技術(shù)的正向遺傳學(xué)篩查方法。利用個別sgRNA將Cas9定位在lncRNA位點(diǎn)的方法并不可靠,原因是這個方法只能得到很短的插入-缺失,并不能導(dǎo)致整個lncRNA的功能性失活。為了將lncRNA喪失功能,已經(jīng)開始使用成對sgRNA文庫來生成lncRNA位點(diǎn)中更大的缺失。又或者將Cas9與抑制轉(zhuǎn)錄結(jié)構(gòu)域或激活轉(zhuǎn)錄結(jié)構(gòu)域融合,使全基因組的lncRNA功能獲得或功能喪失,即CRISPR干擾和CRISPR激活。當(dāng)解釋這些篩選的結(jié)果時,務(wù)必要意識到這些技術(shù)中每種技術(shù)都等同于失活或者超激活lncRNA真實(shí)生成的基因和DNA調(diào)控元件,例如增強(qiáng)子。因此必須仔細(xì)研究從這些系統(tǒng)性方法中浮現(xiàn)出來的候選lncRNA,以確定他們實(shí)際上是否是功能性RNA,如果能確定是功能性RNA的話,再搞清楚它們的作用機(jī)制。
一旦發(fā)現(xiàn)了感興趣的lncRNA位點(diǎn),就應(yīng)該搞清楚這個轉(zhuǎn)錄本在目標(biāo)細(xì)胞類型或目標(biāo)組織中的完整結(jié)果特征。研究方法可以包括rapid amplification of cDNA ends (RACE),或其他確定轉(zhuǎn)錄本5’和3’末端的方法,再結(jié)合逆轉(zhuǎn)錄PCR證明其中的剪切模式。也可以分析ENCODE和FANTOM這樣的公共開放的高通量測序數(shù)據(jù)庫。如果有相關(guān)類型的細(xì)胞和組織,則可能足以了解感興趣的lncRNA結(jié)構(gòu)。這些方法包括基因表達(dá)的帽子分析(CAGE),RNA測序(RNA-Seq)和優(yōu)化檢測PolyA位點(diǎn)的polyA site sequencing (PAS-Seq),這些方法分別能明確研究轉(zhuǎn)錄本的5’末端、剪切模式和3’末端。如果可能的話,northern blotting還能確定轉(zhuǎn)錄本的長度。因?yàn)橥ǔ?捎玫淖⑨尪紒碓从诟咄繑?shù)據(jù)的自動化分析,所以可能注釋信息可能不準(zhǔn)確或者不完整,尤其是如果轉(zhuǎn)錄本起初是在一種特定的細(xì)胞類型中鑒定得到的。此外還應(yīng)該確定lncRNA轉(zhuǎn)錄本的細(xì)胞拷貝數(shù),因?yàn)楫?dāng)系統(tǒng)闡述有關(guān)該lncRNA作用機(jī)制的合理假設(shè)時,最終lncRNA細(xì)胞拷貝數(shù)信息必將非常重要。由于越來越多被注釋的lncRNA都被證明能編碼短肽,所以排除那些有編碼蛋白可能性的假定非編碼轉(zhuǎn)錄本就表現(xiàn)得至關(guān)重要。用PhyloCSF這樣的算法對感興趣的RNA序列中密碼子替換的進(jìn)化模式進(jìn)行分析,就能對這個序列編碼蛋白的可能性進(jìn)行預(yù)測。這種方法利用了編碼轉(zhuǎn)錄本引入同義替換和保守氨基酸改變,以及相對缺乏生成翻譯終止密碼子的系統(tǒng)進(jìn)化序列變異的特點(diǎn),通過電腦模擬翻譯序列與已知的蛋白質(zhì)家族(Pfam)結(jié)構(gòu)域的相似性,也預(yù)測轉(zhuǎn)錄本編碼蛋白的可能性。最后,利用核糖體圖譜直接觀察假定開放閱讀框的核糖體印記,就可以從非編碼RNA中區(qū)分出能編碼蛋白轉(zhuǎn)錄本。
順式作用lncRNA基因座功能研究
試驗(yàn)方法 關(guān)鍵詞:
CRISPR/Cas9、RNA-Seq、GRO-Seq、qRT-PCR、ASO- or siRNA-mediated knockdown、RIP、pull-down、CLIP
一旦確定想研究的某個lncRNA,理解這個lncRNA功能的第一步就是弄清楚它在局部順式(in cis)調(diào)控基因表達(dá),還是它離開轉(zhuǎn)錄位點(diǎn)并反式(in trans)方式發(fā)揮功能。辨別lncRNA是順式調(diào)控,還是反式調(diào)控作用,最好的方法就是采用功能獲得性和功能喪失性試驗(yàn)。要評估lncRNA功能喪失后的影響,首先可以直接使用如CRISPR/Cas9介導(dǎo)刪除lncRNA啟動子或整個lncRNA序列。對于多外顯子長lncRNA基因,最好是刪除啟動子區(qū)域而不是整個序列,這樣可以減少移除那些嵌入在lncRNA基因內(nèi)的調(diào)控DNA元件的可能性。一旦lncRNA的功能缺失,就該用RNA-Seq和GRO-seq,以及qRT-PCR方法測定鄰近基因的轉(zhuǎn)錄和穩(wěn)態(tài)表達(dá)。lncRNA失活后,如果鄰近基因表達(dá)量改變,則這個lncRNA很明確指向順式作用功能。lncRNA的異源表達(dá)也不能恢復(fù)在lncRNA敲除細(xì)胞中的基因表達(dá)變化,這樣就進(jìn)一步證實(shí)了這個lncRNA的功能就是順式調(diào)控局部基因表達(dá)。
如上文描述,調(diào)控局部基因表達(dá)的lncRNA可能通過嵌入在lncRNA啟動子或基因主體內(nèi)的DNA調(diào)控元件,也許需要或不需要它們轉(zhuǎn)錄的功能。在其他情況下,轉(zhuǎn)錄的RNA本身可能是功能實(shí)體。為了區(qū)分這些可能,在lncRNA的5’端附近插入一段polyA信號序列就能提供很多信息。這種操作將會提早終止轉(zhuǎn)錄,同時保持啟動子和基因主體中所有DNA元件保持完整。因此這種操作影響了鄰近基因的表達(dá),如果想發(fā)揮lncRNA活性就需要其轉(zhuǎn)錄,不再支持傳統(tǒng)DNA元件的作用作為唯一的功能實(shí)體。
這個方法需要注意的是插入一段長polyA序列會增加DNA調(diào)控元件之間的距離,因此有可能改變它們的活性。在相同位置插入一段對照序列,例如突變的polyA位點(diǎn)就可以緩解這個問題。如果polyA插入使lncRNA調(diào)控活性徹底喪失,那么從基因位點(diǎn)產(chǎn)生的RNA轉(zhuǎn)錄或剪切可能就是關(guān)鍵事件,或者RNA本身可能以一種特定序列的方式執(zhí)行調(diào)控功能。在剪切位點(diǎn)引入靶點(diǎn)突變,以及后續(xù)刪除或者替換lncRNA的序列通常會進(jìn)一步區(qū)分這些潛在機(jī)制。比如,通過特定序列方式發(fā)揮功能的lncRNA對外顯子刪除就很敏感,然而在轉(zhuǎn)錄和剪切為基礎(chǔ)的序列則對序列替換影響不大,反而會由于polyA位點(diǎn)插入和剪切位點(diǎn)突變而失活。ASO和siRNA介導(dǎo)敲低常備用作評估lncRNA序列生成的RNA是否有功能。雖然這些方法都能明顯降低成熟lncRNA轉(zhuǎn)錄本的表達(dá),但目前還不清楚這些試劑能在多大程度上促進(jìn)新生RNA的裂解。這是一個很重要的問題,因?yàn)橛删巯佘账峄瘷C(jī)制或其他機(jī)制產(chǎn)生的新生轉(zhuǎn)錄酶是轉(zhuǎn)錄終止的自然觸發(fā)因素。
對于lncRNA生成一個功能RNA的情況,對相互作用蛋白和核酸的鑒定是很重要的下一步。嚴(yán)格甚至變性條件下的交聯(lián)和回收相互作用比那些依賴RIP或體外pull down試驗(yàn)的方法更受歡迎。在其他領(lǐng)域的綜述中,近期開發(fā)的方法極大提高了鑒定內(nèi)源性RNA與蛋白、染色質(zhì)和其他RNA相互作用的特異性。由于順式作用lncRNA表達(dá)水平通常很低,最初可能很難應(yīng)用這些方法。如果需要的話,也還可以通過細(xì)胞提取物中體外pull-down下來的RNA來識別出lncRNAs與候選蛋白相互作用模式。在這些情況下,關(guān)鍵是要用CLIP仔細(xì)驗(yàn)證內(nèi)源性分子之間的任何假定的相互作用。
蛋白質(zhì)或核酸結(jié)合模式或染色質(zhì)定位位點(diǎn)的鑒定,通常會允許形成合理的假設(shè),以進(jìn)一步驗(yàn)證順式作用lncRNA的機(jī)制研究。
反式作用lncRNA的調(diào)查研究
試驗(yàn)方法 關(guān)鍵詞:
Rescue experiment、Cell fractionation/FISH、RT-PCR
如果lncRNA功能喪失也沒影響局部基因表達(dá),則其很可能通過反式作用發(fā)揮功能。反式功能可以通過敲除細(xì)胞內(nèi)異位修復(fù)lncRNA表達(dá)的恢復(fù)實(shí)驗(yàn)得到明確證實(shí),結(jié)果是在lncRNA功能喪失時觀察到表型逆轉(zhuǎn)。反式作用的lncRNA可能執(zhí)行多種功能,使用細(xì)胞分離和熒光原位雜交對lncRNA亞細(xì)胞定位最初分析就會得到很多信息。識別與RNA相互作用的蛋白質(zhì)或核酸或/和染色質(zhì)熱定區(qū)域的定位,都是對反式作用lncRNA功能研究不可分割的部分,同時結(jié)合交聯(lián)的方法減少假陽性相互作用。最后,研究這類lncRNA時尤其重要的是仔細(xì)量化它們的表達(dá)水平,并且確保提出的機(jī)制模型都包含它們的表達(dá)水平信息。
最后附上該文通訊作者Joshua T. Mendell教授在接受2016年Edith and Peter O'Donnell醫(yī)學(xué)獎時,題目為的“Regulation & Function of Non-coding RNAs in Physiology & Cancer”學(xué)術(shù)報(bào)告視頻。