病毒基因在正常人体组织中广泛表达,与人类疾病和发育有关
时间:2022-11-18 20:55:00 热度:37.1℃ 作者:网络
逆转录病毒已经感染哺乳动物和其他脊椎动物至少1亿年了,能够入侵宿主的体细胞和生殖细胞。已有研究显示,古生殖细胞逆转录病毒感染的原病毒残余物,现如今以人类内源性逆转录病毒(HERV)的形式构成了大约8%的人类基因组。这些古老的逆转录病毒感染了灵长类祖先的种系,并以孟德尔方式遗传。
目前,许多古老的逆转录病毒已经严重退化,以单个长末端重复序列(LTRs)和病毒开放阅读框(ORF)片段的形式留下残余。这些基因的存在使人们能够拼凑出灵长类动物的逆转录病毒感染历史,这一过程类似于使用一个物种的多个个体的部分化石遗骸来了解其进化史。
研究发现,许多HERV与今天存在于动物体内的其他外源病毒有远亲关系。在所有的HERV分支中,唯一包含人类特有的原病毒亚分支可以在属于Betaretrovirus属的HERV- k组中的人类小鼠乳腺肿瘤病毒样(HML)-2亚组中找到。虽然病毒或宿主基因的HML-2修饰表达具有潜在的重要性,但迄今为止,HML-2在非患病人体中的表达尚未得到很好的表征。
近日,美国塔夫斯大学研究团队在PLOS Biology发表了题为“Widespread expression of the ancient HERV-K(HML-2)provirus group in normal human tissues”的研究文章。研究团队分析了尸检正常组织样本的GTEx转录组数据集,在948个个体54个不同组织的13000个不同样本中描述了HML-2原病毒组的个体表达。HML-2转录本可以在每个样本组织中被识别,在小脑、垂体、睾丸和甲状腺中表达水平最高。同时,不同亚组的原病毒在组织表达上出现偏倚,这可能与其LTRs中转录因子结合位点的差异有关。此外,该研究还揭示了有趣的表达模式,即最古老的原病毒是表达最多的,最频繁的原病毒表达见于神经元、内分泌和生殖组织。主要研究内容
不同组织中HERV-K(HML-2)转录本的丰度检测
研究人员使用了Telescope软件分析来自GTEx的转录组数据,该软件专门设计用于比对来自HERV等逆转录元素的多重比对,并使用贝叶斯混合模型,将reads比对到最可能的源序列。将Telescope的效果与其他6种比对方法进行比较,发现其在reads分配方面是最精确的,避免了错误检测的问题,同时减少了未使用的模糊比对reads的数量。
图1. 研究分析策略示意图。
研究团队对人体多个组织进行了定量分析,结果发现HML-2在小脑、睾丸、甲状腺和垂体中表达量最高。这表明不同组织中HML-2表达的不同模式提示其存在组织特异性因素,可以驱动这种表达或某些组织展现出表达限制。在热点组织如甲状腺和垂体中,研究人员观察到病毒的前表达可能是HML-2对不同信号激素反应的结果。
图2. 不同身体部位样本HML-2原病毒的表达。
HML-2原病毒转录受LTR序列的影响
已有研究提出,HERV序列在睾丸中的表达是HERV参与发育和繁殖的结果。研究团队分析发现,LTR5HS亚型结合了FOXR2和TFAP2B等与早期发育调控相关的因子,提示其在睾丸等生殖组织中的表达可能具有调控作用。但生殖组织和睾丸中的HML-2活性可能是古代病毒感染的影响,较年轻LTR5HS原病毒在生殖组织中的主要表达可能反映了原始病毒表达模式的持久性,较老LTR5A/B原病毒在CNS组织中的表达可能反映了其整合后进化到完全不同的功能,与病毒复制或传播没有明显关系。因此,较老原病毒比较年轻原病毒表达频率更高,可能是由于这些原病毒的选择性保护。
图3. HML-2原病毒转录受LTR序列的影响。
在GTEx中观察到的所有包含完整ORF的原病毒都必须在人类祖先基因组中经历数十万年到数百万年的选择,并仍然保持表达和包含特定完整ORF的能力。其中三个原病毒(3q12.3,7p22.1a和12q14.1)也是LTR驱动的,这使得病毒的ORF受到LTR的直接控制。3q12.3的原病毒在全身高水平表达,并包含完整的gag基因,是增殖的主要候选病毒,值得未来研究;12q14.1是一种原病毒,保留了完整的gag和env基因,但只在肾脏中表达,这可能使其在该器官内有更针对性的功能;7p22.1a携带一个众所周知的全功能env基因。总的来说,这些含有ORF的原病毒被高表达和LTR驱动,可能在全身组织中产生可翻译的病毒转录本。相比之下,非LTR表达原病毒则取决于单个转录本的结构。在未来进一步分析每一个原病毒的蛋白产物可以揭示HML-2原病毒在正常人类生物学中的作用。
图4. 基于TF结合谱的表达HML-2原病毒LTRs的聚类。
结 语
综上所述,研究团队利用GTEx项目的转录组数据,发现有37种不同的原病毒表达,每个组织位点都有一定程度的表达。这些表达模式存在明显异质性。虽然生物性别似乎也显著影响某些原病毒在特定组织中的表达,但在大多数情况下,样本供体中原病毒表达的相当大的异质性仍未得到解释。
图5. GTEx数据集中HML-2表达的潜在应用。
HML-2的活性并不局限于病变或癌变组织,这一发现具有重要的临床意义。例如,使用HML-2表达作为癌症生物标志物或治疗的靶点时,需要考虑非病变组织中的背景表达。文章通讯作者John Coffin说道:“我们已经发现,几乎所有正常的人类组织,在它们的RNA中都表达了大约36种内源性原病毒中的一种或几种,这些原病毒是我们远祖广泛传播的逆转录病毒感染的残余。我们希望这一发现能为进一步研究这些元素在人类生物学和疾病中的作用提供基础。