Nat Genet:利用饱和基因组编辑分析抑癌基因BAP1编码序列中99%的所有可能SNV

时间:2024-08-05 06:00:21   热度:37.1℃   作者:网络

BRCA1相关蛋白1基因(BAP1)是一种抑癌基因,其胚系功能丧失变异可导致一种常染色体显性肿瘤易感综合征,其中大多数此类变异会生成移码或截断等位基因。到目前为止,已有超过1,000个BAP1错义变异被临床观察到。近期已发布了针对携带致病性胚系BAP1变异个体的筛查指南,因此识别处于风险中的人群并进一步优化监测建议和风险降低策略至关重要。在肿瘤中识别破坏性体细胞BAP1变异可能有助于肿瘤靶向治疗。

近日,来自英国Sanger研究所的研究人员对BAP1进行了详尽的饱和基因组编辑(SGE)。研究团队分析了18,108个独特变异,其中6,196个被发现具有异常功能,并使用这些数据评估了UK Biobank中的表型关联。同时,研究团队还在一个大型人群筛选的肿瘤集合中、在癌症家系和ClinVar中表征了变异,并探讨了癌症相关变异与神经发育表型相关变异的差异。相关研究结果已发表Nature Genetics上,文章题为“Saturation genome editing of BAP1 functionally classifies somatic and germline variants”。

图片

01 优化的SGE方法提高了实验质量

研究团队开发了一种具有克隆衍生Cas9基因组整合的HAP1 DNA连接酶4(LIG4)敲除(KO)系,并确认了其中BAP1的必要性(图1)、高Cas9活性和单倍体的稳健维持。研究团队还优化了质粒和转染协议,将HAP1细胞的转染效率从<5%提高到>60%。研究选择了五个时间点,以筛查BAP1的所有编码外显子:第4天(D4)、第7天(D7)、第10天(D10)、第14天(D14)和第21天(D21)。经过优化的SGE协议提高了通过同源定向修复(HDR)的编辑效率,未编辑的读取数约为1%。

图片

图1:BAP1基因位点SGE的实验设计和工作流程

BAP1的标准转录本(ENST00000460680.6)有17个外显子,由于寡核苷酸合成长度有限,研究设计了22个≤245 bp的SGE靶区段,以饱和所有编码序列,以及20-90 bp的外显子-内含子边界序列(内含子、5′UTR、3′UTR)。对于较大的外显子,设计了部分重叠的区段。所有HDR模板文库都使用VaLiAnT设计,这些文库包含两个不同的同义protospacer相邻基序(PAM)/protospacer保护编辑(PPE),可防止sgRNA-Cas9切割,防止嵌入片段被切割。每个SGE区域在两个独立实验中进行靶向;HDR模板文库A包含一个sgRNA(A)的PPE,文库B包含同一靶区段内不同sgRNA(B)的不同PPE。所有22个区域的文库A和文库B在五个时间点上以三重复进行转染,并在上述时间点收集样本(图2)。

图片

图2:使用优化SGE的细胞适应性报告了编辑BAP1基因座的突变后果。 

02 BAP1的必需性允许突变后果分离

研究团队使用细胞适应性作为BAP1功能的生物学读数,首先严格重新确认了BAP1的必需性和SGE在HAP1细胞中的有效性。此外,研究进行了一个针对BAP1所有17个外显子的193个sgRNA的靶向CRISPR-Cas9筛查,选择适当的sgRNA进行实验。研究人员部署了这些sgRNA和变异文库,覆盖所有22个BAP1靶区,并确认了编辑结果。与预期一致,对于一个适用于SGE的必需基因,停止获得和移码变异在D4和D21之间的计数减少,表明这些变异的细胞数量减少,而同义和内含子变异的计数保持不变。

通过结合文库A和文库B,研究团队计算了每个变异的单一“功能得分”。停止获得、移码和剪接供体/受体变异主要表现为负功能得分,而同义、内含子和UTR变异的功能得分分布在0的中心。错义变异表现出一系列功能得分,具有负偏的单峰分布。对于每个测试的变异,使用功能得分除以标准误差的z分布计算P值。所有独特的变异都被汇总,P值通过Benjamini-Hochberg程序校正以得出假发现率(FDR)。

03 基因架构和保守性的功能分析

功能得分和FDR值用于将变异分类为功能类别。经过过滤步骤后,收集了18,108个独特变异的数据,并将变异分类:11,912个未变化,5,665个减少和531个增加。未变化的变异紧密围绕零功能得分,增加的变异得分略有增加,减少的变异表现出更广泛的得分分布(图3)。

图片

图3:BAP1变异的功能分类

研究发现,BAP1的保守N端UCH结构域对错义变化和密码子缺失的耐受性较低,而蛋白质中央区域的耐受性较高。密码子缺失精确地划定了关键结构域,突出显示了未表征的区域。

在与临床数据进行比较之前,研究团队检测了每个变异的功能得分和功能分类的可重复性,通过比较独立基因组编辑实验的LFC值。总体而言,81%的变异(14,624/18,108)分别使用文库A和文库B HDR模板进行分析,LFC值的相关性接近线性(图4)。当使用文库A或文库B LFC和FDR计算功能分类时,变异分类的一致性为90%(13,106/14,624)。由于LFC和功能分类高度相关,为增加稳健性,文库A和文库B的LFC值被结合为一个单一的“组合LFC”。

图片

图4:SGE数据在技术上是稳健的,并提供高度准确的临床分类。

04 结 语

BAP1编码一种肿瘤抑制因子,参与多种细胞过程,包括DNA损伤反应、转录、细胞周期调节和凋亡,并作为去泛素酶起作用。BAP1在许多肿瘤中发生突变,胚系变异容易导致癌症和发育障碍。但在任何一种情况下预测错义变异的致病性都是极具挑战性的。

在这项研究中,研究团队使用SGE分析了BAP1编码序列中99%的所有可能SNV。SGE数据使得研究人员能够准确预测在癌症家族和肿瘤中发现的变异的致病性,并识别了先前未报告的功能残基。研究团队还对63,590名BAP1变异携带者进行了全表型关联研究,发现破坏性变异携带者的癌症频率增加,以及循环中的胰岛素样生长因子1(IGF-1)水平升高,这是一种肿瘤促进因子和有丝分裂原,揭示了一个可能的靶向机制。   

该研究表明,SGE基因位点的详尽功能评估具有帮助患者诊断、加深对疾病机制的生物学理解和对基因/蛋白质功能的基本理解的潜力。

论文原文:

Waters, A.J., Brendler-Spaeth, T., Smith, D. et al. Saturation genome editing of BAP1 functionally classifies somatic and germline variants. Nat Genet 56, 1434–1445 (2024). https://doi.org/10.1038/s41588-024-01799-3

上一篇: 【TCT】维持治疗时代高危骨髓瘤串联移植...

下一篇: GUT:温州医科大学郑明华等团队合作提供...


 本站广告