纳昂达科技欢迎您!联系电话:400-8717-699
暂无图片
您当前的位置:天天彩票下载app > 小纳专题 > 捕获专区

捕获专区

全外显子捕获那些事儿(上篇)


全外显子测序(Whole Exome Sequencing,WES)仅对人基因组约2%的区域测序,便可覆盖绝大多数基因的编码序列和>99%(临床基因组资源库,ClinGen)疾病相关区域。借助WES,可检测基因的点突变、小片段插入缺失、基因重排及拷贝数变异等信息,随着测序成本的下降,其在基础研究、遗传病筛查、肿瘤分子诊断、免疫治疗等领域得到越来越广泛地应用。


WES测序包含三个部分(图1):

1)文库构建;

2)外显子靶向捕获;

3)测序分析



图1. 全外显子测序流程需要注意的事项。


常见的NGS for Illumina®️文库构建为两种类型:1)基于A突起的片段分子与T突起的Y型接头连接构成文库分子;2)转座酶快速打断同时引入接头序列构成文库分子。前者因为无偏好性相对更受欢迎。尽管DNA文库构建试剂盒和各家的靶向捕获方案不断完善优化,前期文库构建和中间的靶向捕获步骤中仍有不少潜在“雷点”需要考虑,才可能获得稳定可靠的WES测序数据。


捕获前文库构建

起始样本:老生常谈

样本起始量与质量,是靶向测序分析的基石。尤其是对于低频突变的准确检测,足够的原始拷贝数是先决条件。理论上,在1 ng的人类基因组DNA中,每个基因约有300个原始拷贝。当文库转化率为100%时,NGS检测下限可低至1%(95%置信区间)[1]。虽然多个品牌的试剂盒都支持对低至1 ng DNA样本起始量建库,但在建库的多个步骤存在不同程度的样本损失,因此难以达到理论的检测敏感度。这时,就需要我们在最开始时,保证样本质量并提高起始量。


纵观目前提供WES测序服务的各家公司,基本上都明确注明“高质量的DNA样本≥1 μg”。为保证足够的样本文库分子进入全外显子捕获测序分析,我们推荐参考表1,并根据实际的样本情况来确定起始量。

表1. 全外显子靶向测序样本要求



另一方面,低质量样本,如FFPE,则需要特别的处理。FFPE样本由于在制作过程中可能人为的引入突变,如胞嘧啶经脱氨基转变为尿嘧啶,形成“C>T”人为突变。因此,对于FFPE样本在建库前我们另外建议使用NEBNext®️FFPE DNA Repair Mix等专业的修复试剂进行处理,藉此提高文库产量,降低人为引入的突变[2]。更多FFPE样本的建议(详情请参考)。



图2. 在10样本外显子混合杂交捕获,采取“片段双选”模式进行片段筛选,测序数据的产出。


样本标签:小小变化保平安

为了方便后续的文库扩增和测序,需要对片段化的DNA加上适配测序的接头。


多个样本连接上不同序列接头批量构建文库,随后多个样本文库混合进入单次捕获实验,再之后与其他文库同时进行测序——这种“高通量”的生产模式你是不是很熟悉?这个模式虽然高效、高性价比,却有“雷区”。


如图2,IDT公司相关研究数据显示,样本为250 ng片段化gDNA,利用xGen®️ AML Panel在1-plex、4-plex、8-plex和16-plex混杂水平进行靶向捕获测序,混杂水平越高,标签错配的发生概率越高[3]



图2. 混合捕获中,标签错配的发生概率随着混杂水平的提高而升高。

WES常见数据产出为 10 G(以 xGen®️ Exome Research Panel为例,10 G有效下机数据,其中靶率为约为90%,平均测序深度为130x左右)。WES通常在Illumina®️ HiSeq X或NovaSeq这类超高通量的测序平台进行,而这两种仪器均采用排他性扩增(Exclusion amplification)和Patterned flow cell技术,是易发生标签跳跃(Index hopping)的“重点机型” (详情请参考)。


在整个建库和捕获过程中,多个步骤都可能引入标签错配,我们在表2中做了相关总结。而接头上小小的变化——在接头上引入双端唯一样本标签,便可以从最终下机的数据进行质控。通过P5和P7端独特的Index双侧校验剔除标签错配,是目前最优的解决方案。


表2. UDI接头可以有效改善各个阶段发生的标签错配


NanoPrepTM  UDI精选多种UDI接头。其在Index设计过程中,充分考虑了碱基平衡和色彩平衡,并且通过了测序验证。从设计和功能上,这类UDI接头都是样本的“护身符”,保证测序数据的正确分配。随着多个测序平台对双端Index测序模式的开放,高质量的UDI接头渐渐将成为成行业标配。

接头浓度:对“症”下“药”,有的放矢

在接头连接步骤,我们推荐根据不同的Input DNA及其片段大小确定接头用量。不同品牌的文库均有相应的推荐。


特别值得注意的是,针对外显子捕获的文库构建推荐DNA样本片段化范围为150~350 bp。常见接头浓度为 15 μM。当Input DNA≥500 ng时,适度增加接头用量可以提高文库产出量,当Input DNA≤25 ng,接头应稀释后使用。以NanoPrep DNA文库构建系列为例,其推荐接头稀释方法如表3。

表3. NanoPrep DNA文库构建体系推荐接头使用量



片段双选:稳定的数据产出量

放入同样数量的文库进入捕获环节,下机数据量却大相径庭。你有没有遇到这种苦恼?尤其是不同类型的样本,如果不对片段化方式进行调整和优化,有时候文库出库产量看起来一样,其中的分子数目相差甚远。


在文库构建流程中,接头连接后常见一个磁珠纯化步骤用于接头过滤(过滤不完全,游离的接头也是样本串扰的“罪魁祸首”之一)。然而,这样的“单端”过滤,能够去除如游离接头等小片段,满足大部分应用场景,但受片段化方式影响较大,偶尔会出现数据产出不均一的情况。因此,在起始样本较多的前提下(Input DNA ≥ 200 ng),推荐“双端”过滤,即“片段双选”。其不仅可去除如游离接头等小片段;还可去除大部分>700 bp(取决于片段长度)的文库分子,使文库分子片段分布更集中(图3)。


根据经验,针对Illumina®️测序平台我们建议筛选出350 bp~450 bp文库片段进入靶向捕获测序。


图3. 片段单选与片段双选结果示例,

NanoPrepTM建库体系中,用于片段筛选的NanoPrepTM SP Beads是一款高性价比的磁珠产品。与AMPure XP Beads的对比平行测试表明,其损耗小、片段筛选能力稳定(图4)。



图4.  NanoPrep SP Beads可回收> 50 bp的DNA。

在进行4杂和10杂外显子捕获过程中,在建库过程中使用NanoPrepTM SP Beads进行“片段双选”。文库混杂时,进行500 ng/文库等量混合,同时混合捕获4个与10个文库样本,其下机拆分后的数据产出均匀稳定(图5)。


图5. 在外显子混合杂交捕获中,采取“片段双选”模式进行片段筛选,测序数据产出均一。

本实验中样本为片段化外周血gDNA 300 ng,利用NanoPrep DNA文库构建体系进行建库,后采取xGen Exome Research Panel进行外显子靶向测序,HiSeqX PE150测序模式。

PCR扩增:别太多,够用就行

片段筛选完成后,需要进行PCR扩增。考虑到PCR扩增存在偏好性,HiFi聚合酶的使用已是行业标配。


除了HiFi 聚合酶的使用,我们建议根据样本类型、片段化Input DNA和文库预期确定PCR循环数。在此步骤切忌文库过度扩增,用于WES的DNA文库可以通过循环数来控制文库产出至600~1000 ng的总量,随后单个文库取500 ng进入杂交体系。


外显子捕获测序重要的评价指标重复率(Duplication rate)和扩增数有着直接关系。扩增数越多,因扩增产生的完全一致的文库分子越多,测序数据重复率也相应增加,则有效的测序数据量被削减。以NanoPrepTM建库体系为例,我们给出了相应的参考循环数(表4)。


表4. PCR扩增循环数参考



NanoPrepTM DNA文库构建试剂盒

NanoPrepTM DNA文库构建试剂盒是基于A-T连接原理,针对Illumina®高通量测序平台的文库构建试剂盒。该试剂盒操作流程简单,可用于全基因组测序,也可兼容靶向捕获测序。该试剂盒包含以下3个建库相关模块,其高效稳定的文库产出将助你WES捕获测序“一臂之力”。



图6. NanoPrepTM DNA文库构建试剂盒建库体系


如图7所示,在相同的起始量和实验条件下,NanoPrepTM DNA文库构建试剂盒的整体表现与Vendor K相当。对于10 ng、100 ng和1000 ng的Input DNA,通过调整循环数,NanoPrepTM 产出~1000 ng的文库进入下游WES捕获测序分析



图7. 不同起始量下NanoPrepTM DNA文库构建试剂盒的文库产量。

以上便是我们以NanoPrepTM文库试剂盒为例针对全外显子捕获实验的相关建议。在《全外显子捕获那些事儿(下篇)》中,我们将结合最新捕获实验Protocol为大家梳理捕获步骤的相关注意事项,尽请期待。


参考文献

[1]


[2]


4erCUrf+L9Fma+e9MPrdZadgGXfFSSIlExZfNQlUXdl4pYtGNCyZgYad4GVtiIa62iqxnc9qvPCLqe4uIulomu3DmHEYnB4KhmMWOMeJCNFA1jktxljNlqHGNYSVSL4yoT+f0k0w5o2yGxOm0jKKC0DN/wjD0pfZchP2pIP20lpaXNG2iBJbIOihhzbIdy5t/AYMIfYALA8RVrHq6nJcDqVbCbtWRBDE