纳昂达科技欢迎您!联系电话:400-8717-699
暂无图片
您当前的位置:天天彩票下载app > 小纳专题 > Adapter专区

Adapter专区

“超低频假阳性突变”这件小事

上篇文章中,我们介绍了数种带有样本标签和分子标签的Illumina Y型接头策略。接头的拆分一直是大家关注的重点。除了IDT推荐的工作流程和Github开源的软件包以外,国内的研究者近期也开发出了新型工具。

3.31号南京举办的第五届NGS创新开发者大会,来自海普洛斯的陈实富博士生动活泼的讲述了“超低频假阳性突变”这件小事。同时,陈博士还介绍了一款FASTQ预处理器fastp。该软件能够轻松处理文库分子的样本标签和分子标签。

以下是fastp的的十大功能和陈博士的精彩演讲   

                                                                                                                      fastp软件十大功能列表

1.  对数据自动进行全方位质控,生成人性化的报告;

2.  过滤功能(低质量,太短,太多N......);

3.  对每一个序列的头部或尾部,计算滑动窗内的质量均值,并将均值较低的子序列进行切除(类似 Trimmomatic 的做法,但是快非常多);

4.  全局剪裁 (在头/尾部,不影响去重),对于 Illumina 下机数据往往最后一到两个 cycle 需要这样处理;

5.  去除接头污染。厉害的是,你不用输入接头序列,因为算法会自动识别接头序列并进行剪裁; 

6.  对于双端测序(PE)的数据,软件会自动查找每一对read的重叠区域,并对该重叠区域中不匹配的碱基对进行校正;

7.  去除尾部的 polyG。对于NextSeq/NovaSeq 的测序数据,因为是两色法发光,polyG 是常有的事,所以该特性对该两类测序平台默认打开;

8.  对于PE数据中的overlap区间中不一致的碱基对,依据质量值进行校正;

9.  可以对带分子标签(UMI)的数据进行预处理,不管UMI在插入片段还是在index 上,都可以轻松处理;

10.  可以将输出进行分拆,而且支持两种模式,分别是指定分拆的个数,或者分拆后每个文件的行数。 


该项目的 github 地址:

https://github.com/OpenGene/fastp 

 演讲全文
















4erCUrf+L9HCd6iUfJewF6dgGXfFSSIlExZfNQlUXdl4pYtGNCyZgWF4abTUazOQnDlC/fJMJxMxXiwzsVYiPoZ/Kr34qrIpW7h9/ItyDQ9VYKgLolFeinu4IllDwxbzmhzPRaGo063AXE4TE0KMJZQ0hwkwkPqeDmj7YKiOEmYaFqjN+l6lJF+5rMydDML0BJWInwhRRmXzUccZjlz29kEoEUGD50CY