如何分析breakdancer检测结构变异

这篇文章将为大家详细讲解有关如何分析breakdancer检测结构变异,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

10年积累的成都网站建设、网站建设经验,可以快速应对客户对网站的新想法和需求。提供各种问题对应的解决方案。让选择我们的客户得到更好、更有力的网络服务。我虽然不认识你,你也不认识我。但先制作网站后付款的网站建设流程,更有平顺免费网站建设让你可以放心的选择与我们合作。

breakdancer 是一款结构变异检测软件, 专门针对双端测序数据进行开发,github地址如下

https://github.com/genome/breakdancer

分析原理图如下

如何分析breakdancer检测结构变异

从原理图可以看出,breakdancer 会根据双端reads的比对情况,检测以下5种类型的结构变异

  1. insertions

  2. deletions

  3. inversions

  4. inter-chromosomal translocations

  5. intra-chromosomal translocations

软件的安装过程如下

git clone --recursive https://github.com/genome/breakdancer.git
cd breakdancer
mkdir build
cd build
cmake .. -DCMAKE_BUILD_TYPE=release -DCMAKE_INSTALL_PREFIX=/usr/local
make

最终会生成一个可执行的二进制文件,breakdancer-max。软件的使用也比较简单,共两个步骤。

1. 生成配置文件

输入文件为比对基因组产生的bam文件, 用法如下

bam2cfg.pl tumor.bam normal.bam > config.txt

配置文件中,每个样本对应一行记录,包含以下特征值

readgroup:tumor
platform:illumina
map:tumor.bam
readlen:144.84
lib:YL
num:10000
lower:0.00
upper:519.05
mean:210.24
std:65.87
SWnormality:-40.54
exe:samtools view
2. 鉴定结构变异

用法如下

breakdancer_max -t -q 10 -d sv.reads config.txt > sv.out

结构变异的检测计算量较大,所以需要的时间也很久。输出文件的列数很多,共有14列。

每一列的含义如下

  1. Chromosome 1

  2. Position 1

  3. Orientation 1

  4. Chromosome 2

  5. Position 2

  6. Orientation 2

  7. Type of a SV

  8. Size of a SV

  9. Confidence Score

  10. Total number of supporting read pairs

  11. Total number of supporting read pairs from each map file

  12. Estimated allele frequency

  13. Software version

  14. The run parameters

1到6列描述的是断裂点的位置信息;第7列描述结构变异的类型,DEL代表缺失,INS代表插入,INV代表倒位,ITX代表同一染色体上的易位,CTX代表不同染色体之间的易位;第8列代表结构变异的长度,对于染色体间的易位,这个数值没有含义;第9列代表该结构变异可信度的打分值,数值越大,可靠性越高。

关于如何分析breakdancer检测结构变异就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。


文章标题:如何分析breakdancer检测结构变异
标题路径:http://ybzwz.com/article/ihcosj.html