kuroの覚え書き

96の個人的覚え書き

bedtoolsでdepth of coverageを書き出す

$ cat A.bed

chr1    0       20
chr2    0       20

$ cat B.bed

chr1	0	2
chr1	0	4
chr1	0	10
chr1	5	15
chr1	12	20
chr2	1	4
chr2	3	10
chr2	2	15

というbedファイルが有ったとする。
$ coverageBed -d -a A.bed -b B.bed > cov.bed
もしくは
$ bedtools coverage -d -a A.bed -b B.bed > cov.bed
とすると
$ cat cov.bed

chr1	0	20	1	3
chr1	0	20	2	3
chr1	0	20	3	2
chr1	0	20	4	2
chr1	0	20	5	1
chr1	0	20	6	2
chr1	0	20	7	2
chr1	0	20	8	2
chr1	0	20	9	2
chr1	0	20	10	2
chr1	0	20	11	1
chr1	0	20	12	1
chr1	0	20	13	2
chr1	0	20	14	2
chr1	0	20	15	2
chr1	0	20	16	1
chr1	0	20	17	1
chr1	0	20	18	1
chr1	0	20	19	1
chr1	0	20	20	1
chr2	0	20	1	0
chr2	0	20	2	1
chr2	0	20	3	2
chr2	0	20	4	3
chr2	0	20	5	2
chr2	0	20	6	2
chr2	0	20	7	2
chr2	0	20	8	2
chr2	0	20	9	2
chr2	0	20	10	2
chr2	0	20	11	1
chr2	0	20	12	1
chr2	0	20	13	1
chr2	0	20	14	1
chr2	0	20	15	1
chr2	0	20	16	0
chr2	0	20	17	0
chr2	0	20	18	0
chr2	0	20	19	0
chr2	0	20	20	0

という感じに各base positionのdepth of coverageをカウントして書き出してくれる。

A.bed, B.bedはそのままBAMファイルでもいいらしい。

なお、-dオプションを付けないと
$ bedtools coverage -a A.bed -b B.bed

chr1	0	20	5	20	20	1.0000000
chr2	0	20	3	14	20	0.7000000

となってAの各領域に何個のリードが張り付いたかと、被覆率が示される(Breadth of Coverage )