kuroの覚え書き

96の個人的覚え書き

RNAseqパイプライン2

続いてtophatとcufflinksにかける

#!/bin/sh

#アノテーション情報を含むgtfファイル
read -p "annotation infomation = " gtf
#リファレンスファイルの指定(拡張子なし)
read -p "reference file (without suffix) = " ref_prefix
echo "アノテーション情報は$gtf"
echo "リファレンスファイルは$ref_prefix.fa"
for file in $@
do
echo ""$file"についてtophatを実行する"
#出力するディレクトリを作る
dir_name="${file%.*}"
mkdir -p ./tophat_results/"$dir_name"
output_dir=./tophat_results/"$dir_name"
#echo "出力先は$dir_name"
tophat -p 4 -G "$gtf" -o "$output_dir" "$ref_prefix" "$file"
echo "---------------------------------------------"
echo "accepted_hits.bamを"$output_dir"/"$dir_name"_th.bamに改名する"
mv "$output_dir"/accepted_hits.bam "$output_dir"/"$dir_name"_th.bam
echo "---------------------------------------------"
echo ""$dir_name"_th.bamについてcufflinksを実行する"
output_dir2=./tophat_results/"$dir_name"/cufflinks_results
cufflinks -p 4 -g "$gtf" "$output_dir"/"$dir_name"_th.bam -o "$output_dir2"
echo "---------------------------------------------"
done

最初にアノテーションとリファレンスのファイルを対話的に指定し、あとは順次処理していく。

スクリプト名はtophat_cufflinks
トリミングしたfastqファイルのあるディレクトリに移動

$ tophat_cufflinks hoge1_trim.fastq hoge2_trim.fastq hoge3_trim.fastq