kuroの覚え書き

96の個人的覚え書き

FastQCの結果を評価する

exp1という実験のfastqファイルをQCすると
exp1_1_fastqc.html
exp1_1_fastqc.zip
exp1_2_fastqc.html
exp1_2_fastqc.zip
の4つのファイルができる。
htmlファイルをブラウザで開けばそれぞれ個別にチェックできるが、大量のデータをいちいち開くのは勘弁してほしい
そこでzipファイルになっているものからデータを抜き出してテキストで処理したい
まずzipを解凍してもいいが
exp1_1_fastqcという感じのフォルダに
fastqc_data.txt
fastqc_report.html
fastqc.fo
Icons
Images
summary.txt
と多数できてくるうち、fastqc_data.txtが参照すべきデータなので

unzip -c exp1_1_fastqc.zip exp_1_fastqc/fastqc_data.txt | less > fastqc_data_exp1_1.txt

という風にこのファイルだけまずは抜き出してくるといいかも

その上で更にこのファイルから必要箇所をcat | grep |sedで抽出してくるといいかな。
抽出はまた今度書く。