exp1という実験のfastqファイルをQCすると
exp1_1_fastqc.html
exp1_1_fastqc.zip
exp1_2_fastqc.html
exp1_2_fastqc.zip
の4つのファイルができる。
htmlファイルをブラウザで開けばそれぞれ個別にチェックできるが、大量のデータをいちいち開くのは勘弁してほしい
そこでzipファイルになっているものからデータを抜き出してテキストで処理したい
まずzipを解凍してもいいが
exp1_1_fastqcという感じのフォルダに
fastqc_data.txt
fastqc_report.html
fastqc.fo
Icons
Images
summary.txt
と多数できてくるうち、fastqc_data.txtが参照すべきデータなので
unzip -c exp1_1_fastqc.zip exp_1_fastqc/fastqc_data.txt | less > fastqc_data_exp1_1.txt
という風にこのファイルだけまずは抜き出してくるといいかも