さて、ちっともまともに動いてくれないツール群の中で唯一走りきったっぽいCASHのデータを紐解いてみよう。
こんな感じにexcelでも表示できる出力がtxtでできるので見てみる。左からID、Chr:position、exon numberと並んでいる。続く4カラムがちょっとよくわからず、p値、FDRで右端がASの種類。
全部で23531個のASイベントを検出しているが当然pvalueやFDRで絞る必要があるだろう。
p<0.05で絞るなら1657イベント、FDR<0.01なら201まで絞られる。
201のうち8個がA3SS,14個がA5SS、17個がAltEnd、25個がAltStart、111個がcassette、15個がcassette multi、5個がIR、6個がMXEとなる。
例えば一番下のROMO1はA3SSタイプなので
こんな感じに3’のスプライスパターンに違いがある
ASが10:0で起こっていればリードカウントを見れば違いはすぐわかるわけだが、実際は割合が変化するだけだったりする。
そうするとカバレッジだけではASの有無を判断できず、junctionをまたいだリードを見る必要性が出てくる。その手の検出をこのツールはやっているわけだね。
とりあえずこのツールは使えそうだ。
IGVでsashimi plotなるツールが使える。
これを使うと、ASが実際にどういう頻度(割合)で起こっているのかを確認できる。
上のROMO1ではcontrolでは1/4程が短いexonになっているが、knockdownではそれがおこらなくなっているらしい。