kuroの覚え書き

96の個人的覚え書き

CASHのデータ

さて、ちっともまともに動いてくれないツール群の中で唯一走りきったっぽいCASHのデータを紐解いてみよう。

こんな感じにexcelでも表示できる出力がtxtでできるので見てみる。左からID、Chr:position、exon numberと並んでいる。続く4カラムがちょっとよくわからず、p値、FDRで右端がASの種類。
全部で23531個のASイベントを検出しているが当然pvalueやFDRで絞る必要があるだろう。
p<0.05で絞るなら1657イベント、FDR<0.01なら201まで絞られる。
201のうち8個がA3SS,14個がA5SS、17個がAltEnd、25個がAltStart、111個がcassette、15個がcassette multi、5個がIR、6個がMXEとなる。


例えば一番下のROMO1はA3SSタイプなので

こんな感じに3’のスプライスパターンに違いがある

ASが10:0で起こっていればリードカウントを見れば違いはすぐわかるわけだが、実際は割合が変化するだけだったりする。
そうするとカバレッジだけではASの有無を判断できず、junctionをまたいだリードを見る必要性が出てくる。その手の検出をこのツールはやっているわけだね。

とりあえずこのツールは使えそうだ。

IGVでsashimi plotなるツールが使える。
これを使うと、ASが実際にどういう頻度(割合)で起こっているのかを確認できる。

上のROMO1ではcontrolでは1/4程が短いexonになっているが、knockdownではそれがおこらなくなっているらしい。