kuroの覚え書き

96の個人的覚え書き

BLASTとの連携

生物種間で発現を比較しようとすると、アノテーションデータベースで橋渡ししてデータを見るということになるわけだが、アノテーションにはどうしても限界がある。
例えば生物Aで発現変動が見られた遺伝子について、生物Bでの発現を見る分にはアノテーションされた遺伝子を頼りに検索すれば良いのだが、更にC種での発現変動を調べたいとして、AからCへのアノテーションが構築されてなくて、CからBのアノテーションしかなかった場合、Bを経由した検索ではCでの発現データにはたどり着けないことが往々にして起こる。
Aの遺伝子aのアノテーションがBの遺伝子aだったとして、一次配列を元にCの配列にBLAST検索をかけてhitするCの遺伝子は遺伝子aなのに、Cの遺伝子aのアノテーションはBの遺伝子a'となっていて、一致しないわけだ。

確かにCの遺伝子aの一次配列でBの配列にBLAST検索をかけるとa'がトップヒットし、2番めにaがヒットしていたりするので、アノテーションが間違っていた、というわけではないのだ。

ややこしい。

やはりデータベースからBのアノテーションではなく直接BLAST検索結果で繋いでやらないと、この作業は正確に実施できないのだな。

データベースを拡張してBLASTサーバも自前で立ち上げる必要があるのだろうか。

それともC→A間のアノテーションを独自に構築するほうが簡単だろうか。