kuroの覚え書き

96の個人的覚え書き

multi FASTA (DNA)からmulti FASTA (Amino Acid)を機械的に作成する

やりたいことは
複数の遺伝子のcDNA情報をまとめて記載したFASTA形式のファイルがあったとして、それをアミノ酸に翻訳し、clustalw等でアライメントを作成する。
cDNA情報はUTRを含んでいたりいなかったりまちまちである。
フレームを3フレームともチェックし、最も長いORFが作れるものを選択。
MetからStopまでを取り出してFASTA形式で保存する。
というもの。
これまで、そういうことをやってくれるウェブサービス
http://shigen.nig.ac.jp/tools/translatorV2/
を利用していたのだが、あろうことかサービスが閉じられてしまった。
研究ツールは公開するならやっぱりソースも公開しておいてほしいなあ。そうすればローカルで使い続けられるのに。

ということで自前でそういう処理をできないか模索中
DNA の翻訳 | Python を利用して DNA をアミノ酸配列に翻訳する方法