kuroの覚え書き

96の個人的覚え書き

science

bowtie2-RSEM

bowtie2によるローカルアライメントを使い、Poly-Tプライマーで作成したcDNAライブラリのRNA-seq解析を行う。まずはbowtie2をインストールする。 $ git clone https://github.com/BenLangmead/bowtie2.git $ cd bowtie2/ $ make $ sudo make install次にリフ…

RSEMのインストール

今更ですが。これまでメインにはStringTieを発現解析に使っていたが、RSEMも使ってみようと。現状miniconda3の上に環境構築をしているので、 $ conda install rsemとしてみる。その結果、 $ which rsem-calculate-expression ~/miniconda3/envs/ngs/bin/rsem…

RNA-seqデータをde novo アッセンブリーしてUTR配列を含むトランスクリプトアノテーションを作成する。

前提:ゲノム配列の詳細な解析は実施されている。遺伝子予測はCDS領域に限定して実施されている。 やりたいこと:5’3’UTRがどこまでか推測し、cDNA領域のアノテーションを作る。1. Trinityでde novoアセンブリを実行: Trinityを使用してRNA-seqデータからde…

fastp

fastp: an ultra-fast all-in-one FASTQ preprocessor version 0.23.2 usage: fastp [options] ... options: -i, --in1 read1 input file name (string [=]) -o, --out1 read1 output file name (string [=]) -I, --in2 read2 input file name (string [=]) …

おんどとりをwindows以外でどうにかするための調査

別途公開の通信プロトコルを使用し、お客様ご自身でソフトウェアを作成していただければシリアル通信が可能となります。その場合、オプションのシリアル通信ケーブル( T R - 0 7 C )が 必 要 で す 。 と取説には書かれているが、どこにも公開されている感じ…

Rのベンチマーク

#パッケージのインストール install.packages("devtools") devtools::install_github("csgillespie/benchmarkme")注:色々とエラーが出て、それを一つずつ潰していく必要がある。 あまりに色々やったのでなにがクリティカルだったのかわからん。 Ubuntuの情…

INGOR.1.0.0

理研の玉田さんのSiGN-BNによるベイジアンネットワーク解析を利用させてもらっている。データサンプルとしてRNA-seqデータを投入しているのだが、久々にやり直してみようと思ったらうまく動かない。 実行履歴をもとに同じコマンドを投げても動かないのだ。ど…

PythonでGO解析

これまでGO解析はDAVIDを使ってきた。特に理由はないが、まあ老舗だし。しかしインターフェースがあんまり使いやすいとは言い難く、植物のデータベースもシロイヌナズナにしか対応していない。ということでAgriGOとか他のサービスを利用してもいいのだけれど…

nがばらばらのときのTukey

多重比較検定としてTukeyをよく使う。 一応Tukey-HSDとしてpythonのwebアプリを作って使っているのだが、どうも比較する各項目のnが同じでないとちゃんと検定が働かないようだった。もともとのTukeyの検定ではnが揃っていないとだめなんだが、statmodelsモ…

Macにnode.jsを入れてJbrowse2 webを動かす

これまでIGVをゲノムブラウザに使ってきたが、見た目がなんとなくショボいので、ハッタリのJBrowse2を入れるぜ、でもあんまり基本環境は汚したくないよ。ってことで今どきならDockerなんだろうけど、まあ、とりあえず原始的に外付けHDDに仕込んでみる。まず…

Pythonでベン図

いろいろな条件で遺伝子発現パターンを調べ、各条件に共通した因子を探るときなど、よくベン図を使う。2条件、3条件などのかんたんなものから、単純な円で表現できなくなる4条件以上など。 これを今まで、excelで並べて処理していたんだけど、超面倒くさい。…

Circosをインタラクティブに作成するShinyCircos

ゲノム解析論文でよく見かけるCircosなんだが、どうやって描いているのか調べると Requirements // CIRCOS Circular Genome Data Visualization こちらで配布されているアプリを使うらしいことがわかった。しかしこのアプリとっつきにくい。まあconfigをテキ…

Ubuntu20.04にしておく

やはり22.04はちょっとまだ心配なので、実績のある20.04でひとまず構築してみることにする。Ubuntuのインストールからディスクのマウントなどは特に違いはない。Nvidia RTX3060がちゃんと認識されているのか $ lspci | grep -i nvidia 01:00.0 VGA compatibl…

AlphaFold2.2.0をUbuntu22.04に構築したい

$ lspci | grep -i nvidia 01:00.0 VGA compatible controller: NVIDIA Corporation GA106 [GeForce RTX 3060 Lite Hash Rate] (rev a1) 01:00.1 Audio device: NVIDIA Corporation Device 228e (rev a1) $ uname -m && cat /etc/*release x86_64 DISTRIB_ID…

CentOS7にpyenv-virtualenvを噛ましてAnacondaを入れてETE3toolkitをインストールする

なんともややこしいが禁断のAnacondaをCentOS7に入れてみる。 とにかくメインのサービスの邪魔をしないように厳重に環境を切り分けておく必要がある。 単純なPythonの環境切り分けなら、venvが今風なんだろうけど、混ぜるな危険のcondaなのでちょっと面倒だ…

Phylogenetic treeを描くためのツールを自分で集める

大方のソフトウェアはバイナリを実行権限つけて/usr/local/bin/におく コンパイルが必要なものは適宜コンパイルしてやはり/usr/local/bin/におくclustalo: Clustal omega ClustalWより新しいアライメントソフトウェア www.clustal.org Mac用のバイナリがダウ…

coreserverにNode.jsを入れてJbrowseを使いたい

まずNode.jsがCoreserverで使えるのか? 標準状態ではインストールされていないし、root権限がないので通常のインストールもできない。いろいろ調べてみると、nvm (Node Version Manager )を介するとユーザーごとにユーザー権限でインストールし、シェルごと…

ETE Toolkitで系統解析

ClustalWはお手軽にアライメントをとって系統樹を描くことが出来る。 しかしClustalWで出力されるdndファイルを使った系統樹は近年、系統樹としてはあまり信頼をされない。 ClustalWで実施される解析は近隣結合法(Neighbor joining method)で、計算量は極…

somocluで自己組織マッピング その2

というわけで定番Irisでやってみよう。 import numpy as np import matplotlib.pyplot as plt import somoclu import pandas as pd %matplotlib inline from sklearn.datasets import load_iris iris = load_iris() X = iris.data Y = iris.target n_rows, n…

somocluで自己組織マッピング

Self Organized Mappingをpythonでやりたくてsomocluをインストールしてみた。まずはMacに入れてみると、 Python 3.9.6 (default, Jun 29 2021, 06:20:32) [Clang 12.0.0 (clang-1200.0.32.29)] on darwin Type "help", "copyright", "credits" or "license"…

ペプチドをコードするDNAを網羅的に探す。

例えばCLE25ペプチドはArg-Lys-Val-Pro-Asn-Gly-Pro-Asp-Ile-His-Asnからなるが(実際は246bpの前駆体がまず転写され翻訳されるのだが)、このペプチドがどんなゲノムDNA配列から転写翻訳されたかを考えたい。 Arg:CGT/CGC/CGA/CGG/AGA/AGG Lys:AAA/AAG Val:…

Dockerのコンテナをイメージに書き出して別のJetson Nanoに環境を移す

ここまでJetson Nano 2GBでDocker上にPython3環境を作ってきたが、32GBのSDカードだったためちょいと手狭になってきた。 JetsonNano B01のほうは128GBだったので一旦こっちに環境を移して続きの開発を行いたい。ということでDocker-composeで構築したコンテ…

Rspberry piにnumpy

Raspberry piにpipでnumpyを入れようとしたら動かなかった。これまたARMに対応してないらしいね。対応策としては $ sudo apt install python3-numpyと直接インストールするといいらしい。 一旦 $ python3 -m pip uninstall numpyとしてやってからインストー…

Raspberry piにBlastとSamtoolsをインストール

XREAがいまいち融通がきかない。ちょっと規模の大きいFlaskサイトを動かそうとすると負荷がかかりすぎるのか強制終了されてしまい、サーバエラーを返されてしまう。 一旦XREAはペンディングとし、自宅ネットにRaspberry piでwebアプリ設置テストをすることに…

AlphaFold2.1.0登場

さて、Alphafold2の公開から4ヶ月ほど経ったが、その間に出てきた多量体解析のアイデアなどを取り込んでver2.1がアップされた。 GoogleColabの方ではいち早くバージョンアップがされていたわけだが、gitの本体の方も正式に対応したということか。アップグレ…

AlphaFold2 総括

一部業界で話題沸騰のAlphaFold2だが、ソースの公開から一月ちょっと遅れで、ようやく自前サーバで解析できる環境を構築した。要求スペック 2.5TB以上のSSD/HDD容量 (必須、SSD推奨) CUDA11に対応しているNVIDIA製GPU(推奨) 大容量(32GB以上)のRAM(推奨…

AlphaFold2のその後2.2

いろいろわけがわからなくなってきている(特にPython絡み)ので、一旦minicondaもbrewで入れたpython3もアンインストールした。(minicondaは~/miniconda3にインストールされているのでフォルダまるごとrm -rf) (python3は $brew uninstall python3したあ…

AlphaFold2のその後2.1

前回、どうもTensorflowのバージョンがなんかコンフリクトしているっぽく、自前で環境インストールしたのがまずかったのかも、と思ったので、一旦Dockerに戻ってみた。Docker自体にエラーの原因はないと思うし、Dockerの中ならバージョンが合わないというこ…

AlphaFold2のその後2

何が問題なのか一つわかった。 WARNING: Ignoring invalid symbol '*' at pos. 492 in line 2 of /tmp/tmp2hwa2yuo/query.a3mこれだ。 なんとなく自分の持っているアミノ酸データでFASTAファイルを自分で作って投げていたわけだが ストップコドンのところの…

pymolでタンパク質立体構造を見る

AlphaFold2の登場でにわかに活気づいたタンパク質構造化学の分野でデファクトスタンダードとも言える分子ビューワといえばpymolなわけだが、普通にネット検索して出てくるのは pymol.org なのだ。 しかしこのソフトウェアはライセンスがいる。有料だ。 我々…