AlphaFold2の衝撃

とりあえず試してみておかないと。qiita.comただ、GPUがまともなものがない。試してみた環境は以下の通り CPU: Xeon E3-1230V6 Memory: 64GB Storage: 2GB(2GB x2 RAID1) + 8TB(4TBx2 RAID0) GPU: GeForce GT710(1M)まずは何も考えずにランしてみると $ pyth…

2021-07-17

local blastをグラフィカルに

Programing Python science

モデル植物としてはゲノムデータがあまり完璧でない植物を研究対象にしているためBlast検索も外部データベースサイトに頼らず自分でシークエンスデータをあちこちから集めてきて自分仕様のBlastサーバを立てている。これまでのところ、まあ自分で見るだけだ…

2021-04-03

jExcelでスプレッドシートをwebアプリに仕込む（完成）

Javascript Programing Python science Flask

最終的にここに落ち着いた。 {% extends "base.html" %} {% import "bootstrap/wtf.html" as wtf %} {% block title %}Freezer list{% endblock %} {% block head %} {{ super() }} <link rel="stylesheet" href="https://bossanova.uk/jspreadsheet/v4/jexcel.css" type="text/css" /> </link>

2021-04-01

jExcelでスプレッドシートをwebアプリに仕込む

Programing science Javascript Python Flask

以前チョロっと眺めていたjExcelを使ってウェブアプリに冷凍庫管理表を作ってみる。 javascriptなのでじつはあまり得意ではない。しかし使い方は結構簡単そうだ。（実は実用するには結構ハードルが高いことは後でわかる）設置方法は基本HTMLファイルにjava…

2021-03-17

タンパク質立体構造の予測

science

すでに解かれているタンパク質モデルをお手本に別の似たタンパク質の立体構造を予測してみる。UCSF Chimeraでできるらしいのだが、このソフトウェアは色々できることがありすぎて、逆に使い方がわかりにくい。そこで、そもそもChimeraも内部で使っているら…

2021-01-26

グラフの要素を平均やボックスプロットに重ねる

Python Programing science

以前より作っていたグラフ描画用ウェブアプリをバージョンアップしてつかいやすくした。ボックスプロットやバーグラフに各要素点をかんたんに重ねることが可能になった。これでNatureにも投稿し放題だね。いよいよExcelは必須ではなくなってきたな。

2021-01-25

pandasで読み込んだデータフレームからかんたんにグラフを作る

Programing Python science

例えばStudent's T testをやるついでにグラフも描いとこうというような場合。 import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv("./ttest.txt") des = df.describe() print(des) # plt.figure() des[des.index=='mean'].T.plot.bar(ye…

2020-11-30

まっさらなOSXが手に入ったから、一から環境構築をしてやる

Mac Python science

先日MacBook Airを新たに導入したわけで、とりあえず書き物用としてOfficeはインストール済みである。で、しばらく使ってきたわけだが、一昔前のサーバに引けを取らないパワーがありそうなんで、やはり開発環境やデータ解析環境なんかも入れておこうかなと…

2020-11-22

Pythonで統計解析

Programing Python science

やはりRとはなかなか仲良くなれないな。といってPythonでサラサラ～っとコードを書けるのかというと、結局は本と検索でどうにかやっているわけだが。紙媒体の本はとりあえず大まかな感じを掴むのに向いている。というわけで参考にしている本を並べてみる。…

2020-10-25

画像をカタログ化して共有する

Programing science Python

顕微鏡の画像データが蓄積してきているが、いまいち整理されてなくて、バラバラにCD-Rとかに保存されているので一元管理したい。できればサムネイル付きでカタログ化しておいて、目的の画像をパラパラっと見つけ出せるようであればなお良い。ということでま…

2020-09-02

sequence alignmentをBokehを使ってインタラクティブに表示してみる

Programing Python science

clustalwでsequenceのアライメントをとると、テキストで.alnというファイルが生成されるが、文字の並びとアスタリスクではわかりにくいことが多い。なのでclustalxだとかMEGAだとかで表示するとカラフルに色分けで表示できるのでぱっと直感的に分かるのだが…

2020-08-27

ImageJのマクロをpythonで動かす

Programing Python science

1000枚以上あるようなTIFF画像にImageJで一律の処理を行いたい。とてもじゃないが手ではやってられないのでマクロを使って自動運転する。 File＞New>Text Window を開き、次のようなスクリプトを作成して、Runする。 from ij import IJ from ij.io import D…

2020-08-18

ベイジアンネットワーク解析で遺伝子発現の制御関係を網羅的に調べたい

Python science

マイクロアレイや、次世代シークエンサーによる発現データセットが大量にあると、すべての遺伝子同士の制御関係（上下関係）が描けるかもしれない。ということで方法を模索するとネットワーク解析というものに行き着く。ところが、世の中に出ている遺伝子発…

2020-08-17

正規分布しているかの検定

Python science

例によってwebアプリ拡張。統計処理をするにあたって、データが正規分布しているかどうかによってその後の処理が分岐する事が多い。なので、まずは正規分布かどうかを確定させる必要がある。 Shapiro-Wilk testで判定。Q–Q plot, quantile-quantile plotも…

2020-08-06

SiGN-SSMをソースからコンパイル

CentOS7 science

Linux版バイナリとして配布されているSiGN-SSMはrel 1.0.2. Multi-thread supported, MPI support not enabledだった。だからMPIを指定するとマルチスレッドも働かず激遅になったんだな。あと You can also use signssm to do this (rel 1.10.0 or later):…

2020-08-05

SiGN-SSM

CentOS7 Mac science

ネットワーク解析がしたいと思い環境構築。結構手こずったので（いつもながら）メモ。まずはHGCからダウンロード。 MacOSバイナリーとLinuxバイナリーを両方ダウンロードしてみる。Linux版は解凍して $ make INSTALLDIR=適当な場所 installでインストール。…

2020-07-27

マルチスレッドでblast

science

blast+の場合 $ tblastx -query sample.fasta -db transcript_db -num_threads 12 > result.txtのような感じ。

2020-06-29

SRAToolkit

CentOS7 science

公開されているSRAファイルをダウンロードして再解析がしたいとき、データのダウンロードが結構面倒なので（サイトの構造が複雑すぎてなかなかファイル本体にたどり着けない）専用のツールを利用したい。とおもってインストールをbrewからやってみた。 $ br…

2020-06-23

cDNA FASTAファイルから最長ORFを抽出し、5'UTR/CDS/3'UTRに分割してそれぞれのFASTAファイルを作成する(改訂版）

Programing Python science

#DNA FASTAファイルから最長のORFを抽出し５UTR,CDS,３UTRに分割して保存する。 import sys, os, re from Bio import SeqIO from Bio.Alphabet import IUPAC from Bio.Seq import Seq fasta_file = sys.argv[1] faname = os.path.basename(fasta_file) fdir …

2020-06-10

seqkitでfastaファイルから一部を取り出す

Programing science

multi fastaファイルから一部の遺伝子だけ取り出したサブfastaファイルを作るには samtools faidx TAIR10_cDNA.fasta AT1G01010.1 AT1G01020.1 AT1G01030.1 AT1G01040.1 AT1G01050.1 > subset.fastaのようにsamtoolsを使えばいいのだけれど、fastaファイルが…

2020-05-23

DataTablesの表にチェックボックスをつけて選択した内容から次のアクションを起こす

Javascript science Programing

まず、DataTablesで表をweb上に表示できていることが前提。いろいろなプラグインがあるのだけれど、ほぼ標準的に使われているButtonsに加え、Selectプラグインも入れておく。 <script type="text/javascript" src="{{ url_for('static', filename='js/datatables.min.js') }}"></script> <script type="text/javascript" src="{{ url_for('static', filename='js/dataTables.select.min.js') }}">…

2020-05-14

RNAmotifのコンパイル(OSX)

science

config.hは以下のようになっている。 # Edit the configuration variables below to match your system. The default # values given here should work on GNU/Linux systems. CC= gcc CFLAGS= -O2 -Wall # Notes: clang can replace gcc above; # for icc (…

2020-05-13

xgboostのインストール

Programing science

前回xgboostのインストールがすんなりいかなくて色々回り道をしたが、ちゃんとエラーの内容を紐解けば正しいやり方がわかったろうに、ということでやり直し。まず、一旦戻ってpip3のところから。 $ pip3 list WARNING: pip is being invoked by an old scrip…

2020-05-02

教師なし機械学習

CentOS7 science

deep learningの本を読めば読むほどに自分のやりたいことが教師あり深層学習ではできないんじゃないかと思い始めた。結局正解、不正解が明確に判定できる例が多数ないと、その特徴を抽出する学習が機能しないわけだが、世の中そんなに白黒はっきりした例が揃…

2020-02-20

Clusteringしたデータを折れ線グラフとして一気に作成

CentOS7 Programing science

%matplotlib inline import matplotlib.pyplot as plt import pandas as pd import matplotlib as mpl color_codes = {1:'#E60012', 2:'#F39800', 3:'#FFF100', 4:'#8FC31F', 5:'#009944', 6:'#009E96', 7:'#00A0E9', 8:'#0068B7', 9:'#1D2088', 10:'#920783…