kuroの覚え書き

96の個人的覚え書き

Pythonで統計解析

やはりRとはなかなか仲良くなれないな。

といってPythonでサラサラ~っとコードを書けるのかというと、結局は本と検索でどうにかやっているわけだが。
紙媒体の本はとりあえず大まかな感じを掴むのに向いている。
というわけで参考にしている本を並べてみる。

pythonの入門書は書店の棚に溢れんばかりになっているが、まあなんでもいいように思うな。とりあえず本のとおりにコードを書くよいうよりは検索で出てきたコードを解読する参考にする感じである。

実践力を身につける Pythonの教科書

実践力を身につける Pythonの教科書

  • 作者:クジラ飛行机
  • 発売日: 2016/10/26
  • メディア: 単行本(ソフトカバー)
これとか、かなり前に買ったけど、これで一通りは十分役立っている。一通り読んだあとは索引を頼りにコード書くときの参考にしている。もうちょっと索引が充実してるといいのだけれど。まあネットで検索、キーワードを集めて索引から該当するページを見る、という使い方が多い。

統計処理は機械学習ともつながっているので機械学習の入門書から入るのもいいけど。最近は機械学習というより深層学習が流行りでそればっかり、という感じであるが、本来深層学習は機械学習の一部の手法だろうから、まずは機械学習、というかそれにまつわる統計の使い方からきちんとやったほうが良いのだろうな。

オライリーの本は手順通りになぞっていくのはやりやすいのだが、読み物としての面白さ、というか読みやすさの点ではちょっとね。でもとりあえずこの1冊はおさえておきたいところ。

バイオ系データ解析でよく出てくるPCAや系統樹クラスタリング、発現量ヒートマップなどの入門的にはまずはこれ。

Pythonによるバイオデータ解析入門

Pythonによるバイオデータ解析入門

結局、具体的なコードはネット参照が多いのだけど、コードの書き方は結構人によって違うので、説明がちゃんとされている本もあったほうがいい。