kuroの覚え書き

96の個人的覚え書き

統計的検定をpythonで行う〜Student's T test編

統計計算をexcel以外でやる。よく使われるのはRなんだがRはいまいち知らないので、pythonでやれないものかと。まあやれるでしょう。いつものようによく使う機能はまとめてWEBアプリにしてやろう。

f:id:k-kuro:20191231151443p:plain
このグラフデータについてexcelpythonの比較をしてみる。

f:id:k-kuro:20191231151616p:plain
AのJA 20 μMのT検定結果はp value = 0.015736074となっている。

これをpythonでやてみる。

$ python3
Python 3.6.5 (default, Apr 25 2018, 14:26:36) 
[GCC 4.2.1 Compatible Apple LLVM 9.0.0 (clang-900.0.39.2)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import numpy as np
>>> from scipy import stats
>>> a = np.array([12,11,12,10,8])
>>> b = np.array([19,14,19,16,11])
>>> stats.ttest_ind(a,b,equal_var = True)
Ttest_indResult(statistic=-3.0535451414764587, pvalue=0.01573607368058338)

このようにちゃんと一致する。
なお等分散性を仮定(equal_var = True)している。

f:id:k-kuro:20191231172547p:plain
一応アプリにしたけど愛想なさすぎる?

f:id:k-kuro:20191231185818p:plain
一応これでよさげ。

参考ページ
pandasでcsv/tsvファイル読み込み(read_csv, read_table) | note.nkmk.me