kuroの覚え書き

96の個人的覚え書き

Clusteringしたデータを折れ線グラフとして一気に作成

%matplotlib inline
import matplotlib.pyplot as plt
import pandas as pd
import matplotlib as mpl
color_codes = {1:'#E60012', 2:'#F39800', 3:'#FFF100', 4:'#8FC31F', 5:'#009944', 6:'#009E96', 7:'#00A0E9', 8:'#0068B7', 9:'#1D2088', 10:'#920783', 11:'#E4007F', 0:'#E5004F'}
fig_x=10
fig_y=10
l_wide=0.15
numclusters = [0,1,2]
for num_cluster in numclusters:
    gcolor=color_codes[num_cluster]
    df = pd.read_csv('iris_k.csv', index_col=0)
    df = df[df['kmeans'].isin([num_cluster])]
    df = df.loc[:,['0','1','2','3']]
    df = df.T
    print(num_cluster)
    df.plot(color=gcolor, legend=False, figsize=(fig_x, fig_y), linewidth=l_wide )
    plt.savefig('g'+str(num_cluster)+'.png')

csvから該当箇所をちまちま切り出していては面倒臭すぎるのでpythonで一気にやってもらう。

f:id:k-kuro:20200221093256p:plain
こんな感じにk-meansで3クラスターに分けたirisデータの一部を使用すると
f:id:k-kuro:20200221094022p:plainf:id:k-kuro:20200221094024p:plainf:id:k-kuro:20200221094028p:plain
こんな感じにそれぞれのクラスターの折れ線が描ける。