kuroの覚え書き

96の個人的覚え書き

cummeRbundによるクラスター解析

以前に一通り試したクラスタリングを実際にやってみた。
忘れていたことも含めて覚書

> library("cummeRbund")    #ライブラリ読み込み
> cuff <- readCufflinks("cuffdiff_resultsのディレクトリ")    #cuffdiffの出力ディレクトリからデータを読み込み)
> setwd("~/")    #ワーキングディレクトリを設定
> my.genes <- Genes(cuff)
> mySigGeneIDs <- getSig(cuff,alpha=0.05,level="genes")    #p value<0.05のものを抽出。数が多い時はもっと絞ってみる。
> mySigGenes <- getGenes(cuff, mySigGeneIDs)
> ic <- csCluster(mySigGenes, k=8)    #8つのクラスタに分類
> icp <- csClusterPlot(ic)   #plotを作成
> icp    #plotを描画ー>pdf等で保存しておく
> old.op <- options(max.print=999999)    #textの出力リミットを外す
> sink("~/ic.txt")    #出力先を指定
> ic
> sink()

mySigGenesが多すぎるとクラスタリングに時間が掛かるし、結果もぼやける。結局上位の候補だけを解析することになるので、最初の抽出で数を絞るべきだ。
どうしても数が多いとき、icの結果を表示するとgetOption("max.print")を超えたぶんは表示されないし、データとして出力もできないので、old.op <- options(max.print=999999)でリミットをいっぱいまで上げてから出力する。

出力結果から該当するクラスタのメンバーをコピーしてexcel等で処理する。