kuroの覚え書き

96の個人的覚え書き

リストに載っているものを含む行を抽出する

https://www.dbonline.jp/sqlite/select/index5.html


excelで重複を除く
https://support.office.com/ja-jp/article/重複しない値を抽出する、または重複する値を削除する-ccf664b0-81d6-449b-bbe1-8daaec1e83c2


まあリストに重複があってもupdateにちょっと時間を食うだけで、結果には影響しないから、変な操作入れない方がいいな。

健常者のvcfからhomo mutationを抽出し、その遺伝子にnon-pathogenicのフラグを立てる。
ただし、homoでもsynonymous snvやnon-synonymous snvだとnon-pathogenicとは断定できない。
synonymous mutationだけど、同じ遺伝子内にstopgain homo mutationなどがあったなら、やはりその遺伝子はnon-pathogenicと言えるだろう。
なのでhomo mutationからsynonymous snv等のvariantを除外し、残ったvariantの遺伝子名でフラグを立てると良いだろう。

exonicも加味すべきかな?
いやいやstopgain, stoploss, frameshiftを選んでいる時点でexonicに限定されているはずだな。
むしろジャンクションのmutationを追加すべきか?