kuroの覚え書き

96の個人的覚え書き

ことえりの強化



ことえりの辞書を強化しようと単語登録を行った。

一括登録の仕方はテキストファイルに

よみがな,変換されるもの,品詞

の順で1行に1単語のファイルを作る。エクセルで作ってcsv形式で保存するのが手っ取り早い。ファイルの拡張子は.txtにしておくこと。ことえりの単語登録/辞書編集をメニューから呼び出し、「辞書」メニューから「テキストや辞書から読み込む...」を選び、先ほどのテキストファイルを指定する。これでOK。

品詞は単語登録ウィンドウに出ている8種類しか指定できないと思うので、最初にエクセルで作成するときに適当に振り分けておいた方がよいだろう。

なお今回作成したユーザ辞書は

http://homepage2.nifty.com/baba_hajime/free-dic/

ここに多数収録されている辞書のうち

http://www.remus.dti.ne.jp/~endo-h/wnn/

に上げられているwnn用の辞書セットからテキストデータのみ抜き出して作成させてもらった。

pubdic+-wnnに含まれている.uという拡張子のものがテキストデータ(スペース区切り)。まずこれをいったんmiで開き、文字コードをShift JISに直した。次に品詞部分をエクセルで適当に置換し、csv形式で保存(拡張子は.txtにする)。これを辞書に読み込ませた。だいぶ賢くなったように思われる。

なお、職業がら生命科学分野の文章を書くことが多いのでLSDプロジェクト(http://lsd.pharm.kyoto-u.ac.jp/ja/)からも同様にテキストファイルを取得してきて辞書を作った。試薬等のカタカナを結構すんなり変換してくれるのでよい。