Pages

2017/08/14

Windows で MeCab のユーザー辞書をコマンドから作成する

Windows で MeCab のユーザー辞書をコマンドから作成する
MeCab のユーザー辞書を作成する方法です。ユーザー辞書を作成するための CSV を作成し、mecab-dict-index.exe を叩くだけです。MeCab がインストールされている必要があります。


ユーザー辞書用の CSV 作成


単語の追加方法
https://taku910.github.io/mecab/dic.html

以下のフォーマットの CSV を作成します。
エンコードは UTF-8 とします(Excel から出力すると UTF-8 にならないので注意)。

工藤,1223,1223,6058,名詞,固有名詞,人名,名,*,*,くどう,クドウ,クドウ

それぞれの列は、以下のようなフォーマットです。
詳細は単語の追加方法のページに記載されています。

表層形,左文脈ID,右文脈ID,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用形,活用型,原形,読み,発音

バッチファイルを作成

こんな感じのバッチファイルを用意します。
※ CSV の置き場所は適当で良いですが、このサンプルでは「C:\temp」に置いています。
※ MeCab のインストールフォルダは環境により変わります。ここでは「C:\Program Files (x86)」を想定しています。

echo on

cd "C:\Program Files (x86)\MeCab\bin"
mecab-dict-index.exe -d "C:\Program Files (x86)\MeCab\dic\ipadic" -u user.dic -f utf-8 -t utf-8 C:\temp\user.csv
move user.dic "C:\temp\"

pause

C:\temp フォルダに、user.dic が作られます。
Related Posts Plugin for WordPress, Blogger...