Windows で MeCab のユーザー辞書をコマンドから作成する

Windows で MeCab のユーザー辞書をコマンドから作成する
MeCab のユーザー辞書を作成する方法です。ユーザー辞書を作成するための CSV を作成し、mecab-dict-index.exe を叩くだけです。MeCab がインストールされている必要があります。


ユーザー辞書用の CSV 作成


単語の追加方法
https://taku910.github.io/mecab/dic.html

以下のフォーマットの CSV を作成します。
エンコードは UTF-8 とします(Excel から出力すると UTF-8 にならないので注意)。

工藤,1223,1223,6058,名詞,固有名詞,人名,名,*,*,くどう,クドウ,クドウ

それぞれの列は、以下のようなフォーマットです。
詳細は単語の追加方法のページに記載されています。

表層形,左文脈ID,右文脈ID,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用形,活用型,原形,読み,発音

バッチファイルを作成

こんな感じのバッチファイルを用意します。
※ CSV の置き場所は適当で良いですが、このサンプルでは「C:\temp」に置いています。
※ MeCab のインストールフォルダは環境により変わります。ここでは「C:\Program Files (x86)」を想定しています。

echo on

cd "C:\Program Files (x86)\MeCab\bin"
mecab-dict-index.exe -d "C:\Program Files (x86)\MeCab\dic\ipadic" -u user.dic -f utf-8 -t utf-8 C:\temp\user.csv
move user.dic "C:\temp\"

pause

C:\temp フォルダに、user.dic が作られます。

このブログの人気の投稿

コピーした行の挿入が表示されない時はフィルタされていないかチェック

Excel で一部の図形だけ固定する