読者です 読者をやめる 読者になる 読者になる

一馬力のメモ帳

MVSからLinuxまで。基盤屋さんは眠らない

コマンド一発で「MeCab (和布蕪)用の辞書(dicdir)ってどこに保存したっけ?」を調べる方法

### 広告 ###

毎度。一馬力です。

無事MacMeCab (和布蕪)をインストールする事が出来て

ichibariki.hatenablog.com

すもももももももものうち」って形態素解析していたのですが
MeCab (和布蕪)の辞書ってどこに保存されているんだ?っと気になって調べたのでメモメモ

 MeCab (和布蕪)も辞書もbrewコマンドでサクッとインストールしたので  インストールパスなど導入時には気にしていませんでした。

目次


MeCab (和布蕪)のパラメータをダンプするコマンド

MeCab (和布蕪)のパラメータを全て表示したい場合は

コマンド:mecab -P

iMac:~ ichibariki$ mecab -P
bos-feature: BOS/EOS,*,*,*,*,*,*,*,*
bos-format:
config-charset: EUC-JP
cost-factor: 700
dicdir: /usr/local/lib/mecab/dic/ipadic
dump-config: 1
eon-format:
eos-format: EOS\n
eos-format-chasen: EOS\n
eos-format-chasen2: EOS\n
eos-format-simple: EOS\n
eos-format-yomi: \n
eval-size: 8
lattice-level: 0
max-grouping-size: 24
nbest: 1
node-format: %m\t%H\n
node-format-chasen: %m\t%f[7]\t%f[6]\t%F-[0,1,2,3]\t%f[4]\t%f[5]\n
node-format-chasen2: %M\t%f[7]\t%f[6]\t%F-[0,1,2,3]\t%f[4]\t%f[5]\n
node-format-simple: %m\t%F-[0,1,2,3]\n
node-format-yomi: %pS%f[7]
theta: 0.75
unk-eval-size: 4
unk-format: %m\t%H\n
unk-format-chasen: %m\t%m\t%m\t%F-[0,1,2,3]\t\t\n
unk-format-chasen2: %M\t%m\t%m\t%F-[0,1,2,3]\t\t\n
unk-format-yomi: %M
iMac:~ ichibariki$

MeCabユーザー辞書の場所を調べる

MeCab (和布蕪)のユーザー辞書の場所だけ確認できればOKであれば

コマンド:mecab -P|grep ^dicdir

iMac:~ ichibariki$ mecab -P|grep ^dicdir
dicdir: /usr/local/lib/mecab/dic/ipadic
iMac:~ ichibariki$

MeCabのヘルプ

参考までに,MeCab (和布蕪)のヘルプを表示するためには

コマンド:mecab -h

iMac:~ ichibariki$ mecab -h
MeCab: Yet Another Part-of-Speech and Morphological Analyzer

Copyright(C) 2001-2012 Taku Kudo
Copyright(C) 2004-2008 Nippon Telegraph and Telephone Corporation

Usage: mecab [options] files
-r, --rcfile=FILE              use FILE as resource file
-d, --dicdir=DIR               set DIR  as a system dicdir
-u, --userdic=FILE             use FILE as a user dictionary
-l, --lattice-level=INT        lattice information level (DEPRECATED)
-D, --dictionary-info          show dictionary information and exit
-O, --output-format-type=TYPE  set output format type (wakati,none,...)
-a, --all-morphs               output all morphs(default false)
-N, --nbest=INT                output N best results (default 1)
-p, --partial                  partial parsing mode (default false)
-m, --marginal                 output marginal probability (default false)
-M, --max-grouping-size=INT    maximum grouping size for unknown words (default 24)
-F, --node-format=STR          use STR as the user-defined node format
-U, --unk-format=STR           use STR as the user-defined unknown node format
-B, --bos-format=STR           use STR as the user-defined beginning-of-sentence format
-E, --eos-format=STR           use STR as the user-defined end-of-sentence format
-S, --eon-format=STR           use STR as the user-defined end-of-NBest format
-x, --unk-feature=STR          use STR as the feature for unknown word
-b, --input-buffer-size=INT    set input buffer size (default 8192)
-P, --dump-config              dump MeCab parameters
-C, --allocate-sentence        allocate new memory for input sentence
-t, --theta=FLOAT              set temparature parameter theta (default 0.75)
-c, --cost-factor=INT          set cost factor (default 700)
-o, --output=FILE              set the output file name
-v, --version                  show the version and exit.
-h, --help                     show this help and exit.

試した環境

iMac 21.5インチ MK142J/A 高性能Intel Corei5 1.6GHz 8GB 1TB 高速無線LANIEEE802.11ac/a/b/g/n Bluetooth FaceTimeHDカメラ スピーカー内蔵 省スペース液晶一体型デスクトップパソコン ワイヤレスキーボード・マウス付属

iMac (27-inch, Mid 2010)
macOS Sierra
    システムのバージョン:     macOS 10.12.2 (16C67)
    カーネルのバージョン:     Darwin 16.3.0
iMac:~ ichibariki$ mecab -v
    mecab of 0.996