一馬力のメモ帳

MVSからLinuxまで。基盤屋さんは眠らない

Macで「すもももももももものうち」。MeCab (和布蕪)で形態素解析したい!

毎度。一馬力です。

すもももももももものうち」。

文脈抜きにして意味が分かったあなた。人間ですね?
そして、日本語が得意と見た!素晴らしい。

我が家のMacはだめなんです。「すもももももももものうち」。
これ,分かってくれないんです。

今回は。Macに「すもももももももものうち」を分かってもらうために
形態素解析(文章を意味を持つ最小単位に分け分けする。)してみよう!
というお話。

形態素解析google先生で調べるとMeCabという形態素解析エンジンがあるんです。

MeCab (和布蕪):オープンソース 形態素解析エンジン。
http://taku910.github.io/mecab/taku910.github.io

では早速。我が家のMacにも「すもももももももものうち」分け分けしてもらいましょう!

目次


MeCab (和布蕪)のインストールに必要なもの

MeCabのインストール方法は色々あるようですが
今回はMac用のパッケージマネージャー「Homebrew」を利用してサクッとインストールします。

前提となるソフトウェアは

  • Homebrew : Mac用のパッケージマネージャー
  • Command Line Tools  for Xcode : Homebrewのインストールに必要

の2つです。

前提ソフトウェアのインストール方法

Homebrewのインストール 1周め

HomeBrewのページ(http://brew.sh/index_ja.html)にアクセスして、インストール方法を確認します。

記載の通り

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

コマンドを実行する所からスタートです。

f:id:htbariki:20170109103054p:plain

実行するとスクリプトが動作してインストールが始まります

iMac:~ ichibariki$ /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
==> This script will install:
/usr/local/bin/brew
/usr/local/share/doc/homebrew
/usr/local/share/man/man1/brew.1
/usr/local/share/zsh/site-functions/_brew
/usr/local/etc/bash_completion.d/brew
/usr/local/Homebrew

途中でスクリプトからsudoコマンドを入力するために
パスワードを求められます。

Press RETURN to continue or any other key to abort
==> /usr/bin/sudo /bin/chmod u+rwx /usr/local/bin /usr/local/share /usr/local/share/man /usr/local/share/man/man1
Password: ★パスワードの入力★

さらにスクリプトが進むと
Command Line Tools  for Xcodeスクリプトからインストールしに行きます

==> Searching online for the Command Line Tools
==> /usr/bin/sudo /usr/bin/touch /tmp/.com.apple.dt.CommandLineTools.installondemand.in-progress
==> Installing Command Line Tools (macOS Sierra version 10.12) for Xcode-8.2
==> /usr/bin/sudo /usr/sbin/softwareupdate -i Command\ Line\ Tools\ (macOS\ Sierra\ version\ 10.12)\ for\ Xcode-8.2
Software Update Tool
Copyright 2002-2015 Apple Inc.


Downloading Command Line Tools (macOS Sierra version 10.12) for Xcode
Downloaded Command Line Tools (macOS Sierra version 10.12) for Xcode
Installing Command Line Tools (macOS Sierra version 10.12) for Xcode

Command Line Tools  for Xcodeが導入されていない場合,またはアップデートが必要な場合 スクリプトはここで止まってしまいます。

スクリプトから目を話してデスクトップを確認すると,
下の画像のようにソフトウェアアップデートが起動しています。

Command Line Tools が前提をなりますので、アップデート(インストール)して下さい。
 注意:アップデートは再起動が必要です。
アップデート完了したら再起動も忘れずに!

f:id:htbariki:20170109103058p:plain

Homebrewのインストール 2周め

Command Line Tools のアップデートが完了したら
Homebrewのインストールの2周めです。
先程同様にスクリプトを実行していきます。

スクリプトの実行

iMac:~ ichibariki$ /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
==> This script will install:
/usr/local/bin/brew
/usr/local/share/doc/homebrew
/usr/local/share/man/man1/brew.1
/usr/local/share/zsh/site-functions/_brew
/usr/local/etc/bash_completion.d/brew
/usr/local/Homebrew

sudo実行のためパスワード入力

Press RETURN to continue or any other key to abort
==> /usr/bin/sudo /bin/mkdir -p /Users/ichibariki/Library/Caches/Homebrew
Password: ★パスワード入力

スクリプトが進んで「==> Installation successful!」が表示されれば完了です。

==> Downloading and installing Homebrew...
==> Installation successful!

==> Homebrew has enabled anonymous aggregate user behaviour analytics.
Read the analytics documentation (and how to opt-out) here:
https://git.io/brew-analytics

==> Next steps:
- Run `brew help` to get started
- Further documentation:
https://git.io/brew-docs
iMac:~ ichibariki$

ココまででMeCab導入の前提はクリアです。
ここからはbrewコマンドでサクサクと進んでいきます

MeCab (和布蕪)のインストール

mecab関連のパッケージを探す

ここからが本題のMeCab (和布蕪)インストールとなります。

インストールはbrewコマンドで。
パッケージマネージャーHomebrewにMeCab (和布蕪)を探してみます。

コマンド:brew search mecab

iMac:~ ichibariki$ brew search mecab
mecab                    mecab-ipadic             mecab-jumandic           mecab-ko                 mecab-ko-dic             mecab-unidic
homebrew/php/php53-mecab                          homebrew/php/php55-mecab                          homebrew/php/php70-mecab
homebrew/php/php54-mecab                          homebrew/php/php56-mecab                          homebrew/php/php71-mecab

mecab関連のパッケージが色々と表示されますが,今回は”mecab”をインストールします。

mecabをインストールする

インストールは簡単

コマンド:brew install  mecab

で一発です。

iMac:~ ichibariki$ brew install  mecab
==> Downloading https://homebrew.bintray.com/bottles/mecab-0.996.sierra.bottle.2.tar.gz
######################################################################## 100.0%
==> Pouring mecab-0.996.sierra.bottle.2.tar.gz
==> Using the sandbox
🍺  /usr/local/Cellar/mecab/0.996: 18 files, 4.2M
iMac:~ ichibariki$
iMac:~ ichibariki$
iMac:~ ichibariki$

インストールが完了したので,とりあえず動かすと辞書が無いって怒られる、、、。のです。
急がばまわれです。

iMac:~ ichibariki$ mecab
param.cpp(69) [ifs] no such file or directory: /usr/local/lib/mecab/dic/ipadic/dicrc
iMac:~ ichibariki$

mecab-ipadicのインストール

MeCab (和布蕪)に必要な辞書をインストールしていきます。
パッケージは「mecab-ipadic」です。

コマンド: brew install  mecab-ipadic

iMac:~ ichibariki$ brew install  mecab-ipadic
==> Downloading https://homebrew.bintray.com/bottles/mecab-ipadic-2.7.0-20070801.sierra.bottle.tar.gz
######################################################################## 100.0%
==> Pouring mecab-ipadic-2.7.0-20070801.sierra.bottle.tar.gz
==> Caveats
To enable mecab-ipadic dictionary, add to /usr/local/etc/mecabrc:
  dicdir = /usr/local/lib/mecab/dic/ipadic
==> Summary
🍺  /usr/local/Cellar/mecab-ipadic/2.7.0-20070801: 15 files, 50.6M
iMac:~ ichibariki$
iMac:~ ichibariki$
iMac:~ ichibariki$

これでやっと「すもももももももものうち」を分かってもらえる準備が完了しました。

MeCab (和布蕪)で「すもももももももものうち

さて念願の。Macすもももももももものうちを分け分けして理解してもらいましょう!
mecabコマンドを動かしてみます。

mecabコマンドを入力したら。「すもももももももものうち」。

名詞の「すもも」と「もも」。助詞の「も」。を分けて理解してくれました!
賢くなったねMac君。素晴らしい!!

mecabコマンド終了するときは「Ctrl-D」です。

iMac:~ ichibariki$ mecab
すもももももももものうち
すもも     名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も     助詞,係助詞,*,*,*,*,も,モ,モ
もも     名詞,一般,*,*,*,*,もも,モモ,モモ
も     助詞,係助詞,*,*,*,*,も,モ,モ
もも     名詞,一般,*,*,*,*,もも,モモ,モモ
の     助詞,連体化,*,*,*,*,の,ノ,ノ
うち     名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
iMac:~ ichibariki$

なんとかMeCab (和布蕪)で形態素解析できるようになりました。
日本語って難しい。人間ってすごいですね。

みなさんのMacMeCab (和布蕪)で少し賢くしてみませんか?

試した環境

iMac 21.5インチ MK142J/A 高性能Intel Corei5 1.6GHz 8GB 1TB 高速無線LANIEEE802.11ac/a/b/g/n Bluetooth FaceTimeHDカメラ スピーカー内蔵 省スペース液晶一体型デスクトップパソコン ワイヤレスキーボード・マウス付属

iMac (27-inch, Mid 2010)
macOS Sierra
    システムのバージョン:     macOS 10.12.2 (16C67)
    カーネルのバージョン:     Darwin 16.3.0

iMac:~ ichibariki$ brew -v
    Homebrew 1.1.5
    Homebrew/homebrew-core (git revision 06aa; last commit 2016-12-18)

iMac:~ ichibariki$ mecab -v
    mecab of 0.996