MeCabのラッパーであるmecab-python3のインストール

MeCabのラッパーであるmecab-python3のインストール プログラミング

「手っ取り早くMeCabを利用したい」
「WindowsにMeCabをインストールするのが困難」
「mecab-python3に依存するライブラリを利用する必要がある」

この記事は、上記の場合に役立つ内容となっています。

本記事の内容

  • mecab-python3とは?
  • mecab-python3のシステム要件
  • mecab-python3のインストール
  • mecab-python3の動作確認

それでは、上記に沿って解説していきます。

mecab-python3とは?

mecab-python3は、MeCabのラッパーです。
形態素解析を簡単に動かしたい場合、mecab-python3が役に立ちます。

Linux・macOSなら、MeCabは簡単に動きます。
しかし、Windowsの場合はそうではありません。

その様子は、次の記事をご覧ください。

WindowsへのMeCabのインストールは、それなりに知識が必要となります。
初心者では、少し厳しいかもしれません。

ただ、勘違いはしないようにしてください。
mecab-python3によるインストールは、MeCabのOSへのインストールではありません。

そのため、コマンドツールとしてMeCabを利用することはできません。
あくまで、mecab-python3を経由してMecabを利用するだけです。
詳細は、後述の「mecab-python3のインストール」でわかると思います。

しかし、Pythonで形態素解析は問題なく可能となります。
それも、本当に簡単にそれが可能なのです。

それだけでも、mecab-python3を利用する価値はあります。

以上、mecab-python3について説明しました。
次は、mecab-python3のシステム要件を確認します。

mecab-python3のシステム要件

現時点(2021年8月)でのmecab-python3の最新バージョンは、1.0.4となります。
この最新バージョンは、2021年6月23日にリリースされています。

サポートOSに関しては、以下を含むクロスプラットフォーム対応です。

  • Windows
  • macOS
  • Linux

そして、サポート対象となるPythonのバージョンは以下。

  • Python 3.6
  • Python 3.7
  • Python 3.8
  • Python 3.9

以下は、Pythonの公式開発サイクルとなります。

バージョンリリース日サポート期限
3.62016年12月23日2021年12月
3.72018年6月27日2023年6月
3.82019年10月14日2024年10月
3.92020年10月5日2025年10月

mecab-python3は、よくメンテナンスされていると言えますね。
その意味では、安心して使えます。

最後に、Windowsだけ注意すべきポイントを説明しておきます。
Windowsは、「Microsoft Visual C++ Redistributable」が必要になります。

これは、単純にランタイムライブラリです。
もし、インストールでエラーが出たら、ここを疑ってみましょう。

以上、mecab-python3のシステム要件についての説明でした。
次は、mecab-python3をインストールします。

mecab-python3のインストール

まずは、現状のインストール済みパッケージを確認しておきます。

>pip list 
Package    Version 
---------- ------- 
pip        21.2.4 
setuptools 57.4.0

次にするべきことは、pipとsetuptoolsの更新です。
pipコマンドを使う場合、常に以下のコマンドを実行しておきましょう。

python -m pip install --upgrade pip setuptools

では、mecab-python3のインストールです。
mecab-python3のインストールは、以下のコマンドとなります。

pip install mecab-python3

インストールは、一瞬で終わります。
では、どんなパッケージがインストールされたのかを確認しましょう。

>pip list 
Package       Version 
------------- ------- 
mecab-python3 1.0.4 
pip           21.2.4 
setuptools    57.4.0

mecab-python3が依存するパッケージは、ありません。
それであれば、比較的容易に既存環境にも導入できそうです。

あと、MeCabについて確認しておきましょう。
MeCabのバイナリが、同時にインストールされています。

WindowsとLinux(Ubuntu)の場合を載せておきます。

Windows

libmecab.dllを確認できます。

Linux(Ubuntu)

~/lib/python3.9/site-packages/MeCab$ ls -og --time-style="+" 
合計 596 
-rwxrwxr-x 1 592064  _MeCab.cpython-39-x86_64-linux-gnu.so 
-rw-rw-r-- 1   4810  __init__.py 
drwxrwxr-x 2   4096  __pycache__ 
-rw-rw-r-- 1    991  cli.py

_MeCab.cpython-39-x86_64-linux-gnu.soを確認できます。
ファイル名の「cpython-39-x86_64-linux-gnu」は、環境によって変わってくるでしょう。

mecab-python3のインストールについて説明しました。
次は、辞書のインストールを行います。

mecab-python3で利用する辞書のインストール

形態素解析には、辞書が必要です。
もちろん、MeCabでも辞書が必要となります。

そして、mecab-python3ではunidic-liteがおススメとなっています。
unidic-liteは、比較的軽量な2013年版Unidicです。

本格的に利用する場合は、最新のUnidicなどとなるでしょう。
あくまで、unidic-liteは動作確認用に過ぎません。

unidic-liteのインストールは、次のコマンドで行います。

pip install unidic-lite

インストールは、少しだけ待ちます。
unidic-liteインストール後のパッケージ状況は、以下。

>pip list 
Package       Version 
------------- ------- 
mecab-python3 1.0.4 
pip           21.2.4 
setuptools    57.4.0 
unidic-lite   1.0.8

以上、mecab-python3で利用する辞書のインストールについて説明しました。
最後は、mecab-python3の動作確認を行います。

mecab-python3の動作確認

動作確認用のコードは、以下となります。

import MeCab 
wakati = MeCab.Tagger("-Owakati") 
result = wakati.parse("pythonが大好きです").split() 
print(result)

上記コードを実行します。
次のように表示されれば、動作確認はOKです。

['python', 'が', '大好き', 'です']

以上、mecab-python3の動作確認の説明でした。

タイトルとURLをコピーしました