「手っ取り早くMeCabを利用したい」
「WindowsにMeCabをインストールするのが困難」
「mecab-python3に依存するライブラリを利用する必要がある」
この記事は、上記の場合に役立つ内容となっています。
本記事の内容
- mecab-python3とは?
- mecab-python3のシステム要件
- mecab-python3のインストール
- mecab-python3の動作確認
それでは、上記に沿って解説していきます。
mecab-python3とは?
mecab-python3は、MeCabのラッパーです。
形態素解析を簡単に動かしたい場合、mecab-python3が役に立ちます。
Linux・macOSなら、MeCabは簡単に動きます。
しかし、Windowsの場合はそうではありません。
その様子は、次の記事をご覧ください。
WindowsへのMeCabのインストールは、それなりに知識が必要となります。
初心者では、少し厳しいかもしれません。
ただ、勘違いはしないようにしてください。
mecab-python3によるインストールは、MeCabのOSへのインストールではありません。
そのため、コマンドツールとしてMeCabを利用することはできません。
あくまで、mecab-python3を経由してMecabを利用するだけです。
詳細は、後述の「mecab-python3のインストール」でわかると思います。
しかし、Pythonで形態素解析は問題なく可能となります。
それも、本当に簡単にそれが可能なのです。
それだけでも、mecab-python3を利用する価値はあります。
以上、mecab-python3について説明しました。
次は、mecab-python3のシステム要件を確認します。
mecab-python3のシステム要件
現時点(2021年8月)でのmecab-python3の最新バージョンは、1.0.4となります。
この最新バージョンは、2021年6月23日にリリースされています。
サポートOSに関しては、以下を含むクロスプラットフォーム対応です。
- Windows
- macOS
- Linux
そして、サポート対象となるPythonのバージョンは以下。
- Python 3.6
- Python 3.7
- Python 3.8
- Python 3.9
以下は、Pythonの公式開発サイクルとなります。
バージョン | リリース日 | サポート期限 |
3.6 | 2016年12月23日 | 2021年12月 |
3.7 | 2018年6月27日 | 2023年6月 |
3.8 | 2019年10月14日 | 2024年10月 |
3.9 | 2020年10月5日 | 2025年10月 |
mecab-python3は、よくメンテナンスされていると言えますね。
その意味では、安心して使えます。
最後に、Windowsだけ注意すべきポイントを説明しておきます。
Windowsは、「Microsoft Visual C++ Redistributable」が必要になります。
これは、単純にランタイムライブラリです。
もし、インストールでエラーが出たら、ここを疑ってみましょう。
以上、mecab-python3のシステム要件についての説明でした。
次は、mecab-python3をインストールします。
mecab-python3のインストール
まずは、現状のインストール済みパッケージを確認しておきます。
>pip list Package Version ---------- ------- pip 21.2.4 setuptools 57.4.0
次にするべきことは、pipとsetuptoolsの更新です。
pipコマンドを使う場合、常に以下のコマンドを実行しておきましょう。
python -m pip install --upgrade pip setuptools
では、mecab-python3のインストールです。
mecab-python3のインストールは、以下のコマンドとなります。
pip install mecab-python3
インストールは、一瞬で終わります。
では、どんなパッケージがインストールされたのかを確認しましょう。
>pip list Package Version ------------- ------- mecab-python3 1.0.4 pip 21.2.4 setuptools 57.4.0
mecab-python3が依存するパッケージは、ありません。
それであれば、比較的容易に既存環境にも導入できそうです。
あと、MeCabについて確認しておきましょう。
MeCabのバイナリが、同時にインストールされています。
WindowsとLinux(Ubuntu)の場合を載せておきます。
Windows
libmecab.dllを確認できます。
Linux(Ubuntu)
~/lib/python3.9/site-packages/MeCab$ ls -og --time-style="+" 合計 596 -rwxrwxr-x 1 592064 _MeCab.cpython-39-x86_64-linux-gnu.so -rw-rw-r-- 1 4810 __init__.py drwxrwxr-x 2 4096 __pycache__ -rw-rw-r-- 1 991 cli.py
_MeCab.cpython-39-x86_64-linux-gnu.soを確認できます。
ファイル名の「cpython-39-x86_64-linux-gnu」は、環境によって変わってくるでしょう。
mecab-python3のインストールについて説明しました。
次は、辞書のインストールを行います。
mecab-python3で利用する辞書のインストール
形態素解析には、辞書が必要です。
もちろん、MeCabでも辞書が必要となります。
そして、mecab-python3ではunidic-liteがおススメとなっています。
unidic-liteは、比較的軽量な2013年版Unidicです。
本格的に利用する場合は、最新のUnidicなどとなるでしょう。
あくまで、unidic-liteは動作確認用に過ぎません。
unidic-liteのインストールは、次のコマンドで行います。
pip install unidic-lite
インストールは、少しだけ待ちます。
unidic-liteインストール後のパッケージ状況は、以下。
>pip list Package Version ------------- ------- mecab-python3 1.0.4 pip 21.2.4 setuptools 57.4.0 unidic-lite 1.0.8
以上、mecab-python3で利用する辞書のインストールについて説明しました。
最後は、mecab-python3の動作確認を行います。
mecab-python3の動作確認
動作確認用のコードは、以下となります。
import MeCab wakati = MeCab.Tagger("-Owakati") result = wakati.parse("pythonが大好きです").split() print(result)
上記コードを実行します。
次のように表示されれば、動作確認はOKです。
['python', 'が', '大好き', 'です']
以上、mecab-python3の動作確認の説明でした。