Google ColabでMeCabを使ってみよう

MeCab とは日本語形態素解析エンジンである。

詳しくは MeCab 公式ホームページをご参照ください。

taku910.github.io

  • mecab-python3 のインストール
!pip install mecab-python3
  • mecab-ipadic-NEologd のインストール
!apt install mecab libmecab-dev git make curl xz-utils file
!git clone --depth 1 https://github.com/neologd/mecab-unidic-neologd.git
!echo yes | mecab-unidic-neologd/bin/install-mecab-unidic-neologd -n

MeCab.Tagger クラスに-dオプションで NEologd 辞書のパスを指定することができます。

import MeCab
tagger = MeCab.Tagger("-d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-unidic-neologd")
print(tagger.parse('フシギダネは不思議だね。'))
  • 実行結果 f:id:michiru_7:20210516165552p:plain