
いきなりですが上の画像カッコよくないですか?かっこいいですよね。この記事を読めばあなたもこのかっこいいプロットができるようになります。
GiNZA
本日使うライブラリの一つ目です。係り受け解析器 です。ちなみに似たもので
- CaboCha/南瓜: Yet Another Japanese Dependency Structure Analyzer
spaCy
超有名ライブラリです。GiNZAをこれにかまします。- spaCy is a free open-source library for Natural Language Processing in Python.
よくない点
GiNZAを使ってみた感想としてはsimilarityがあまりよくないかな?と思いました。



pyLDAvis
3つ目のライブラリです。genismを合わせれば4ですが、以前紹介したのでスキップです。このライブラリはトピックモデリングの結果をインタラクティブに触れるものです。- Simple LDA Topic Modeling in Python: implementation and visualization, without delve into the Math
- Topic modeling visualization – How to present the results of LDA models?

- 左側の円はそれぞれトピック
- 円の大きさはトピックに含まれる文書数
- 円と円の距離はトピック間の距離
- 右側は単語の発生頻度
- トピックを選択するとそのトピック内での単語の発生頻度を見ることができる