A simple wrapper of "jieba" and "wordcloud" in Python 3.

Xi Ruoyao 9782391717 Output the statistics for .csv output 5 năm trước cách đây
.gitignore e8f3041ad2 Add .gitignore 5 năm trước cách đây
README.md 1c97ae5606 Update README.md to keep using SC font 5 năm trước cách đây
example.in 04a6c9fa1a Initial commit 5 năm trước cách đây
pos.txt c320792de3 Add Part of Speech table 5 năm trước cách đây
wordfreq.py 9782391717 Output the statistics for .csv output 5 năm trước cách đây

README.md

Wordfreq script

Prerequisites

  • Python 3
  • Python 3 modules: wordcloud, PIL, matplotlib, numpy, and jieba
  • The TTF/OTF file of the font you want to use

Example

wget https://bf.mengyan1223.wang/assets/fonts/{SourceHanSans.ttc,ttc2ttf.py}
python3 ttc2ttf.py SourceHanSans.ttc
./wordfreq.py -i example.in -o example.png -p n,ne -f SourceHanSans11.ttf -t 60

You should use Source Han Sans font under the terms of SIL Open Font License 1.1.

Parts of speech

See pos.txt, origin gist by hscspring.

Acknowlegement

And, special thanks to Lao She who authors example.in (Mr. Breeches, 1933).