自然语言处理用来处理人类语言的库。 NLTK:一个先进的平台,用以构建处理人类语言数据的 Python 程序。官网jieba:中文分词工具。官网langid.py:独立的语言识别系统。官网Pattern:Python 网络信息挖掘模块。官网SnowNLP:一个用来处理中文文本的库。官网TextBlob:为进行普通自然语言处理任务提供一致的 API。官网TextGrocery:一简单高效的短文本分类工具,基于 LibLinear 和 Jieba。官网thulac:清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包官网