1. 自然语言处理
用于使用人类语言的图书馆。
- getlang - 快速自然语言检测程序包。
- go-i18n - 用于处理本地化文本的软件包和一个随附工具。
- go-mystem - CGo与Yandex.Mystem的绑定-俄罗斯形态分析仪。
- go-nlp - 用于处理离散概率分布的实用程序和其他可用于执行NLP工作的工具。
- go-pinyin - CN Hanzi至Hanyu拼音转换器。
- go-stem - 搬运程序阻止算法的实现。
- go-unidecode - Unicode文本的ASCII音译。
- go2vec - 用于word2vec嵌入的阅读器和实用程序功能。
- gojieba - 这是一个围棋实施解霸其中中国分词算法。
- golibstemmer - 雪球库libstemmer库的绑定,包括porter 2。
- gotokenizer - 基于字典和Goram语言的Bigram语言模型的标记器。(现在仅支持中文细分)
- gounidecode - Go的Unicode音译器(也称为unidecode)。
- gse - 进行有效的文本分割;支持英语,中文,日语等。
- icu - CGO结合为ICU4C C库检测和转换功能。保证与版本50.1兼容。
- kagome - 用纯Go语言编写的JP形态分析仪。
- libtextcat - libtextcat C库的Cgo绑定。保证与2.2版兼容。
- MMSEGO - 这是MMSEG的GO实现,它是中文分词算法。
- nlp - 从字符串中提取值,并用nlp填充您的结构。
- nlp - 支持LSA(潜在语义分析)的自然语言处理库。
- paicehusk - Paice / Husk提取算法的Golang实现。
- petrovich - 彼得罗维奇(Petrovich)是图书馆,在给定的语法情况下使用俄语名称。
- porter - 这是Martin Porter的Porter干算法的C实现的相当简单的移植。
- porter2 - 非常快的Porter 2 提取器。
- prose - 用于文本处理的库,支持标记化,词性标记,命名实体提取等。仅限英语。
- RAKE.go - 快速自动关键字提取算法(RAKE)的Go端口。
- segment - 用于执行Unicode标准附件#29中所述的Unicode文本分段的Go库
- sentences - 句子标记器:将文本转换为句子列表。
- shamoji - shamoji是用Go编写的单词过滤程序包。
- snowball - Go的雪球茎端口(cgo包装器)。提供单词词干提取功能Snowball本机。
- stemmer - 用于Go编程语言的Stemmer软件包。包括英语和德语词干。
- textcat -Go软件包,用于基于n-gram的文本分类,并支持utf-8和原始文本。
- whatlanggo - Go的自然语言检测程序包。支持84种语言和24种脚本(书写系统,例如拉丁语,西里尔字母等)。
- when - 自然EN和RU语言日期/时间分析器具有可插拔的规则。