1. 自然语言处理

用于使用人类语言的图书馆。

  • getlang - 快速自然语言检测程序包。
  • go-i18n - 用于处理本地化文本的软件包和一个随附工具。
  • go-mystem - CGo与Yandex.Mystem的绑定-俄罗斯形态分析仪。
  • go-nlp - 用于处理离散概率分布的实用程序和其他可用于执行NLP工作的工具。
  • go-pinyin - CN Hanzi至Hanyu拼音转换器。
  • go-stem - 搬运程序阻止算法的实现。
  • go-unidecode - Unicode文本的ASCII音译。
  • go2vec - 用于word2vec嵌入的阅读器和实用程序功能。
  • gojieba - 这是一个围棋实施解霸其中中国分词算法。
  • golibstemmer - 雪球库libstemmer库的绑定,包括porter 2。
  • gotokenizer - 基于字典和Goram语言的Bigram语言模型的标记器。(现在仅支持中文细分)
  • gounidecode - Go的Unicode音译器(也称为unidecode)。
  • gse - 进行有效的文本分割;支持英语,中文,日语等。
  • icu - CGO结合为ICU4C C库检测和转换功能。保证与版本50.1兼容。
  • kagome - 用纯Go语言编写的JP形态分析仪。
  • libtextcat - libtextcat C库的Cgo绑定。保证与2.2版兼容。
  • MMSEGO - 这是MMSEG的GO实现,它是中文分词算法。
  • nlp - 从字符串中提取值,并用nlp填充您的结构。
  • nlp - 支持LSA(潜在语义分析)的自然语言处理库。
  • paicehusk - Paice / Husk提取算法的Golang实现。
  • petrovich - 彼得罗维奇(Petrovich)是图书馆,在给定的语法情况下使用俄语名称。
  • porter - 这是Martin Porter的Porter干算法的C实现的相当简单的移植。
  • porter2 - 非常快的Porter 2 提取器。
  • prose - 用于文本处理的库,支持标记化,词性标记,命名实体提取等。仅限英语。
  • RAKE.go - 快速自动关键字提取算法(RAKE)的Go端口。
  • segment - 用于执行Unicode标准附件#29中所述的Unicode文本分段的Go库
  • sentences - 句子标记器:将文本转换为句子列表。
  • shamoji - shamoji是用Go编写的单词过滤程序包。
  • snowball - Go的雪球茎端口(cgo包装器)。提供单词词干提取功能Snowball本机。
  • stemmer - 用于Go编程语言的Stemmer软件包。包括英语和德语词干。
  • textcat -Go软件包,用于基于n-gram的文本分类,并支持utf-8和原始文本。
  • whatlanggo - Go的自然语言检测程序包。支持84种语言和24种脚本(书写系统,例如拉丁语,西里尔字母等)。
  • when - 自然EN和RU语言日期/时间分析器具有可插拔的规则。