书栈网 · BookStack 本次搜索耗时 0.020 秒,为您找到 549 个相关结果.
  • 2.2 索引列表

    2.2 索引列表 2.2 索引列表 正如我们已经看到的,Python 中的一个文本是一个单词的列表,用括号和引号的组合来表示。就像处理一页普通的文本,我们可以使用len(text1) 计算text1 的词数,使用text1.count('heaven') 计算一个文本中出现的特定的词,如'heaven' 。 稍微花些耐心,我们可以挑选出打印出来的...
  • 3.2 字符串:最底层的文本处理

    3.2 字符串:最底层的文本处理 字符串的基本操作 输出字符串 访问单个字符 更多的字符串操作 3.2 字符串:最底层的文本处理 现在是时候研究一个之前我们一直故意避开的基本数据类型了。在前面的章节中,我们侧重于将文本作为一个词列表。我们并没有细致的探讨词汇以及它们是如何在编程语言中被处理的。通过使用 NLTK 中的语料库接口,我们可以忽略这...
  • Introduction

    PyTorch 1.2 中文文档 & 教程 目录结构 PyTorch 1.2 中文文档 & 教程 PyTorch 是一个针对深度学习, 并且使用 GPU 和 CPU 来优化的 tensor library (张量库) 欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远。 在线阅读 ApacheCN 学习资源 Py...
  • 1.3 文档分类

    1.3 文档分类 1.3 文档分类 在1 中,我们看到了语料库的几个例子,那里文档已经按类别标记。使用这些语料库,我们可以建立分类器,自动给新文档添加适当的类别标签。首先,我们构造一个标记了相应类别的文档清单。对于这个例子,我们选择电影评论语料库,将每个评论归类为正面或负面。 >>> from nltk . corpus import m...
  • 3.6 标准和工具

    3.6 标准和工具 3.6 标准和工具 一个用途广泛的语料库需要支持广泛的格式。然而,NLP 研究的前沿需要各种新定义的没有得到广泛支持的标注。一般情况下,并没有广泛使用的适当的创作、发布和使用语言数据的工具。大多数项目都必须制定它们自己的一套工具,供内部使用,这对缺乏必要的资源的其他人没有任何帮助。此外,我们还没有一个可以胜任的普遍接受的标准来表示...
  • 5. 分类和标注词汇

    5. 分类和标注词汇 5. 分类和标注词汇 早在小学你就学过名词、动词、形容词和副词之间的差异。这些“词类”不是闲置的文法家的发明,而是对许多语言处理任务都有用的分类。正如我们将看到的,这些分类源于对文本中词的分布的简单的分析。本章的目的是要回答下列问题: 什么是词汇分类,在自然语言处理中它们是如何使用? 一个好的存储词汇和它们的分类的 Pyth...
  • Template table

    Percolate table Creating a percolate table via MySQL protocol: Creating a percolate table via JSON over HTTP: Creating a percolate table via PHP client: Creating a percolate tab...
  • 前言

    前言 读者 Python 3 和 NLTK 3 软件安装需求 自然语言工具包 (NLTK) 教师请看 本书使用的约定 使用例子代码 致谢 关于作者 版税 前言 这是一本关于自然语言处理的书。所谓“自然语言”,是指人们日常交流使用的语言,如英语,印地语,葡萄牙语等。相对于编程语言和数学符号这样的人工语言,自然语言随着一代人传给另一代...
  • Workflow templates

    Workflow templates Example Step 1: Create and provision the workflow Step 2: Ingest documents into the index Step 3: Perform vector search Parameters Overriding default values ...
  • Workflow templates

    Workflow templates Example Step 1: Create and provision the workflow Step 2: Ingest documents into the index Step 3: Perform vector search Parameters Overriding default values ...