XSDocument 文档

XSDocument 是用于描述检索/索引的基础对象,包含一组字段及其值。相当于常规 SQL 数据表中的一行记录。通过魔术方法,每个字段名都是文档的虚拟属性,可直接赋值或取值,也支持数组下标方式访问文档字段。

  1. $doc = new XSDocument;
  2. $doc->name = 'value'; // 用对象属性方式进行赋值、取值
  3. $doc['name'] = 'value'; // 用数组下标方式进行赋值、取值
  4. $value = $doc->f('name'); // 用函数方式进行取值
  5. $doc->setField('name', 'value'); // 用函数方式进行赋值
  6. $doc->setFields(array('name' => 'value', 'name2' => 'value2')); // 用数组进行批量赋值
  7.  
  8. // 迭代方式取所有字段值
  9. foreach($doc as $name => $value)
  10. {
  11. echo "$name: $value\n";
  12. }

用于索引更新的文档对象和搜索结果返回中略有不同,下面分开讲解。1. 搜索结果文档搜索结果文档是指 XSSearch::search 返回值包含的文档,它由 PHP-SDK 内部代码创建。除了普通文档的功能外,还支持以下魔术方法来访问搜索结果的元数据:

  • docid() 取得搜索结果文档的 docid 值 (实际数据库内的 id,一般用不到)
  • rank() 取得搜索结果文档的序号值 (第X条结果)
  • percent() 取得搜索结果文档的匹配百分比 (结果匹配度, 1~100)
  • weight() 取得搜索结果文档的权重值 (浮点数)
  • ccount() 取得搜索结果折叠的数量 (按字段折叠搜索时才有效)访问结果文档的字符集默认是与 XSSearch::setCharset 所指定的字符集一致的,如未指定过则为 XS::defaultCharset。虽然您可以通过 XSDocument::setCharset 来强制修改文档的字符集,但不推荐这样做,也没必要这样做。2. 索引文档索引文档是指由用户创建,并用于提交更新到索引库中的文档,创建文档时允许传入字符集作为构造函数的参数,如未传入,则自动视为项目的默认字符集 XS::defaultCharset,如果字符集不是 UTF-8 的系统内部会自动进行转换,但要求 PHP 带有中文转码扩展 (iconvmbstring)
  1. $doc = new XSDocument; // 使用默认字符集
  2. $doc = new XSDocument('gbk'); // 指定文档为 GBK 编码
  3. $doc = new XSDocument($data); // 数组 $data 为初始字段数据, 编码则为默认编码
  4. $doc = new XSDocument($data, 'gbk'); // 数组 $data 为字段数据, 编码为 GBK
  5.  
  6. // 然后进行一系列赋值操作
  7.  
  8. // 提交到索引中
  9. $xs->index->add($doc);

如果您希望在 XSDocument 提交到索引前、后进行一系列必要的操作,您可以对 XSDocument 进行扩展,重写 XSDocument::beforeSubmitXSDocument::afterSubmit 方法来实现,比如扩展代码为$prefix/sdk/php/lib/MyDocument.class.php

  1. class MyDocument extends XSDocument
  2. {
  3. public function beforeSubmit(XSIndex $index)
  4. {
  5. // 在此编写您的代码,如需要中断添加请提前返回 false
  6. // ...
  7. return parent::beforeSubmit($index);
  8. }
  9.  
  10. public function afterSubmit(XSIndex $index)
  11. {
  12. // 在此编写您的代码,只有加入索引成功后才会执行
  13. // ...
  14. }
  15. }
  16.  
  17. $doc = new MyDocument('gbk');
  18. $doc->pid = 123;
  19. $doc->subject = 'Hello, 测试';
  20. $doc->message = '测试的内容在此';
  21. $xs->index->add($doc);