现在让我们从一些简单的搜索开始吧。运行搜索有两种基本方法:一种是通过REST request URI发送搜索参数,另一种是通过REST request body 搜索参数。请求体方法允许您更具表现力,并以更可读的JSON格式定义搜索。我们将尝试一个请求URI方法的示例,但是对于本教程的其余部分,我们将专门使用请求体方法。

    可以从_search端点访问用于搜索的REST API。此示例返回银行索引中的所有文档:

    1. GET /bank/_search?q=*&sort=account_number:asc&pretty

    让我们首先剖析搜索。我们在银行索引中搜索(_search endpoint),q = *参数指示Elasticsearch匹配索引中的所有文档。sort = account_number:asc参数指示使用升序中的每个文档的account_number字段对结果进行排序。pretty 的参数再次告诉Elasticsearch返回 pretty 的JSON结果。

    1. {
    2. "took" : 63,
    3. "timed_out" : false,
    4. "_shards" : {
    5. "total" : 5,
    6. "successful" : 5,
    7. "skipped" : 0,
    8. "failed" : 0
    9. },
    10. "hits" : {
    11. "total" : {
    12. "value": 1000,
    13. "relation": "eq"
    14. },
    15. "max_score" : null,
    16. "hits" : [ {
    17. "_index" : "bank",
    18. "_type" : "_doc",
    19. "_id" : "0",
    20. "sort": [0],
    21. "_score" : null,
    22. "_source" : {"account_number":0,"balance":16623,"firstname":"Bradshaw","lastname":"Mckenzie","age":29,"gender":"F","address":"244 Columbus Place","employer":"Euron","email":"bradshawmckenzie@euron.com","city":"Hobucken","state":"CO"}
    23. }, {
    24. "_index" : "bank",
    25. "_type" : "_doc",
    26. "_id" : "1",
    27. "sort": [1],
    28. "_score" : null,
    29. "_source" : {"account_number":1,"balance":39225,"firstname":"Amber","lastname":"Duke","age":32,"gender":"M","address":"880 Holmes Lane","employer":"Pyrami","email":"amberduke@pyrami.com","city":"Brogan","state":"IL"}
    30. }, ...
    31. ]
    32. }
    33. }

    返回响应值,我们看到以下部分:

    • took — Elasticsearch执行搜索的时间(以毫秒为单位)
    • time_out — 告诉我们搜索是否超时
    • _shards — 告诉我们搜索了多少个分片,以及搜索成功/失败分片的计数
    • hits — 搜索结果
    • hits.total — 包含与我们的搜索条件匹配的文档总数的信息的对象
      • hits.total.value — 总命中数的值(必须在hits.total.relation的上下文中解释)。
      • hits.total.relation — 是否hits.total.value是确切的命中数,在这种情况下它等于“eq”或总命中数的下限(大于或等于),在这种情况下它等于gte
    • hits.hits — 实际的搜索结果数组(默认为前10个文档)
    • hits.sort — 每个结果的排序键的排序值(如果按分数排序则丢失)
    • hits._score and max_score — 暂时忽略这些字段

    hits.total的准确性由请求参数track_total_hits控制,当设置为true时,请求将准确跟踪总命中(“关系”:“eq”)。它默认为10,000,这意味着总命中数可以精确跟踪多达10,000个文档。您可以通过将track_total_hits显式设置为true来强制进行准确计数。有关详细信息,请参阅 request body 文档。

    以下是使用替代请求正文方法的上述完全相同的搜索:

    1. GET /bank/_search
    2. {
    3. "query": { "match_all": {} },
    4. "sort": [
    5. { "account_number": "asc" }
    6. ]
    7. }

    这里的不同之处在于,我们不是在URI中传递q = *,而是向_search API提供JSON样式的查询请求体。我们将在下一节讨论这个JSON查询。

    重要的是要理解,一旦您获得了搜索结果,Elasticsearch就完全完成了请求,并且不会在结果中维护任何类型的服务器端资源或打开游标。这与SQL等许多其他平台形成鲜明对比,其中您最初可能会预先获得查询结果的部分子集,然后如果要获取(或翻页)其余部分,则必须不断返回服务器使用某种有状态服务器端游标的结果。