现在让我们从一些简单的搜索开始吧。运行搜索有两种基本方法:一种是通过REST request URI发送搜索参数,另一种是通过REST request body 搜索参数。请求体方法允许您更具表现力,并以更可读的JSON格式定义搜索。我们将尝试一个请求URI方法的示例,但是对于本教程的其余部分,我们将专门使用请求体方法。
可以从_search端点访问用于搜索的REST API。此示例返回银行索引中的所有文档:
GET /bank/_search?q=*&sort=account_number:asc&pretty
让我们首先剖析搜索。我们在银行索引中搜索(_search endpoint),q = *参数指示Elasticsearch匹配索引中的所有文档。sort = account_number:asc参数指示使用升序中的每个文档的account_number字段对结果进行排序。pretty 的参数再次告诉Elasticsearch返回 pretty 的JSON结果。
{
"took" : 63,
"timed_out" : false,
"_shards" : {
"total" : 5,
"successful" : 5,
"skipped" : 0,
"failed" : 0
},
"hits" : {
"total" : {
"value": 1000,
"relation": "eq"
},
"max_score" : null,
"hits" : [ {
"_index" : "bank",
"_type" : "_doc",
"_id" : "0",
"sort": [0],
"_score" : null,
"_source" : {"account_number":0,"balance":16623,"firstname":"Bradshaw","lastname":"Mckenzie","age":29,"gender":"F","address":"244 Columbus Place","employer":"Euron","email":"bradshawmckenzie@euron.com","city":"Hobucken","state":"CO"}
}, {
"_index" : "bank",
"_type" : "_doc",
"_id" : "1",
"sort": [1],
"_score" : null,
"_source" : {"account_number":1,"balance":39225,"firstname":"Amber","lastname":"Duke","age":32,"gender":"M","address":"880 Holmes Lane","employer":"Pyrami","email":"amberduke@pyrami.com","city":"Brogan","state":"IL"}
}, ...
]
}
}
返回响应值,我们看到以下部分:
- took — Elasticsearch执行搜索的时间(以毫秒为单位)
- time_out — 告诉我们搜索是否超时
- _shards — 告诉我们搜索了多少个分片,以及搜索成功/失败分片的计数
- hits — 搜索结果
- hits.total — 包含与我们的搜索条件匹配的文档总数的信息的对象
- hits.total.value — 总命中数的值(必须在hits.total.relation的上下文中解释)。
- hits.total.relation — 是否hits.total.value是确切的命中数,在这种情况下它等于“eq”或总命中数的下限(大于或等于),在这种情况下它等于gte
- hits.hits — 实际的搜索结果数组(默认为前10个文档)
- hits.sort — 每个结果的排序键的排序值(如果按分数排序则丢失)
- hits._score and max_score — 暂时忽略这些字段
hits.total的准确性由请求参数track_total_hits控制,当设置为true时,请求将准确跟踪总命中(“关系”:“eq”)。它默认为10,000,这意味着总命中数可以精确跟踪多达10,000个文档。您可以通过将track_total_hits显式设置为true来强制进行准确计数。有关详细信息,请参阅 request body 文档。
以下是使用替代请求正文方法的上述完全相同的搜索:
GET /bank/_search
{
"query": { "match_all": {} },
"sort": [
{ "account_number": "asc" }
]
}
这里的不同之处在于,我们不是在URI中传递q = *,而是向_search API提供JSON样式的查询请求体。我们将在下一节讨论这个JSON查询。
重要的是要理解,一旦您获得了搜索结果,Elasticsearch就完全完成了请求,并且不会在结果中维护任何类型的服务器端资源或打开游标。这与SQL等许多其他平台形成鲜明对比,其中您最初可能会预先获得查询结果的部分子集,然后如果要获取(或翻页)其余部分,则必须不断返回服务器使用某种有状态服务器端游标的结果。