ElasticSearch 实战:查询Sort(查询排序)

07-13 1299阅读

在Elasticsearch中,查询排序(Sort)功能允许用户控制搜索结果的返回顺序。这有助于根据特定字段的值对匹配文档进行升序(asc)或降序(desc)排列。以下是如何在实战中使用Elasticsearch查询排序的示例:

ElasticSearch 实战:查询Sort(查询排序)
(图片来源网络,侵删)

一、基本排序

**1. 在URL参数中指定排序:
GET /my_index/_search?sort=title:asc,body:text

此请求将按照title字段的值升序排序,如果title字段值相同,则按照body字段的文本相关性排序。

**2. 在请求体中指定排序:
POST /my_index/_search
{
  "sort": [
    { "title": { "order": "asc" } },
    { "body": { "order": "text" } }
  ]
}

此请求体结构与URL参数形式等效,但提供了更丰富的排序选项。

二、多字段排序

可以同时指定多个字段进行排序,Elasticsearch会依次按照字段列表的顺序进行比较:

POST /my_index/_search
{
  "sort": [
    { "release_date": { "order": "desc" } },
    { "rating": { "order": "desc" } }
  ]
}

这个查询首先按照release_date字段降序排序,对于release_date相同的文档,再按照rating字段降序排序。

三、复杂排序

Elasticsearch支持对数值、日期、地理位置、文本等各类字段进行排序,并提供了多种高级选项:

**1. 数值排序:
POST /my_index/_search
{
  "sort": [
    { "popularity": { "order": "desc", "unmapped_type": "long" } }
  ]
}

这里指定了popularity字段降序排序,并设置了unmapped_type以防字段未映射为数值类型时的错误。

**2. 日期排序:
POST /my_index/_search
{
  "sort": [
    { "created_at": { "order": "desc", "format": "strict_date_optional_time_nanos" } }
  ]
}

对created_at字段进行降序排序,并指定日期格式。

**3. 地理位置排序:
POST /my_index/_search
{
  "sort": [
    {
      "_geo_distance": {
        "pin.location": [-70.0, 40.0],
        "order": "asc",
        "unit": "km"
      }
    }
  ]
}

按照与点[-70.0, 40.0]的距离升序排序地理位置字段。

**4. 文本相关性排序:
POST /my_index/_search
{
  "sort": [
    { "_score": { "order": "desc" } }
  ],
  "query": {
    "multi_match": {
      "query": "search terms",
      "fields": ["title^2", "body"]
    }
  }
}

在执行查询后,按照文档与查询的文本相关性( _score)降序排序。

四、排序模式

对于多值字段或数组字段,可以指定排序模式:

POST /my_index/_search
{
  "sort": [
    {
      "tags": {
        "order": "desc",
        "mode": "max"  // 取数组中最大值排序
      }
    }
  ]
}

此处对tags字段取最大值进行降序排序。

五、缺失值处理

可以指定当文档缺少排序字段时如何处理:

POST /my_index/_search
{
  "sort": [
    {
      "views": {
        "order": "desc",
        "missing": "_last"  // 缺失值排在最后
      }
    }
  ]
}

在此示例中,缺少views字段的文档将被置于排序结果的末尾。

实战总结

Elasticsearch的查询排序功能强大且灵活,支持对各类字段进行升序或降序排列,可结合多字段排序、复杂排序选项(如地理位置、文本相关性等)、排序模式以及缺失值处理策略,以满足各种业务场景的需求。在实际应用中,应根据查询目的和数据特性选择合适的排序方式,以提高用户体验和查询结果的相关性。同时,要注意排序操作可能影响查询性能,特别是在大规模数据集上对高基数字段进行排序时,可能需要结合索引优化、查询缓存等策略进行性能调优。

VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]