中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Elasticsearch中如何進行Match查詢

發布時間:2021-11-16 16:55:00 來源:億速云 閱讀:268 作者:柒染 欄目:大數據

Elasticsearch中如何進行Match查詢,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

如果索引單詞對而不是索引獨立的單詞,就能對這些單詞的上下文盡可能多的保留。這個時候就需要用到shingles。

例句:Sue ate the alligator 
unigram:["sue", "ate", "the", "alligator"]
bigrams:["sue ate", "ate the", "the alligator"]
trigrams:["sue ate the", "ate the alligator"]

備注:
Trigrams 提供了更高的精度,但是也大大增加了索引中唯一詞項的數量。在大多數情況下,Bigrams 就夠了。

幸運的是,用戶傾向于使用和搜索數據相似的構造來表達搜索意圖。
但這一點很重要:只是索引 bigrams 是不夠的;我們仍然需要 unigrams ,但可以將匹配 bigrams 作為增加相關度評分的信號。

Shingles 需要在索引時作為分析過程的一部分被創建。 
我們可以將 unigrams 和 bigrams 都索引到單個字段中, 但將它們分開保存在能被獨立查詢的字段會更清晰。
unigrams 字段將構成我們搜索的基礎部分,而 bigrams 字段用來提高相關度。

注意:

  • 詞項匹配

  • 只有當用戶輸入的查詢內容和在原始文檔中順序相同時,shingles 才是有用的

總結:

  • 使用短語查詢時使用Es默認的標準分詞器(標準分詞器:細粒度切分)最好,這樣可以使查詢分詞和索引分詞的詞項最大可能的達到匹配

  • 特別適合需要前后詞一起搭配的情景(例:人名、地名...)

數據準備階段

新建索引setting:
PUT /my_index
{
    "settings": {
        "number_of_shards": 1,
        "analysis": {
            "filter": {
                "my_shingle_filter": {
                    "type": "shingle",
                    "min_shingle_size": 2,
                    "max_shingle_size": 2,   
                    "output_unigrams":  false
                }
            },
            "analyzer": {
                "my_shingle_analyzer": {
                    "type": "custom",
                    "tokenizer":"standard",
                    "filter": [
                        "lowercase",
                        "my_shingle_filter">

Elasticsearch中如何進行Match查詢

測試階段

1.match查詢

GET /my_index/_doc/_search
{
   "query": {
        "match": {
           "title": "the hungry alligator ate sue"
        }
   }
}

查詢結果:
{
  "took" : 3,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : 3,
    "max_score" : 1.3721708,
    "hits" : [
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 1.3721708,#兩個文檔都包含 the 、 alligator 和 ate ,所以獲得相同的評分。
        "_source" : {
          "title" : "Sue ate the alligator"
        }
      },
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 1.3721708,#兩個文檔都包含 the 、 alligator 和 ate ,所以獲得相同的評分。
        "_source" : {
          "title" : "The alligator ate Sue"
        }
      },
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "3",
        "_score" : 0.21526179,#我們可以通過設置 minimum_should_match 參數排除文檔 3 ,參考 控制精度 。 
        "_source" : {
          "title" : "Sue never goes anywhere without her alligator skin purse"
        }
      }
    ]
  }
}

分析:
注意文檔 1 和 2 有相同的相關度評分因為他們包含了相同的單詞

2.match.shingles查詢

GET /my_index/_doc/_search
{
   "query": {
      "bool": {
         "must": {
            "match": {
               "title": "the hungry alligator ate sue"
            }
         },
         "should": {
            "match": {
               "title.shingles": "the hungry alligator ate sue"
            }
         }
      }
   }
}

查詢結果:
{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : 3,
    "max_score" : 3.6694741,
    "hits" : [
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 3.6694741,
        "_source" : {
          "title" : "The alligator ate Sue"
        }
      },
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 1.3721708,
        "_source" : {
          "title" : "Sue ate the alligator"
        }
      },
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "3",
        "_score" : 0.21526179,
        "_source" : {
          "title" : "Sue never goes anywhere without her alligator skin purse"
        }
      }
    ]
  }
}

分析:
仍然匹配到了所有的 3 個文檔, 但是文檔 2 現在排到了第一名因為它匹配了 shingled 詞項 ate sue.

關于Elasticsearch中如何進行Match查詢問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

密山市| 沙坪坝区| 修武县| 北辰区| 双柏县| 江北区| 来凤县| 宜黄县| 乐平市| 彝良县| 顺昌县| 南涧| 营山县| 平凉市| 上杭县| 深水埗区| 泸州市| 绥江县| 呼图壁县| 屏山县| 曲松县| 江华| 吉安市| 凤台县| 新化县| 兴义市| 文安县| 东宁县| 石台县| 呼伦贝尔市| 常宁市| 襄城县| 北宁市| 天津市| 永川市| 花垣县| 原平市| 平利县| 永城市| 岱山县| 井研县|