中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Elasticsearch的基本概念和特點

發布時間:2021-09-09 11:52:24 來源:億速云 閱讀:169 作者:chen 欄目:大數據

本篇內容介紹了“Elasticsearch的基本概念和特點”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!


一、簡介

Lucene:簡單來說,就是一個jar包,里面包含了封裝好的各種建立倒排索引,以及進行搜索的代碼,包含各種算法,我們用java開發的時候,引入lucene.jar就可以進行開發了。

ElasticSearch是一個基于Lucene的搜索服務器。它提供了一個分布式的全文搜索引擎和數據分析引擎;能夠實現全文檢索;結構化檢索;數據分析;對海量數據進行近實時的處理;安裝使用方便;本身擴展性很好,可以擴展到上百臺服務器,處理PB級別的數據。

二、ES國內外使用優秀案例

1) 2013年初,GitHub拋棄了Solr,采取ElasticSearch 來做PB級的搜索。 “GitHub使用ElasticSearch搜索20TB的數據,包括13億文件和1300億行代碼”。

2)維基百科:啟動以elasticsearch為基礎的核心搜索架構。

3)SoundCloud:“SoundCloud使用ElasticSearch為1.8億用戶提供即時而精準的音樂搜索服務”。

4)百度:百度目前廣泛使用ElasticSearch作為文本數據分析,采集百度所有服務器上的各類指標數據及用戶自定義數據,通過對各種數據進行多維分析展示,輔助定位分析實例異常或業務層面異常。目前覆蓋百度內部20多個業務線(包括casio、云分析、網盟、預測、文庫、直達號、錢包、風控等),單集群最大100臺機器,200個ES節點,每天導入30TB+數據。

5) 淘寶等電商網站,新聞網站,OA辦公系統等。

三、基本概念
1. 節點(Node)和集群(Cluster)

集群是一個或多個節點(服務器)的集合, 這些節點共同保存整個數據,并在所有節點上提供聯合索引和搜索功能。一個集群由一個唯一集群ID確定,并指定一個集群名(默認為“elasticsearch”)。該集群名非常重要,因為節點可以通過這個集群名加入集群,一個節點只能是集群的一部分。

2. Index(索引)

索引(index)類似于關系型數據庫里的“數據庫”——它是我們存儲和索引關聯數據的地方。索引名稱必須是全部小寫,不能以下劃線開頭,不能包含逗號。

3. Type(類型)

在索引中,我們可以定義一個或多個類型。類型是索引的邏輯類別/分區,其語義完全由開發者決定。通常,為具有一組公共字段的文檔定義類型。例如,假設開發者運行博客平臺并將所有數據存儲在一個索引中。在此索引中,我們可以為用戶數據定義類型,為博客數據定義另一種類型,并為注釋數據定義另一種類型。我們可以把索引理解成數據庫文檔中的表。

4. Document(文檔)

文檔是可索引信息的基本單元,以JSON表示。你可以用其來定義單個產品信息或是員工信息。我們可以把文檔理解為數據庫文檔中的行列數據。在索引/類型中,您可以存儲任意數量的文檔。文檔有幾個共同不可缺的屬性,分別為 _index, _type, _id, 針對特定一個或一類文檔進行操作時,必須指定這些屬性。

5. Mapping(映射)

模式映射(schema mapping,或簡稱映射)用于定義索引結構。Elasticsearch在映射中存儲有關字段的信息。映射在文件中以JSON對象傳送。

6. Field(字段)

ElasticSearch里的最小單元 相當于數據的某一列,類似于json里一個鍵。

7. Shards(分片)

當有大量的文檔時,由于內存的限制、硬盤能力、處理能力不足、無法足夠快地響應客戶端請求等,一個節點可能不夠。在這種情況下,數據可以分為較小的稱為分片(shard)的部分(其中每個分片都是一個獨立的Apache Lucene索引)。每個分片可以放在不同的服務器上,因此,數據可以在集群的節點中傳播。

當你查詢的索引分布在多個分片上時,Elasticsearch會把查詢發送給每個相關的分片,并將結果合并在一起。此外,多個分片可以加快索引。

8. Replica(副本)

為了提高查詢吞吐量或實現高可用性,可以使用分片副本。副本(replica)只是一個分片的精確復制,每個分片可以有零個或多個副本。換句話說,Elasticsearch可以有許多相同的分片,其中之一被自動選擇去更改索引操作。這種特殊的分片稱為主分片(primary shard),其余稱為副本分片(replica shard)。在主分片丟失時,例如該分片數據所在服務器不可用,集群將副本提升為新的主分片。

四、關系型數據庫和ElasticSearch中的對應關系
關系型數據庫Elasticsearch
數據庫Database索引Index,支持全文檢索
表Table類型Type
數據行Row文檔Document,但不需要固定結構,不同文檔可以具有不同字段集合
數據列Column字段Field
模式Schema映射Mapping

“Elasticsearch的基本概念和特點”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

广元市| 北川| 乌鲁木齐市| 拜泉县| 阳原县| 宣武区| 昌宁县| 中牟县| 家居| 资中县| 中卫市| 威海市| 湟源县| 郎溪县| 西林县| 叶城县| 都兰县| 通州区| 黄骅市| 大同市| 富锦市| 双牌县| 博爱县| 姚安县| 贵港市| 新泰市| 台州市| 和林格尔县| 徐州市| 苗栗市| 罗甸县| 诸城市| 苏尼特左旗| 友谊县| 永登县| 应用必备| 淮滨县| 全南县| 富宁县| 金秀| 杨浦区|