您好,登錄后才能下訂單哦!
Elasticsearch6.0中如何使用 IKAnalysis分詞,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
如果是集群模式,則每個節點都需要安裝ik分詞,安裝插件完畢后需要重啟服務,創建mapping前如果有機器未安裝分詞,則可能該索引可能為RED,需要刪除后重建。
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.0.0/elasticsearch-analysis-ik-6.0.0.zip
可以使用CURL命令,6.0版本+也可以在Kibana插件x-pack的DevTools中進行調試API
curl -XPUT http://localhost:9200/index
curl -XPOST http://localhost:9200/index/fulltext/1 -d' {"content":"美國留給伊拉克的是個爛攤子嗎"} ' curl -XPOST http://localhost:9200/index/fulltext/2 -d'
{"content":"公安部:各地校車將享最高路權"} ' curl -XPOST http://localhost:9200/index/fulltext/3 -d' {"content":"中韓漁警沖突調查:韓警平均每天扣1艘中國漁船"} ' curl -XPOST http://localhost:9200/index/fulltext/4 -d' {"content":"中國駐洛杉磯領事館遭亞裔男子槍擊 嫌犯已自首"} '
IK支持自定義配置詞庫,配置文件在config文件夾下的analysis-ik/IKAnalyzer.cfg.xml,字典文件也在同級目錄下,可以支持多個選項的配置,ext_dict-自定義詞庫,ext_stopwords-屏蔽詞庫。
同時還支持熱更新配置,配置remote_ext_dict為http地址,輸入一行一個詞語,注意文檔格式要為UTF8無BOM格式,如果詞庫發生更新,只需要更新response header中任意一個字段Last-Modified或ETag即可。
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"><properties> <comment>IK Analyzer 擴展配置</comment> <!--用戶可以在這里配置自己的擴展字典 --> <entry key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry> <!--用戶可以在這里配置自己的擴展停止詞字典--> <entry key="ext_stopwords">custom/ext_stopword.dic</entry> <!--用戶可以在這里配置遠程擴展字典 --> <entry key="remote_ext_dict">location</entry> <!--用戶可以在這里配置遠程擴展停止詞字典--> <entry key="remote_ext_stopwords">http://xxx.com/xxx.dic</entry></properties>
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。