中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

sphinx中怎么更新增量索引

發布時間:2021-08-10 11:29:54 來源:億速云 閱讀:222 作者:Leah 欄目:大數據

這期內容當中小編將會給大家帶來有關sphinx中怎么更新增量索引,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

實現思路:

需要準備:1》建立一張表,記錄數據最大id值。2》兩個索引

1.先在MySQL中插入一個計數表和兩個索引表

CREATE TABLE sph_counter(    counter_id INTEGER PRIMARY KEY NOT NULL,    max_doc_id INTEGER NOT NULL);

2.修改sphinx.conf
source main_src{

       type                = mysql
       sql_host            = localhost
       sql_user            = yourusername
       sql_pass            = yourpassword
       sql_db              = test   //你所用的數據庫
       sql_port            = 3306 //所用端口,默認是3306
       sql_query_pre       = SET NAMES utf8
       sql_query_pre       = SET SESSION query_cache_type=OFF       
       #下面的語句是更新sph_counter表中的 max_doc_id。       
       sql_query_pre = REPLACE INTO sph_counter SELECT 1, MAX(id) FROM documents

       sql_query = SELECT id, group_id, UNIX_TIMESTAMP(date_added) AS date_added, title,content FROM documents WHERE id<=( SELECT max_doc_id FROM sph_counter WHERE counter_id=1 ) 
}

#注意:delta_src 中的sql_query_pre的個數需和main_src 對應,否則可能搜索不出相應結果
source delta_src: main_src{
         sql_ranged_throttle = 100
         sql_query_pre       = SET NAMES utf8
         sql_query_pre       = SET SESSION query_cache_type=OFF
         sql_query      = SELECT id, group_id, UNIX_TIMESTAMP(date_added) AS date_added, title, content FROM documents WHERE id>( SELECT max_doc_id FROM sph_counter WHERE counter_id=1 )
}

#主索引
index main {
       source           = main_src
       path             = /path/to/main
       #example:   /usr/local/sphinx/var/data/main
       charset_type     = utf-8    #這個是支持中文必須要設置的
       #中文檢索路徑
       chinese_dictionary =/usr/local/mmseg3/etc/       
}

#delta可全部復制主索引,然后更改source 和path如下
#增量索引
index delta: main {
         source = delta_src
         path     = /path/to/delta
         # example:  /usr/local/sphinx/var/data/delta…
         #中文檢索路徑         
       chinese_dictionary =/usr/local/mmseg3/etc/       
}

其它的配置可都用默認的,如果你設置了分布式檢索的索引,那么更改下對應的索引名稱即可。

3.重新建立索引:

 /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf --all --rotate
接下來的問題是如何讓增量索引與主索引合并

4.索引合并
合并兩個已有索引 有時比 重新索引所有數據有效,雖然,索引合并時,待合并的兩個索引都會被讀入內存一次,合并后的內容需寫入磁盤一次,即,合并100GB和1GB的兩個所以,將導致202GB的IO操作
命令原型:  indexer --merge DSTINDEX  SRCINDEX [--rotate]   將SRCINDEX合并到 DSTINDEX ,所以只有DSTINDEX會改變,如果兩個索引都正在提供服務,那么 -- rotate 參數是必須的。例如:將delta合并到main中。
indexer --merge main delta   

5.索引自動更新
需要使用到腳本。
建立兩個腳本:build_main_index.sh 和 build_delta_index.sh.


build_main_index.sh:
#!/bin/sh
# 停止正在運行的searchd
/usr/local/sphinx/bin/searchd -c /usr/local/sphinx/etc/mersphinx.conf  --stop >> /usr/local/sphinx/var/log/sphinx/searchd.log
#建立主索引
/usr/local/sphinx/bin/indexer -c  /usr/local/sphinx/etc/mersphinx.conf main >> /usr/local/sphinx/var/log/sphinx/mainindex.log
#啟動searchd守護程序
/usr/local/sphinx/bin/searchd >> /usr/local/sphinx/var/log/sphinx/searchd.log

build_delta_index.sh

#!/bin/sh
#停止sphinx服務,將輸出重定向
/usr/local/sphinx/bin/searchd –stop >> /usr/local/sphinx/var/log/sphinx/searchd.log
#重新建立索引delta ,將輸出重定向
/usr/local/sphinx/bin/indexer delta –c /usr/local/sphinx/etc/sphinx.conf>>/usr/lcoal/sphinx/var/log/sphinx/deltaindex.log
#將delta合并到main中
/usr/local/sphinx/bin/indexer –merge main delta –c /usr/local/sphinx/etc/sphinx.conf >> /usr/lcoal/sphinx/var/log/sphinx/deltaindex.log
#啟動服務
/usr/local/sphinx/bin/searchd >> /usr/local/sphinx/var/log/sphinx/searchd.log

腳本寫好后,需要編譯 chmod +x filename 這樣才能運行。即
chmod +x build_main_index.sh
chmod +x build_delta_index.sh

最后,我們需要腳本能夠自動運行,以實現,delta索引每5分鐘重新建立,和main索引只在午夜2:30時重新建立。

使用crontab 命令 這有倆個地方可作參考 crontab  crontab文件
crontab -e 來編輯 crontab文件,如果之前沒有使用,會是一個空的文件。寫下下面兩條語句
*/30 * * * *  /bin/sh /usr/local/sphinx/etc/build_delta_index.sh > /dev/null 2>&1
30 2 * * * /bin/sh /usr/local/sphinx/etc/build_main_index.sh > /dev/null 2>&1

第一條是表示每30分鐘運行 /usr/local/sphinx/etc/下的build_delta_index.sh 腳本,輸出重定向。
第二條是表示 每天的 凌晨2:30分運行 /usr/local/sphinx/etc下的build_main_inde.sh 腳本,輸出重定向。
關于前面的 5個值的設置,在上面的crontab文件中有詳細的描述。關于重定向的解釋,請看最上面的Crontab筆記 ,也有crontab的介紹。

保存好后:重新啟動服務
  [root@test1 init.d]# service crond stop
[root@test1 init.d]# service crond start
或者
/etc/init.d/crontab   start

執行計劃任務就可以了,合并索引適合修改數據庫少的情況,如果修改數據庫數據,則需要再次讀取數據庫生成主索引,具體根據業務需求制定計劃。

上述就是小編為大家分享的sphinx中怎么更新增量索引了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

房产| 双流县| 石屏县| 安徽省| 怀来县| 突泉县| 大港区| 乡城县| 辰溪县| 根河市| 武冈市| 丁青县| 车致| 松江区| 赫章县| 平罗县| 萨嘎县| 蓬溪县| 神农架林区| 佳木斯市| 汨罗市| 唐河县| 玉田县| 水富县| 张家港市| 太仓市| 华亭县| 青岛市| 乌拉特后旗| 寻甸| 新田县| 大埔区| 宜丰县| 永昌县| 临洮县| 麦盖提县| 哈密市| 涿州市| 闽侯县| 天台县| 大埔县|