中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

搜索引擎Url自動提交腳本的優化思路

發布時間:2020-07-30 16:40:42 來源:網絡 閱讀:257 作者:kennyluo 欄目:web開發

搜索引擎自動Url鏈接提交腳本

【!!!】待優化改造,通過分析自動提交腳本的流程,抽取提交邏輯,實現輸入Sitemap后機器人自動模擬提交,僅渲染提交業務代碼,或 模擬request請求, 而,無需渲染站點真實頁面,降低資源占用率和業務復雜度,提升自動提交的性能和效率。

百度自動提交腳本:

<script>
(function(){
var bp = document.createElement('script');
var curProtocol = window.location.protocol.split(':')[0];
if (curProtocol === 'https') {
bp.src = 'https://zz.bdstatic.com/linksubmit/push.js';
}
else {
bp.src = 'http://push.zhanzhang.baidu.com/push.js';
}
var s = document.getElementsByTagName("script")[0];
s.parentNode.insertBefore(bp, s);
})();
</script>

360自動收錄代碼:

<script>
(function(){
var src = (document.location.protocol == "http:") ? "http://js.passport.qihucdn.com/11.0.1.js?f757a4cfb88d6de03df10aaac75ebdc5":"https://jspassport.ssl.qhmsg.com/11.0.1.js?f757a4cfb88d6de03df10aaac75ebdc5";
document.write('<script src="' + src + '" id="sozz"><\/script>');
})();
</script>

【優化思路記錄】

(百度JS鏈接推送代碼)
只要把這段代碼放入你的每個頁面中,每當用戶訪問這些頁面時,就會通過這段腳本從百度下載一個1x1的gif,同時記錄頁面此時此刻的URL地址。
自動推送腳本的性能考慮
通過這段腳本我們可以看出:
1、它先是判斷了目前的協議類型是https還是其他類型(如,http,ftp等)
2、然后下載了百度官方的一個js文件
3、再然后它將js文件的內容生成一個腳本塊插入到當前頁面中
4、最后會運行這個腳本塊
我們可以訪問這兩個js文件查看其內容,也就是短短的一行。它會讀取這樣一個gif。
https://sp0.baidu.com/9_Q4simg2RQJ8t7jm9iCKT-xh_/s.gif 或者https://cache.yisu.com/upload/information/20200302/54/8759.jpg
同時將window.location.href等信息推送給了百度。
這里我們可以發現兩個問題:
其一、是這段腳本先后會調用兩個百度資源,這造成了冗余,不利于頁面加載速度。
其二、是該腳本會提交目前URL,但是許多URL會是動態URL,會帶各種參數。雖然百度爬蟲也有自己的判斷方法,但無疑這增加了其負擔。
于是,為了解決這兩個問題,筆者咨詢了好友柴云翔同時是前端開發的大牛。在大牛的幫助下,我們有了下面這個改良版本。
改良版本的百度索引自動推送腳本

這個改良的腳本長下面這樣,。

<link ref=“canonical” href=“http://www.domain.com” > //在各個頁面的Head中定義當前頁完整地址

> <script>
>   (function(){
>       var canonicalURL, curProtocol;
>       //Get the <link> tag
>       var x=document.getElementsByTagName("link");
>       //Find the last canonical URL
>       if(x.length > 0){
>           for (i=0;i<x.length;i++){
>               if(x[i].rel.toLowerCase() == 'canonical' && x[i].href){
>                   canonicalURL=x[i].href;
>               }
>           }
>       }
>       //Get protocol
>       if (!canonicalURL){
>           curProtocol = window.location.protocol.split(':')[0];
>       }
>       else{
>           curProtocol = canonicalURL.split(':')[0];
>       }
>       //Get current URL if the canonical URL does not exist
>       if (!canonicalURL) canonicalURL = window.location.href;
>       //Assign script content. Replace current URL with the canonical URL
>       !function(){var e=/([http|https]:\/\/[a-zA-Z0-9\_\.]+\.baidu\.com)/gi,r=canonicalURL,t=document.referrer;if(!e.test(r)){var n=(String(curProtocol).toLowerCase() === 'https')?"https://cache.yisu.com/upload/information/20200302/54/8758.jpg":"http://api.share.baidu.com/s.gif";t?(n+="?r="+encodeURIComponent(document.referrer),r&&(n+="&l="+r)):r&&(n+="?l="+r);var i=new Image;i.src=n}}(window);})();
> </script>

(改進后的百度索引鏈接自動提交腳本)
在上圖中已加入了注釋,下面開始代碼解說。
canonical屬性表示該頁面縱有千種URL的花樣,請搜索引擎只認準href中給出的URL值
這個新腳本的作用是多了一步查看頁面的canonical URL的步驟。我們知道。這樣一來就不會讓搜索引擎為了同一個頁面(或許已經索引了)多次檢查你的推送頁面具體內容。
這個新腳本的另一個更改是直接將上述兩個js的內容拿了出來。由于這兩個js中的代碼其實是靜態的,每次都去調用并不必要。另一方面,我們需要對r的值進行更改,將它更改為canonical URL的值,因此這樣解決了我們上面的第二個問題。
最后,一點感想
自動推送是一個很實用的方法,它門檻低,容易部署,但是也有一些小問題。本文只是提供了一種方法來改進自動推送的效率和效果。
需要注意的是百度隨時可能更新這兩個js文件的內容,雖然該功能上線后一直沒有更新不代表以后不會更新,因此需要手動及時更新代碼。
關于更新的問題,可以利用nginx的cache能力,定義更新頻率解決

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

开平市| 梁平县| 扶沟县| 观塘区| 大城县| 白山市| 双江| 万荣县| 苏尼特右旗| 陵川县| 嘉峪关市| 东阿县| 博爱县| 通化县| 宜州市| 兴城市| 文安县| 乌拉特前旗| 宝应县| 玉龙| 阜宁县| 万盛区| 上林县| 招远市| 工布江达县| 云阳县| 赤城县| 淮南市| 化州市| 太康县| 湖北省| 萍乡市| 濉溪县| 盐山县| 务川| 昌都县| 新津县| 遂川县| 翁牛特旗| 阿鲁科尔沁旗| 新余市|