在线亚洲男人的天堂a∨_中国毛片区免费区_伊人久久中文大香线蕉综合_久了精品国产99国产精

將想法與焦點和您一起共享

Linux/Nginx查看搜索引擎蜘蛛爬蟲的行為發(fā)布者:本站     時間:2020-05-14 15:05:20

做好網站SEO優(yōu)化的第一步就是首先讓蜘蛛爬蟲經常來你的網站進行光顧,下面的Linux命令可以讓你清楚的知道蜘蛛的爬行情況。下面我們針對nginx服務器進行分析,日志文件所在目錄:/usr/local/nginx/logs/access.log,access.log這個文件記錄的應該是最近一天的日志情況,首先請看看日志大小,如果很大(超過50MB)建議別用這些命令分析,因為這些命令很消耗CPU,或者更新下來放到分析機上執(zhí)行,以免影響網站的速度。

Linux shell命令

1. 百度蜘蛛爬行的次數

cat access.log | grep Baiduspider | wc

最左面的數值顯示的就是爬行次數。

2. 百度蜘蛛的詳細記錄(Ctrl C可以終止)

cat access.log | grep Baiduspider

也可以用下面的命令:

cat access.log | grep Baiduspider | tail -n 10

cat access.log | grep Baiduspider | head -n 10

只看最后10條或最前10條,這用就能知道這個日志文件的開始記錄的時間和日期。

3. 百度蜘蛛抓取首頁的詳細記錄

cat access.log | grep Baiduspider | grep “GET / HTTP”

百度蜘蛛好像對首頁非常熱愛每個鐘頭都來光顧,而谷歌和雅虎蜘蛛更喜歡內頁。

4. 百度蜘蛛派性記錄時間點分布

cat access.log | grep “Baiduspider ” | awk ‘{print $4}’

5. 百度蜘蛛爬行頁面按次數降序列表

cat access.log | grep “Baiduspider ” | awk ‘{print $7}’ | sort | uniq -c | sort -r

文中的Baiduspider 改成Googlebot都可以查看谷歌的數據,鑒于大陸的特殊性,大家應該對百度的log更為關注。

附:(Mediapartners-Google)Google adsense蜘蛛的詳細爬行記錄

cat access.log | grep Mediapartners

Mediapartners-Google是什么呢?Google adsense廣告之所以能與內容相關,因為每個包含著adsense的廣告被訪問后,很快就有個Mediapartners-Google蜘蛛來到這個頁面,所以幾分鐘后再刷新就能顯示相關性廣告了,真厲害??!



選擇我們,優(yōu)質服務,不容錯過
1. 優(yōu)秀的網絡資源,強大的網站優(yōu)化技術,穩(wěn)定的網站和速度保證
2. 15年上海網站建設經驗,優(yōu)秀的技術和設計水平,更放心
3. 全程省心服務,不必擔心自己不懂網絡,更省心。
------------------------------------------------------------
24小時聯(lián)系電話:021-58370032