麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 服務器 > Linux服務器 > 正文

linux下5條提取百度蜘蛛Apache日志的命令

2024-09-05 23:01:05
字體:
來源:轉載
供稿:網友

考慮到平時要做優化,看百度爬蟲到底爬取了哪些目錄,哪些鏈接或目錄被爬取的次數比較少,以便對頁面的鏈接做nofollow,robots.txt等屏蔽處理,引導爬蟲抓取哪些需要被爬取的頁面,提升整體的收錄率。

總結了用的較多幾條命令:

提取Apache日志百度蜘蛛的相關爬行記錄

1. 百度蜘蛛爬行的次數 cat access_log | grep Baiduspider+ | wc 最左面的數值顯示的就是爬行次數。

2. 百度蜘蛛的詳細記錄(Ctrl+C可以終止) cat access_log | grep Baiduspider+ 也可以用下面的命令: cat access_log | grep Baiduspider+ | tail -n 10 cat access_log | grep Baiduspider+ | head -n 10 只看最后10條或最前10條,這用就能知道這個日志文件的開始記錄的時間和日期。

3. 百度蜘蛛抓取首頁的詳細記錄 cat access_log | grep Baiduspider+ | grep “GET / HTTP”

4. 百度蜘蛛派性記錄時間點分布 cat access_log | grep “Baiduspider+” | awk ‘{print $4}’

5. 百度蜘蛛爬行頁面按次數降序列表 cat access_log | grep “Baiduspider+” | awk ‘{print $7}’ | sort | uniq -c | sort

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 国产精品久久久久久久久久iiiii | 精品国产乱码久久久久久久久 | 激情视频免费观看 | 久久国产成人午夜av浪潮 | 国产精品1区2区在线观看 | 成人一级黄色片 | 中文字幕在线免费观看电影 | av手机在线免费播放 | 一色桃子av大全在线播放 | 久久人人av | 91九色网址| 国产在线精品91 | 国产亚洲精品久久久闺蜜 | 国产精品av久久久久久网址 | 精品亚洲国产视频 | 国内久久久久 | 精品一二三区视频 | 国内精品久久久久久久影视红豆 | 午夜小电影| 亚洲国产视频网 | 久久sp| 国产精品v片在线观看不卡 成人一区二区三区在线 | 欧美囗交| 91九色精品| 草操影院 | 国产精品成人亚洲一区二区 | 久久婷婷一区二区三区 | 91成人免费网站 | 国产99视频在线观看 | 欧日韩 | 中文字幕精品一区久久久久 | 97视频一二区 | 最新av在线免费观看 | 欧美四级在线观看 | 成人免费看片a | 在线观看一区二区三区四区 | 久久久精品网 | 欧美激情精品久久久久久黑人 | 国产在线精品一区二区三区 | 成人黄色小视频网站 | 加勒比色综合 |