1.登陸后臺 點擊 ”內容治理” 在選擇 “采集治理”。此主題相關圖片如下:
2.在“采集治理向導”中選擇 “添加采集項目”。此主題相關圖片如下:
3.采集項目設置 這里我們以采集www.54it.com.cn億訊網絡學院中的c#板塊為例子
此主題相關圖片如下:
注:編碼選擇 為我們提供了三種編碼方式(指的是將要采集的網站的編碼)。怎么樣才能知道將要采集網站的編碼方式呢?答案是查看對方的源代碼。
<title>億訊網絡 >> 學院 >> 程序開發 >> C#語言</title>
<meta http-equiv="Content-Type" content="text ml; charset=gb2312">
上面的代碼一看就明白對方采用的是GB2312那么我在這里也選擇GB2312。
4.列表頁采集設置
4.1獲取列表頁
此主題相關圖片如下:
點擊“測試列表”按鈕 左邊的源碼文本框中按照規則截取相應的源代碼。此主題相關圖片如下:
新聞熱點
疑難解答
圖片精選