.新建一個采集項目:
1.基本設置
查看其源代碼 (這里演示的是采集自己的本機上網站),找到用戶登錄的那段代碼:比如動易的有兩種登錄情況:
a.網站首頁,是這里 http://l27.0.0.1/II/UserLogin.asp 填入登錄地址框里就行了;
b.是單獨的用戶登錄窗口,這種就比較方便,直接把瀏覽器上的地址復制下來,填入登錄地址框就行了(上面第二 個圖).
提交地址: 這里獲取地址的最簡單方法是,在對方網站登錄時隨便輸入一個錯誤的用戶名和密碼,點登錄后,這時一般都會出現一個提示登錄不正確的頁面,把這個頁面的地址復制下來就行了.
用戶參數和密碼參數: 參照圖片上的設置,要改的只是把 "=" 后面改成正確的登錄參數
失敗信息: 這里是把登錄出錯時的頁面上的信息提示復制下來,如下圖示例:
/II/Article/ShowClass.asp?ClassID=5&page=2
分頁設置里的另外兩個設置 批量生成 已經有示例說明,這里不再寫出; 手動添加 是當列表的分頁出現不能設置的情況下,手工直接在輸入框里添加上列表的每個分頁的鏈接代碼.
鏈接設置
找到某一個文章標題的鏈接段代碼,如圖示
/II/Article/ShowArticle.asp?ArticleID=65
所以在這步,我們把這個鏈接地址的頭尾分別截取下來,以使系統正確獲取鏈接地址,如下圖示:
3. 分頁設置 :當正文里出現有分頁的時候,就要用到這個設置,先看下這篇文章的分頁情況:
2. 文章設置:設置將采集的文章的相關屬性(和添加文章時的設置一樣)
3. 收費設置:設置將采集的文章的收費屬性(和添加文章時的設置一樣)
|
新聞熱點
疑難解答
圖片精選