之前一直在關注句子迷這個網站,在里面可以找到自己喜歡的名人的金典語錄。 每一次都去打開,再去翻頁查看太煩,有沒有什么方法可以把網站中的句子直接抓出來,保存到本地txt文件中? 然后在網上查看了一些資料,自己動手寫了一個控制臺應用程序。
步驟1:通過HttpWebResponse發送一個請求,將整個HTML頁面請求過來,將全部數據讀入StreamReader中,下圖html代碼 步驟2:將讀入流中的數據進行處理,只取包含句子的文本,這里面需要查詢頁面的中html。
在取文本的過程中,使用正則表達式,取出想要的數據
步驟3:對上面的標簽,在進一步進行提取
Regex objRegExp = new Regex("<(.|/n)+?>");本地保存路徑,及打開文件效果:
新聞熱點
疑難解答