之前一直在關(guān)注句子迷這個(gè)網(wǎng)站,在里面可以找到自己喜歡的名人的金典語(yǔ)錄。 每一次都去打開(kāi),再去翻頁(yè)查看太煩,有沒(méi)有什么方法可以把網(wǎng)站中的句子直接抓出來(lái),保存到本地txt文件中? 然后在網(wǎng)上查看了一些資料,自己動(dòng)手寫(xiě)了一個(gè)控制臺(tái)應(yīng)用程序。
步驟1:通過(guò)HttpWebResponse發(fā)送一個(gè)請(qǐng)求,將整個(gè)HTML頁(yè)面請(qǐng)求過(guò)來(lái),將全部數(shù)據(jù)讀入StreamReader中,下圖html代碼 步驟2:將讀入流中的數(shù)據(jù)進(jìn)行處理,只取包含句子的文本,這里面需要查詢頁(yè)面的中html。
在取文本的過(guò)程中,使用正則表達(dá)式,取出想要的數(shù)據(jù)
步驟3:對(duì)上面的標(biāo)簽,在進(jìn)一步進(jìn)行提取
Regex objRegExp = new Regex("<(.|/n)+?>");本地保存路徑,及打開(kāi)文件效果:
|
新聞熱點(diǎn)
疑難解答
圖片精選
網(wǎng)友關(guān)注