麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > Regex > 正文

Java用正則表達(dá)式如何讀取網(wǎng)頁內(nèi)容

2020-03-16 21:02:17
字體:
供稿:網(wǎng)友

java用正則表達(dá)式讀取網(wǎng)頁內(nèi)容,通過抓取文章標(biāo)題及內(nèi)容,進(jìn)一步專區(qū)整個(gè)頁面的全部內(nèi)容,本文代碼簡單易懂,對java用正則表達(dá)式讀取網(wǎng)頁內(nèi)容感興趣的朋友可以參考下

學(xué)習(xí)java的正則表達(dá)式,抓取網(wǎng)頁并解析HTML部分內(nèi)容

 

 
  1. package com.xiaofeng.picup; 
  2. import java.io.BufferedReader; 
  3. import java.io.IOException; 
  4. import java.io.InputStreamReader; 
  5. import java.net.MalformedURLException; 
  6. import java.net.URL; 
  7. import java.util.ArrayList; 
  8. import java.util.HashMap; 
  9. import java.util.List; 
  10. import java.util.regex.Matcher; 
  11. import java.util.regex.Pattern; 
  12. /** *//** 
  13. * 
  14. * @抓取頁面文章標(biāo)題及內(nèi)容(測試) 手動輸入網(wǎng)址抓取,可進(jìn)一步自動抓取整個(gè)頁面的全部內(nèi)容 
  15. * 
  16. */ 
  17. public class WebContent ...{ 
  18. /** *//** 
  19. * 讀取一個(gè)網(wǎng)頁全部內(nèi)容 
  20. */ 
  21. public String getOneHtml(String htmlurl) throws IOException...{ 
  22. URL url; 
  23. String temp; 
  24. StringBuffer sb = new StringBuffer(); 
  25. try ...{ 
  26. url = new URL(htmlurl); 
  27. BufferedReader in = new BufferedReader(new InputStreamReader(url 
  28. .openStream(), "utf-8"));// 讀取網(wǎng)頁全部內(nèi)容 
  29. while ((temp = in.readLine()) != null) ...{ 
  30. sb.append(temp); 
  31. in.close(); 
  32. }catch(MalformedURLException me)...{ 
  33. System.out.println("你輸入的URL格式有問題!請仔細(xì)輸入"); 
  34. me.getMessage(); 
  35. throw me; 
  36. }catch (IOException e) ...{ 
  37. e.printStackTrace(); 
  38. throw e; 
  39. return sb.toString(); 
  40. /** *//** 
  41. * 
  42. * @param s 
  43. * @return 獲得網(wǎng)頁標(biāo)題 
  44. */ 
  45. public String getTitle(String s) ...{ 
  46. String regex; 
  47. String title = ""
  48. List<String> list = new ArrayList<String>(); 
  49. regex = "<title>.*?</title>"
  50. Pattern pa = Pattern.compile(regex, Pattern.CANON_EQ); 
  51. Matcher ma = pa.matcher(s); 
  52. while (ma.find()) ...{ 
  53. list.add(ma.group()); 
  54. for (int i = 0; i < list.size(); i++) ...{ 
  55. title = title + list.get(i); 
  56. return outTag(title); 
  57. /** *//** 
  58. * 
  59. * @param s 
  60. * @return 獲得鏈接 
  61. */ 
  62. public List<String> getLink(String s) ...{ 
  63. String regex; 
  64. List<String> list = new ArrayList<String>(); 
  65. regex = "<a[^>]*href=("([^"]*)"|'([^']*)'|([^s>]*))[^>]*>(.*?)</a>"; 
  66. Pattern pa = Pattern.compile(regex, Pattern.DOTALL); 
  67. Matcher ma = pa.matcher(s); 
  68. while (ma.find()) ...{ 
  69. list.add(ma.group()); 
  70. return list; 
  71. /** *//** 
  72. * 
  73. * @param s 
  74. * @return 獲得腳本代碼 
  75. */ 
  76. public List<String> getScript(String s) ...{ 
  77. String regex; 
  78. List<String> list = new ArrayList<String>(); 
  79. regex = "<script.*?</script>"
  80. Pattern pa = Pattern.compile(regex, Pattern.DOTALL); 
  81. Matcher ma = pa.matcher(s); 
  82. while (ma.find()) ...{ 
  83. list.add(ma.group()); 
  84. return list; 
  85. /** *//** 
  86. * 
  87. * @param s 
  88. * @return 獲得CSS 
  89. */ 
  90. public List<String> getCSS(String s) ...{ 
  91. String regex; 
  92. List<String> list = new ArrayList<String>(); 
  93. regex = "<style.*?</style>"
  94. Pattern pa = Pattern.compile(regex, Pattern.DOTALL); 
  95. Matcher ma = pa.matcher(s); 
  96. while (ma.find()) ...{ 
  97. list.add(ma.group()); 
  98. return list; 
  99. /** *//** 
  100. * 
  101. * @param s 
  102. * @return 去掉標(biāo)記 
  103. */ 
  104. public String outTag(String s) ...{ 
  105. return s.replaceAll("<.*?>"""); 

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 中文字幕在线观看日韩 | 一级黄色在线观看 | av电影在线观看网站 | 在线看免电影网站 | 国产一区日韩一区 | 牛牛碰在线视频 | 久久国产免费视频 | 国产a级网站 | 毛片毛片| 99精品视频免费看 | 久久久久久久久成人 | 久久精品超碰 | 亚洲一二三久久 | 久久福利小视频 | 久章草在线视频 | 强伦女教师视频 | 九九热精品在线 | 亚洲国产高清自拍 | 国产精品18久久久久久久 | 中文字幕一区二区三区久久 | 天天操很很操 | 狠狠干91 | 国产精品9191| 久久老司机 | 一级黄色淫片 | 免费观看又色又爽又黄的崩锅 | 看免费一级毛片 | 日本一区视频在线观看 | 人人看人人舔 | 1级黄色毛片 | 免费视频xxxx | 色天使中文字幕 | 欧美成人三级视频 | 国产精品成人久久 | 97风流梦电影 | 草久影视| 黄色特级视频 | 日本a∨精品中文字幕在线 欧美1—12sexvideos | 欧洲黄色一级视频 | 视频一区二区在线观看 | 成人性视频在线 |