麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 學院 > 開發設計 > 正文

基于Java的數據采集(一)

2019-11-14 20:50:19
字體:
來源:轉載
供稿:網友
基于java的數據采集(一)

之前寫過2篇關于php數據采集入庫的文章:

基于PHP數據采集入庫(一):http://www.companysz.com/lichenwei/p/3872307.html

基于PHP數據采集入庫(二):http://www.companysz.com/lichenwei/p/3873281.html

《基于Java的數據采集(二)》:http://www.companysz.com/lichenwei/p/3905370.html

《基于Java數據采集入庫(三)》:http://www.companysz.com/lichenwei/p/3907007.html

《基于Java數據采集入庫(終結篇)》:http://www.companysz.com/lichenwei/p/3910492.html

其實采集的原理都是一樣的:遠程獲取信息->提取所需內容(正則)->分類存儲->讀取->展示

用什么編程語言沒所謂,編程語言只是種工具

這次來采集一個足球網站的數據:http://www.footballresults.org/league.php?league=EngDiv1

下圖是我們要采集的數據:

好了,關于采集原理就看上面那2篇文章吧,剩下的直接上代碼:

GerData.java(采集數據方法封裝)

其實也就是簡單的匹配正則:

group():返回在以前匹配操作期間由給定組捕獲的輸入子序列。

find():嘗試查找與該模式匹配的輸入序列的下一個子序列。

 1 package com.lcw.curl;
 2  3 import java.util.regex.Matcher; 4 import java.util.regex.Pattern; 5  6 public class GetData { 7      8     /** 9      * 10      * @param regex 正則表達式11      * @param content 所要匹配的內容12      * @return13      */14     public String getData(String regex,String content){15         Pattern pattern=Pattern.compile(regex, Pattern.CASE_INSENSITIVE);//設定正則表達式,不區分大小寫16         Matcher matcher=pattern.matcher(content);17         if(matcher.find()){18             return matcher.group();19         }else{20             return "";21         }22     }23 24 }

CurlMain.java(主程序)

InputStreamReader()是字節流通向字符流的橋梁。

InputStreamReader()是字節流通向字符流的橋梁。

openStream()打開到此URL的連接并返回一個用于從該連接讀入的字節流。

 1 package com.lcw.curl; 2  3 import java.io.BufferedReader; 4 import java.io.InputStreamReader; 5 import java.net.URL; 6  7  8 public class CurlMain { 9 10     /**11      * @param args12      */13     public static void main(String[] args) {14         try {15             String address="http://www.footballresults.org/league.php?league=EngDiv1";16             URL url=new URL(address);17             InputStreamReader inputStreamReader=new InputStreamReader(url.openStream(),"utf-8");//打開地址,以UTF-8編碼的形式返回字節并轉為字符18             BufferedReader bufferedReader=new BufferedReader(inputStreamReader);//從字符輸入流中讀取文本,緩沖各個字符,從而提供字符、數組和行的高效讀取。19             20             GetData data=new GetData();21             String content="";//用來接受每次讀取的行字符22             int flag=0;//標志,隊伍信息剛好在日期信息后面,則正則相同,用于分離數據23             String dateRegex="http://d{1,2}//.//d{1,2}//.//d{4}";//日期匹配正則表達式24             String teamRegex=">[^<>]*</a>";//隊伍匹配正則表達式25             String scoreRegex=">(//d{1,2}-//d{1,2})</TD>";//比分正則表達式26             int i=0;//記錄信息條數27             28             while((content=bufferedReader.readLine())!=null){//每次讀取一行數據29                 //獲取比賽日期信息30                 String dateInfo=data.getData(dateRegex, content);31                 if(!dateInfo.equals("")){32                     System.out.

數據輕松采集,效果如下圖:


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 亚洲小视频在线 | 羞羞网站 | av国产在线被下药迷网站 | 精品国产乱码一区二区 | 亚洲精品久久久久久 | 原来神马影院手机版免费 | 激情黄页 | 久久精品国产99久久6动漫亮点 | 中文字幕在线观看免费视频 | 成人免费观看在线视频 | 欧美不卡 | 羞羞网站在线观看入口免费 | 黄色一级片在线免费观看 | 99亚洲| 激情大乳女做爰办公室韩国 | 一级免费在线视频 | 国产91在线免费 | 麻豆视频免费网站 | 国产男女 爽爽爽爽视频 | 久久免费视频精品 | 成人国产视频在线观看 | 色骚综合 | 久久精品视频国产 | 亚洲aⅴ免费在线观看 | 久久国产精品二区 | 免费一级欧美大片视频在线 | 91九色免费视频 | 久久久久免费精品国产小说色大师 | 在线观看91精品 | 毛片在线免费观看视频 | xnxx 美女19 | 久久久看| 国产精品亚洲综合一区二区三区 | 成人在线视频播放 | 日韩一级毛毛片 | 欧美一级黄色录像片 | 欧美18videos性处按摩 | 九九热精品视频在线播放 | 黄色电影免费网址 | 激情小视频在线观看 | 毛片网站视频 |