Mongodb是針對(duì)大數(shù)據(jù)量環(huán)境下誕生的用于保存大數(shù)據(jù)量的非關(guān)系型數(shù)據(jù)庫,針對(duì)大量的數(shù)據(jù),如何進(jìn)行統(tǒng)計(jì)操作至關(guān)重要,那么如何從Mongodb中統(tǒng)計(jì)一些數(shù)據(jù)呢?
在Mongodb中,給我們提供了三種用于數(shù)據(jù)聚合的方式:
(1)簡單的用戶聚合函數(shù);
(2)使用aggregate進(jìn)行統(tǒng)計(jì);
(3)使用mapReduce進(jìn)行統(tǒng)計(jì);
今天我們首先來講講mapReduce是如何統(tǒng)計(jì),在后續(xù)的文章中,將另起文章進(jìn)行相關(guān)說明。
MapReduce是啥呢?以我的理解,其實(shí)就是對(duì)集合中的各個(gè)滿足條件的文檔進(jìn)行預(yù)處理,整理出想要的數(shù)據(jù)然后進(jìn)行統(tǒng)計(jì)得到最終的統(tǒng)計(jì)結(jié)果。其中map函數(shù)用于對(duì)集合中的各個(gè)滿足條件的文檔進(jìn)行預(yù)處理,整理出想要的數(shù)據(jù)。Reduce函數(shù)用于對(duì)整理出的數(shù)據(jù)進(jìn)行處理得到統(tǒng)計(jì)結(jié)果。Map函數(shù)和Reduce函數(shù)都是JavaScript函數(shù)。
首先,我們先構(gòu)造一個(gè)測試數(shù)據(jù)集test,使用js腳本往集合中隨機(jī)插入一組數(shù)據(jù),每條記錄是哪個(gè)人花了多少錢買了什么東西。具體腳本test1.js如下:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;">for( var i=0; i<100; i++){ var rID=Math.floor(Math.random()*10); var price = parseFloat((Math.random()*10).toFixed(2)); if(rID<3){ db.test.insert({"user":"majing","sku":rID,"price":price}); } else if(rID>=3 && rID<5){ db.test.insert({"user":"wufenglei","sku":rID,"price":price}); } else if(rID>=5 && rID<8){ db.test.insert({"user":"wufenglei","sku":rID,"price":price}); } else { db.test.insert({"user":"liyonghu","sku":rID,"price":price}); } }</span></span>
接下來我們通過在控制臺(tái)執(zhí)行腳本來向數(shù)據(jù)庫插入具體的數(shù)據(jù),具體執(zhí)行指令如下:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;">mongo 127.0.0.1:27017/test J:/test1.js</span></span>
執(zhí)行之后,通過MongoVUE來查看下具體的數(shù)據(jù),如下所示,數(shù)據(jù)已經(jīng)插入到集合中了:
接下來,我們可以做幾個(gè)簡單的統(tǒng)計(jì)操作了。
(1)統(tǒng)計(jì)不同用戶都買了多少個(gè)商品?編寫js腳本test2.js,將結(jié)果保存到statis1集合中。
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;">map=function(){ emit(this.user,1); } reduce=function(key, values){ var count = 0; values.forEach(function(val){count += val}); return count; } db.test.mapReduce(map, reduce, {out:"statics1"});</span></span></span>
按照剛才執(zhí)行腳本的方式執(zhí)行test2.js,并查看數(shù)據(jù):
從數(shù)據(jù)庫就可以直觀看到統(tǒng)計(jì)數(shù)據(jù)了,若想查看某個(gè)人如majing購買了多少個(gè)商品,直接使用
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;"><span style="font-family:KaiTi_GB2312;font-size:18px;">db.statics1.find({"_id":"majing"});</span></span></span></span>
(2)統(tǒng)計(jì)每個(gè)用戶購買的每個(gè)商品的數(shù)量情況
腳本test3.js如下所示:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;">map=function(){ emit({user:this.user,sku:this.sku},1); } reduce=function(key, values){ var count = 0; values.forEach(function(val){count += val}); return count; } db.test.mapReduce(map, reduce, {out:"statics2"});</span></span></span>
按照剛才執(zhí)行腳本的方式執(zhí)行test3.js,并查看數(shù)據(jù):
總共返回了10條記錄。此時(shí)如果我們想查找某個(gè)用戶購買商品的情況,可以使用下面的查詢方法:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;">db.statics2.find({"_id.user":"majing"});</span></span></span>
如果我們想查找某個(gè)用戶購買某個(gè)商品的情況,可以使用下面的查詢方法:
(3)統(tǒng)計(jì)每個(gè)用戶購買商品的總量及花費(fèi)的總金額
腳本test4.js如下所示:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;">map=function(){ emit({user:this.user},{totalprice:this.price,count:1}); } reduce=function(key, values){ var res = {totalprice:0.00,count:1}; values.forEach(function(val){res.totalprice += val.totalprice;res.count+=val.count;}); return res; } db.test.mapReduce(map, reduce, {out:"statics3"});</span></span></span>
按照剛才執(zhí)行腳本的方式執(zhí)行test4.js,并查看數(shù)據(jù):
(4)統(tǒng)計(jì)每個(gè)用戶購買商品的平均價(jià)錢
在這個(gè)情景下,我們需要用到說道m(xù)apReduce里的另一個(gè)參數(shù)finalize,該參數(shù)是一個(gè)javascript腳本函數(shù),用于對(duì)reduce后的集合進(jìn)行一個(gè)后期處理操作。
執(zhí)行腳本test5.js,具體如下所示:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;">map=function(){ emit({user:this.user},{totalprice:this.price,count:1}); } reduce=function(key, values){ var res = {totalprice:0.00,count:1,average:0}; values.forEach(function(val){res.totalprice += val.totalprice;res.count+=val.count;}); return res; } finalizeFunc=function(key,reduceResult){ reduceResult.totalprice=(reduceResult.totalprice).toFixed(2); reduceResult.average=(reduceResult.totalprice/reduceResult.count).toFixed(2); return reduceResult; } db.test.mapReduce(map, reduce, {out:"statics4",finalize:finalizeFunc});</span></span></span>
執(zhí)行之后查看得到的數(shù)據(jù),具體如下所示,顯示了總價(jià)錢,商品數(shù)量和商品單價(jià)。
如果想查找某個(gè)人的,可以和上面的查詢方法一樣,使用find()方法進(jìn)行查詢:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;">db.statics4.find({"_id.user":"majing"});</span></span></span>
以上通過4個(gè)簡單的例子對(duì)Mongodb中的MapReduce進(jìn)行了簡單的說明,當(dāng)然MapReduce功能很強(qiáng)大,大家如果想知道其他高級(jí)的使用方法,可以到Mongodb的官網(wǎng)進(jìn)行查閱和學(xué)習(xí),網(wǎng)址為
https://docs.mongodb.com/manual/reference/method/db.collection.mapReduce/ 謝謝。
以上所述是小編給大家介紹的Mongodb中MapReduce實(shí)現(xiàn)數(shù)據(jù)聚合方法詳解,希望對(duì)大家有所幫助,如果大家有任何疑問請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)武林網(wǎng)網(wǎng)站的支持!
新聞熱點(diǎn)
疑難解答