麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 數據庫 > MongoDB > 正文

MongoDB分片是什么?一文帶你深入明白MongoDB分片

2024-09-07 00:22:31
字體:
來源:轉載
供稿:網友
       MongoDB分片是什么?很多剛接觸MongoDB數據庫的朋友可能對于MongoDB分片不是很清楚,下面小編就給大家介紹一下MongoDB分片的相關內容,感興趣的朋友可以了解一下。
 
       分片是MongoDB的擴展方式,通過分片能夠增加更多的機器來用對不斷增加的負載和數據,還不影響應用.
 
       1.分片簡介
 
       分片是指將數據拆分,將其分散存在不同機器上的過程.有時也叫分區.將數據分散在不同的機器上,不需要功能強大的大型計算機就可以存儲更多的數據,處理更大的負載。使用幾乎所有數據庫軟件都能進行手動分片,應用需要維護與若干不同數據庫服務器的連接,每個連接還是完全獨立的。應用程序管理不同服務器上的不同數據,存儲查村都需要在正確的服務器上進行.這種方法可以很好的工作,但是也難以維護,比如向集群添加節點或從集群刪除節點都很困難,調整數據分布和負載模式也不輕松。MongoDB支持自動分片,可以擺脫手動分片的管理.集群自動切分數據,做負載均衡.
 
        2.MongoDB的自動分片
 
       MongoDB分片的基本思想就是將集合切分成小塊.這些塊分散到若干片里面,每個片只負責總數據的一部分.應用程序不必知道哪片對應哪些數據,甚至不需要知道數據已經被拆分了,所以在分片之前要運行一個路由進程,進程名mongos,這個路由器知道所有數據的存放位置,所以應用可以連接它來正常發送請求.對應用來說,它僅知道連接了一個普通的mongod.路由器知道和片的對應關系,能夠轉發請求到正確的片上.如果請求有了回應,路由器將其收集起來回送給應用.在沒有分片的時候,客戶端連接mongod進程,分片時客戶端會連接mongos進程.mongos對應用隱藏了分片的細節.
 
       從應用的角度看,分片和不分片沒有區別.所以需要擴展的時候,不必修改應用程序的代碼。不分片的客戶端連接:
 
       分片的客戶端連接:
 
       什么時候需要分片:
 
       a.機器的磁盤不夠用了
 
       b.單個mongod已經不能滿足些數據的性能需要了
 
       c.想將大量數據放在內存中提高性能
 
       一般來說,先要從不分片開始,然后在需要的時候將其轉換成分片.
 
       3.片鍵
 
       設置分片時,需要從集合里面選一個鍵,用該鍵的值作為數據拆分的依據.這個鍵成為片鍵.假設有個文檔集合表示的是人員,如果選擇名字"name"做為片鍵,第一篇可能會存放名字以A-F開頭的文檔.第二片存G-P開頭的文檔,第三篇存Q-Z的文檔.隨著增加或刪除片,MongoDB會重新平衡數據,是每片的流量比較均衡,數據量也在合理范圍內(如流量較大的片存放的數據或許會比流量下的片數據要少些)
 
        4.將已有的集合分片假設有個存儲日志的集合,現在要分片.我們開啟分片功能,然后告訴MongoDB用"timestamp"作為片鍵,就要所有數據放到了一個片上.可以隨意插入數據,但總會是在一個片上.然后,新增一個片.這個片建好并運行了以后,MongoDB就會把集合拆分成兩半,成為塊.每個塊中包含片鍵值在一定范圍內的所有文檔,假設其中一塊包含時間戳在2011.11.11前的文檔,則另一塊含有2011.11.11以后的文檔.其中一塊會被移動到新片上.如果新文檔的時間戳在2011.11.11之前,則添加到第一塊,否則添加到第二塊.
 
        5.遞增片鍵還是隨機片鍵
 
       片鍵的選擇決定了插入操作在片之間的分布.如果選擇了像"timestamp"這樣的鍵,這個值可能不斷增長,而且沒有太大的間斷,就會將所有數據發送到一個片上(含有2011.11.11以后日期的那片).如果有添加了新片,再拆分數據,還是會都導入到一臺服務器上.添加了新片,MongoDB肯能會將2011.11.11以后的拆分成2011.11.11-2021.11.11.如果文檔的時間大于2021.11.11以后,所有的文檔還會以最后一片插入.這就不適合寫入負載很高情況,但按照片鍵查詢會非常高效。
 
       如果寫入負載比較高,想均勻分散負載到各個片,就得選擇分布均勻的片鍵。日志例子中時間戳的散列值,沒有模式的"logMessage"都是復合這個條件的.不論片鍵隨機跳躍還是穩定增加,片鍵的變化很重要.如,如果有個"logLevel"鍵的值只有3種值"DEBUG","WARN","ERROR",MongoDB無論如何也不能把它作為片鍵將數據分成多于3片(因為只有3個值).如果鍵的變化太少,但又想讓其作為片鍵,可以把這個鍵與一個變化較大的鍵組合起來,創建一個復合片鍵,如"logLevel"和"timestamp"組合.選擇片鍵并創建片鍵很像索引,以為二者原理相似.事實上,片鍵也是最常用的索引.
 
        6.片鍵對操作的影響
 
       最終用戶應該無法區分是否分片,但是要了解選擇不同片鍵情況下的查詢有何不同.
 
       假設還是那個表示人員的集合,按照"name"分片,有3個片,其名字首字母的范圍是A-Z.下面以不同的方式查詢:
 
db.people.find({"name":"Refactor"})
       mongos會將這個查詢直接發送給Q-Z片,獲得響應后,直接轉發給客戶端
 
db.people.find({"name":{"$lt":"L"}})
       mongos會將其先發送給A-F和G-P片,然后將結果轉發給客戶端.
 
db.people.find().sort({"email":1})
       mongos會在所有片上查詢,返回結果時還會做歸并排序,確保結果順序正確.
 
       mongos用游標從各個服務器上獲取數據,所以不必等到全部數據都拿到才向客戶端發送批量結果.
 
db.people.find({"email":[email protected]})
       mongos并不追蹤"email"鍵,所以也不知道應該將查詢發給那個片.所以他就向所有片順序發送查詢.
 
       如果是插入文檔,mongos會依據"name"鍵的值,將其發送到相應的片上.
 
        7.建立分片
 
       建立分片有兩步:啟動實際的服務器,然后決定怎么切分數據.
 
       分片一般會有3個組成部分:
 
       a.片
 
       片就是保存子集合數據的容器,片可是單個的mongod服務器(開發和測試用),也可以是副本集(生產用).所以一片有多臺服務器,也只能有一個主服務器,其他的服務器保存相同的數據.
 
       b.mongos
 
       mongos就是MongoDB配的路由器進程.它路由所有的請求,然后將結果聚合.它本身并不存儲數據或者配置信息但會緩存配置服務器的信息.
 
       c.配置服務器
 
       配置服務器存儲了集群的配置信息:數據和片的對應關系.mongos不永久存房數據,所以需要個地方存放分片的配置.它會從配置服務器獲取同步數據.
 
        8.啟動服務器
 
       首先要啟動配置服務器和mongos.配置服務器需要先啟動.因為mongos會用到其上的配置信息.配置服務器的啟動就像普通的mongod一樣
 
       mongod --dbpath "F:/mongo/dbs/config" --port 20000 --logpath "F:/mongo/logs/config/MongoDB.txt" --rest
 
       配置服務器不需要很多的空間和資源(200M實際數據大約占用1kB的配置空間) 建立mongos進程,一共應用程序連接.這種路由服務器連接數據目錄都不需要,但一定要指明配置服務器的位置:
 
       mongos --port 30000 --configdb 127.0.0.1:20000 --logpath "F:/mongo/logs/mongos/MongoDB.txt"
 
       分片管理通常是通過mongos完成的.
 
       添加片
 
       片就是普通的mongod實例(或副本集)
 
       mongod --dbpath "F:/mongo/dbs/shard" --port 10000 --logpath "F:/mongo/logs/shard/MongoDB.txt" --rest
 
       mongod --dbpath "F:/mongo/dbs/shard1" --port 10001 --logpath "F:/mongo/logs/shard1/MongoDB.txt" --rest
 
       連接剛才啟動的mongos,為集群添加一個片.啟動shell,連接mongos:
 
       確定連接的是mongos而不是mongod,通過addshard命令添加片:
 
>mongo 127.0.0.1:30000
 
mongos> db.runCommand(
... {
... "addshard":"127.0.0.1:10000",
... "allowLocal":true
... }
... )
Sat Jul 21 10:46:38 uncaught exception: error { "$err" : "can't find a shard to
put new db on", "code" : 10185 }
mongos> use admin
switched to db admin
mongos> db.runCommand(
... {
... "addshard":"127.0.0.1:10000",
... "allowLocal":1
... }
... )
{ "shardAdded" : "shard0000", "ok" : 1 }
 
mongos> db.runCommand(
... {
... "addshard":"127.0.0.1:10001",
... "allowLocal":1
... }
... )
{ "shardAdded" : "shard0001", "ok" : 1 }
       當在本機運行片的時候,得設定allowLocal鍵為1.MongoDB盡量避免由于錯誤的配置,將集群配置到本地,所以得讓它知道這僅僅是開發,而且我們很清楚自己在做什么.如果是生產環境中,則要將其部署在不同的機器上.想添加片的時候,就運行addshard.MongoDB會負責將片集成到集群.
 
       切分數據
 
       MongoDB不會將存儲的每一條數據都直接發布,得先在數據庫和集合的級別將分片功能打開.
 
       如果是連接配置服務器,
 
E:/mongo/bin>mongo 127.0.0.1:20000
MongoDB shell version: 2.0.6
connecting to: 127.0.0.1:20000/test
> use admin
switched to db admin
> db.runCommand({"enablesharding":"test"})
{
"errmsg" : "no such cmd: enablesharding",
"bad cmd" : {
"enablesharding" : "test"
},
"ok" : 0
}
 
       應該是連接 路由服務器:
 
       db.runCommand({"enablesharding":"test"})//將test數據庫啟用分片功能.對數據庫分片后,其內部的集合便會存儲到不同的片上,同時也是對這些集合分片的前置條件.在數據庫級別啟用了分片以后,就可以使用shardcollection命令堆積和進行分片:
 
db.runCommand({"shardcollection":"test.refactor","key":{"name":1}})//對test數據庫的refactor集合進行分片,片鍵是name
 
       如果現在對refactor集合添加數據,就會依據"name"的值自動分散到各個片上.
 
       9.生產配置
 
       進入生產環境后,需要更健壯的分片方案,成功的構建分片需要如下條件:
 
       多個配置服務器
 
       多個mongos服務器
 
       每個片都是副本集
 
       正確的設置w
 
       健壯的配置
 
       設置多個配置服務器是很簡單的.
 
       設置多個配置服務器和設置一個配置服務器一樣
 
mongod --dbpath "F:/mongo/dbs/config" --port 20000 --logpath "F:/mongo/logs/config/MongoDB.txt" --rest
 
mongod --dbpath "F:/mongo/dbs/config1" --port 20001 --logpath "F:/mongo/logs/config1/MongoDB.txt" --rest
 
mongod --dbpath "F:/mongo/dbs/config2" --port 20002 --logpath "F:/mongo/logs/config2/MongoDB.txt" --rest
       啟動mongos的時候應將其連接到3個配置服務器上:
 
mongos --port 30000 --configdb 127.0.0.1:20000,127.0.0.1:20001,127.0.0.1:20002 --logpath "F:/mongo/logs/mongos/MongoDB.txt"
       配置服務器使用的是兩步提交機制,而不是普通的MongoDB的異步復制,來維護集群配置的不同副本.這樣能保證集群的狀態的一致性.這意味著,某臺配置服務器宕機后,集群的配置信息是只讀的.客戶端還是能夠讀寫,但是只有所有配置服務器備份了以后才能重新均衡數據.
 
       多個mongos
 
       mongos的數量不受限制,建議針對一個應用服務器只運行一個mongos進程.這樣每個應用服務器就可以與mongos進行本地回話,如果服務器不工作了,就不會有應用試圖與不存的mongos通話了
 
       健壯的片
 
       生產環境中,每個片都應是副本集,這樣單個服務器壞了,就不會導致整個片失效.用addshard命令就可以將副本集作為片添加,添加時,只要指定副本集的名稱和種子就行了.如要添加副本集refactor,其中包含一個服務器127.0.0.1:10000(還有別的服務器),就可以用下列命令將其添加到集群中:
 
db.runCommand({"addshard":"refactor/127.0.0.1:10000"})
       如果127.0.0.1:10000服務器掛了,mongos會知道它所連接的是一個副本集,并會使用新的主節點.
 
       10.管理分片
 
       分片信息主要存放在config數據庫上,這樣就能被任何連接到mongos的進程訪問到了.
 
       配置集合
 
       在shell中連接了mongos,并使用了use config數據庫
 
       a.片
 
       可以在shareds集合中查到所有的片
 
db.shards.find()
       b.數據庫
 
       databases集合含有已經包含在片上的數據庫列表和一些相關信息
 
db.databases.find()
       返回的文檔解釋:
 
       "_id"
 
       表示數據庫名
 
       "partitioned"
 
       表示是否啟用了分片功能
 
       "primary"
 
       這個值與"_id"相對應,表名這個數據的"大本營"在哪里.不論分片與否,數據庫總會有個大本營.要是分片的話,創建數據庫時會隨機選擇一個片.也就是說,大本營是開始創建數據庫文檔的位置.雖然分片時數據庫也會用到很多別的服務器,但會從這個片開始.
 
       c.塊
 
       塊信息存儲在chunks集合中.這可以看到數據到底是怎么切分到集群中的
 
db.chunks.find()
       分片命令
 
       獲得概要
 
db.printShardingStatus()
       刪除片
 
       用removeshard就能從集群中刪除片.removeshard會把給定片上的所有塊的數據都挪到其他片上db.runCommand({"removeshard":"127.0.0.1:10001"})在挪動過程中,removeshard會顯示進程.

(編輯:武林網)

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 成av在线 | 毛片免费视频播放 | 成人在线视频国产 | 久久免费视频精品 | 国产精品一区在线观看 | 日韩三区视频 | 精品国产一区二区三区久久久狼牙 | 欧美一级黄色影院 | 久草在线资源福利站 | 亚洲二区三区在线 | 成人免费毛片在线观看 | 久久欧美亚洲另类专区91大神 | 久久精品视频亚洲 | 国产午夜精品在线 | 国产免费美女 | 激情亚洲一区二区 | 精品久久久久久久久亚洲 | 国产乱一区二区三区视频 | 欧美性猛交xxx乱大交3蜜桃 | 国产精品免费麻豆入口 | 九色新网址 | 成人免费在线观看视频 | 美女网站黄在线观看 | 欧美精品国产综合久久 | 毛片国产 | 一区二区三区黄色 | 深夜视频在线观看 | 草草久久久| 鸳鸯谱在线观看高清 | 久久国产成人精品国产成人亚洲 | 爱操影视 | 综合图区亚洲 | 一级毛片免费在线 | 欧日韩在线视频 | 欧美成年人视频 | 香蕉久久久久 | 黄网站在线免费看 | 国产精品久久久久久久久久大牛 | 成年人免费黄色片 | 成人精品一区二区三区中文字幕 | 黄色片免费看网站 |