麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 數據庫 > MongoDB > 正文

MongoDB復制集原理是什么?一文帶你看明白

2024-09-07 00:22:33
字體:
來源:轉載
供稿:網友
       這篇文章帶大家深入了解MongoDB復制集原理,文本有詳細的介紹以及示例,對于MongoDB復制集不是很清楚的朋友可以參考參考,接下來我們就一起來看看MongoDB復制集原理。
 
       復制集簡介
       Mongodb復制集由一組Mongod實例(進程)組成,包含一個Primary節點和多個Secondary節點,Mongodb Driver(客戶端)的所有數據都寫入Primary,Secondary從Primary同步寫入的數據,以保持復制集內所有成員存儲相同的數據集,提供數據的高可用。
 
       下圖(圖片源于Mongodb官方文檔)是一個典型的Mongdb復制集,包含一個Primary節點和2個Secondary節點。
 
       Primary選舉
 
       復制集通過replSetInitiate命令(或mongo shell的rs.initiate())進行初始化,初始化后各個成員間開始發送心跳消息,并發起Priamry選舉操作,獲得『大多數』成員投票支持的節點,會成為Primary,其余節點成為Secondary。
 
       初始化復制集
 
config = {
  _id : "my_replica_set",
  members : [
     {_id : 0, host : "rs1.example.net:27017"},
     {_id : 1, host : "rs2.example.net:27017"},
     {_id : 2, host : "rs3.example.net:27017"},
  ]
}
 
rs.initiate(config)
 
       『大多數』的定義
 
       假設復制集內投票成員(后續介紹)數量為N,則大多數為 N/2 + 1,當復制集內存活成員數量不足大多數時,整個復制集將無法選舉出Primary,復制集將無法提供寫服務,處于只讀狀態。
 
投票成員數 大多數 容忍失效數
1 1 0
2 2 0
3 2 1
4 3 1
5 3 2
6 4 2
7 4 3
 
       通常建議將復制集成員數量設置為奇數,從上表可以看出3個節點和4個節點的復制集都只能容忍1個節點失效,從『服務可用性』的角度看,其效果是一樣的。(但無疑4個節點能提供更可靠的數據存儲)
 
       特殊的Secondary
       正常情況下,復制集的Seconary會參與Primary選舉(自身也可能會被選為Primary),并從Primary同步最新寫入的數據,以保證與Primary存儲相同的數據。
 
       Secondary可以提供讀服務,增加Secondary節點可以提供復制集的讀服務能力,同時提升復制集的可用性。另外,Mongodb支持對復制集的Secondary節點進行靈活的配置,以適應多種場景的需求。
 
       Arbiter
       Arbiter節點只參與投票,不能被選為Primary,并且不從Primary同步數據。
 
       比如你部署了一個2個節點的復制集,1個Primary,1個Secondary,任意節點宕機,復制集將不能提供服務了(無法選出Primary),這時可以給復制集添加一個Arbiter節點,即使有節點宕機,仍能選出Primary。
 
       Arbiter本身不存儲數據,是非常輕量級的服務,當復制集成員為偶數時,最好加入一個Arbiter節點,以提升復制集可用性。
 
       Priority0
       Priority0節點的選舉優先級為0,不會被選舉為Primary
 
       比如你跨機房A、B部署了一個復制集,并且想指定Primary必須在A機房,這時可以將B機房的復制集成員Priority設置為0,這樣Primary就一定會是A機房的成員。(注意:如果這樣部署,最好將『大多數』節點部署在A機房,否則網絡分區時可能無法選出Primary)
 
       Vote0
       Mongodb 3.0里,復制集成員最多50個,參與Primary選舉投票的成員最多7個,其他成員(Vote0)的vote屬性必須設置為0,即不參與投票。
 
       Hidden
       Hidden節點不能被選為主(Priority為0),并且對Driver不可見。
 
       因Hidden節點不會接受Driver的請求,可使用Hidden節點做一些數據備份、離線計算的任務,不會影響復制集的服務。
 
       Delayed
       Delayed節點必須是Hidden節點,并且其數據落后與Primary一段時間(可配置,比如1個小時)。
 
       因Delayed節點的數據比Primary落后一段時間,當錯誤或者無效的數據寫入Primary時,可通過Delayed節點的數據來恢復到之前的時間點。
 
       數據同步
       Primary與Secondary之間通過oplog來同步數據,Primary上的寫操作完成后,會向特殊的local.oplog.rs特殊集合寫入一條oplog,Secondary不斷的從Primary取新的oplog并應用。
 
       因oplog的數據會不斷增加,local.oplog.rs被設置成為一個capped集合,當容量達到配置上限時,會將最舊的數據刪除掉。另外考慮到oplog在Secondary上可能重復應用,oplog必須具有冪等性,即重復應用也會得到相同的結果。
 
       如下oplog的格式,包含ts、h、op、ns、o等字段
 
{
 "ts" : Timestamp(1446011584, 2),
 "h" : NumberLong("1687359108795812092"),
 "v" : 2,
 "op" : "i",
 "ns" : "test.nosql",
 "o" : { "_id" : ObjectId("563062c0b085733f34ab4129"), "name" : "mongodb", "score" : "100" }
}
ts: 操作時間,當前timestamp + 計數器,計數器每秒都被重置
h:操作的全局唯一標識
v:oplog版本信息
op:操作類型
i:插入操作
u:更新操作
d:刪除操作
c:執行命令(如createDatabase,dropDatabase)
n:空操作,特殊用途
ns:操作針對的集合
o:操作內容,如果是更新操作
o2:操作查詢條件,僅update操作包含該字段
       Secondary初次同步數據時,會先進行init sync,從Primary(或其他數據更新的Secondary)同步全量數據,然后不斷通過tailable cursor從Primary的local.oplog.rs集合里查詢最新的oplog并應用到自身。
 
       init sync過程包含如下步驟
 
       T1時間,從Primary同步所有數據庫的數據(local除外),通過listDatabases + listCollections + cloneCollection敏命令組合完成,假設T2時間完成所有操作。
       從Primary應用[T1-T2]時間段內的所有oplog,可能部分操作已經包含在步驟1,但由于oplog的冪等性,可重復應用。
       根據Primary各集合的index設置,在Secondary上為相應集合創建index。(每個集合_id的index已在步驟1中完成)。
       oplog集合的大小應根據DB規模及應用寫入需求合理配置,配置得太大,會造成存儲空間的浪費;配置得太小,可能造成Secondary的init sync一直無法成功。比如在步驟1里由于DB數據太多、并且oplog配置太小,導致oplog不足以存儲[T1, T2]時間內的所有oplog,這就Secondary無法從Primary上同步完整的數據集。
 
       修改復制集配置
       當需要修改復制集時,比如增加成員、刪除成員、或者修改成員配置(如priorty、vote、hidden、delayed等屬性),可通過replSetReconfig命令(rs.reconfig())對復制集進行重新配置。
 
       比如將復制集的第2個成員Priority設置為2,可執行如下命令
 
cfg = rs.conf();
cfg.members[1].priority = 2;
rs.reconfig(cfg);
       細說Primary選舉
       Primary選舉除了在復制集初始化時發生,還有如下場景
 
復制集被reconfig
Secondary節點檢測到Primary宕機時,會觸發新Primary的選舉
當有Primary節點主動stepDown(主動降級為Secondary)時,也會觸發新的Primary選舉
       Primary的選舉受節點間心跳、優先級、最新的oplog時間等多種因素影響。
 
       節點間心跳
       復制集成員間默認每2s會發送一次心跳信息,如果10s未收到某個節點的心跳,則認為該節點已宕機;如果宕機的節點為Primary,Secondary(前提是可被選為Primary)會發起新的Primary選舉。
 
       節點優先級
 
每個節點都傾向于投票給優先級最高的節點
優先級為0的節點不會主動發起Primary選舉
當Primary發現有優先級更高Secondary,并且該Secondary的數據落后在10s內,則Primary會主動降級,讓優先級更高的Secondary有成為Primary的機會。
       Optime
       擁有最新optime(最近一條oplog的時間戳)的節點才能被選為主。
 
       網絡分區
       只有更大多數投票節點間保持網絡連通,才有機會被選Primary;如果Primary與大多數的節點斷開連接,Primary會主動降級為Secondary。當發生網絡分區時,可能在短時間內出現多個Primary,故Driver在寫入時,最好設置『大多數成功』的策略,這樣即使出現多個Primary,也只有一個Primary能成功寫入大多數。
 
       復制集的讀寫設置
 
       Read Preference
       默認情況下,復制集的所有讀請求都發到Primary,Driver可通過設置Read Preference來將讀請求路由到其他的節點。
 
primary: 默認規則,所有讀請求發到Primary
primaryPreferred: Primary優先,如果Primary不可達,請求Secondary
secondary: 所有的讀請求都發到secondary
secondaryPreferred:Secondary優先,當所有Secondary不可達時,請求Primary
nearest:讀請求發送到最近的可達節點上(通過ping探測得出最近的節點)
       Write Concern
       默認情況下,Primary完成寫操作即返回,Driver可通過設置[Write Concern(https://docs.mongodb.org/manual/core/write-concern/)來設置寫成功的規則。
 
       如下的write concern規則設置寫必須在大多數節點上成功,超時時間為5s。
 
db.products.insert(
 { item: "envelopes", qty : 100, type: "Clasp" },
 { writeConcern: { w: majority, wtimeout: 5000 } }
)
       上面的設置方式是針對單個請求的,也可以修改副本集默認的write concern,這樣就不用每個請求單獨設置。
 
cfg = rs.conf()
cfg.settings = {}
cfg.settings.getLastErrorDefaults = { w: "majority", wtimeout: 5000 }
rs.reconfig(cfg)
       異常處理(rollback)
       當Primary宕機時,如果有數據未同步到Secondary,當Primary重新加入時,如果新的Primary上已經發生了寫操作,則舊Primary需要回滾部分操作,以保證數據集與新的Primary一致。
 
       舊Primary將回滾的數據寫到單獨的rollback目錄下,數據庫管理員可根據需要使用mongorestore進行恢復。

(編輯:武林網)

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 99麻豆久久久国产精品免费 | 亚洲午夜不卡 | 久久久www视频 | 欧美成人高清在线 | 香蕉久草视频 | 狠狠干91 | 欧美毛片免费观看 | 久久精品视频8 | 中文成人在线 | 成人不卡在线观看 | 欧美人与牲禽动交精品一区 | 国产青草视频在线观看 | 日韩在线欧美在线 | 成人精品aaaa网站 | 成人影片在线免费观看 | 中文字幕国产亚洲 | 亚洲精品 在线播放 | 九九视频在线观看黄 | 午夜精品久久久久久中宇 | 久久综合九色 | xxxxxx中国| 亚洲片在线 | 桥本有菜免费av一区二区三区 | tube69xxxxxhd| 精品久久一区二区 | 久色视频| 国产精品91久久久 | 极品一级片 | 在线播放免费播放av片 | 国产毛片毛片毛片 | bt 自拍 另类 综合 欧美 | 亚洲成人福利网站 | 在线观看免费毛片视频 | 久久亚洲精品久久国产一区二区 | 久久久激情网 | 成人毛片免费看 | 欧美日本日韩 | 国产色片在线观看 | 成人在线视频免费看 | 国产精品一区二区三区99 | 九九热精|