一、前言
以前的系統(tǒng)由于表設(shè)計(jì)比較復(fù)雜(多張表,表與表直接有主從關(guān)系),這個(gè)是業(yè)務(wù)邏輯決定的。 插入效率簡(jiǎn)直實(shí)在無(wú)法忍受,必須優(yōu)化。在了解了Postgre的Copy,unlogged table 特性
之后,決定一探究竟。
二、測(cè)試用例
1.數(shù)據(jù)表結(jié)構(gòu):表示一個(gè)員工工作績(jī)效的表(work_test):共15個(gè)字段
id,no,name,sex,tel,address,provice,city,post,mobile,department,work,start_time,end_time,score
索引(b-tree的集群索引或者叫聚集索引):id,no,name,sex,tel,address,provice,city,post,mobile,department,work
2.測(cè)試環(huán)境:win7,四核,2GB內(nèi)存;postgre版本9.3;Npgsql連接Postgre數(shù)據(jù)庫(kù)。
三、insert/ transaction/ copy/unlogged table
1.insert 一個(gè)10W數(shù)據(jù)大概需要120s,雖然已經(jīng)提升“不少”,但是還是不盡如人意。以前用SQLite時(shí)發(fā)現(xiàn)Transaction可以大幅提升性能,于是在Postgre中試試,發(fā)現(xiàn)并沒(méi)有明顯變
化。不知何故。
2. copy可以將文件(csv)中的數(shù)據(jù)復(fù)制進(jìn)數(shù)據(jù)庫(kù)中,當(dāng)然數(shù)據(jù)表的結(jié)構(gòu)和要數(shù)據(jù)類(lèi)型要與文件一一對(duì)應(yīng)。據(jù)說(shuō)可以大幅提升插入性能。
3.unlogged table
unlogged table,網(wǎng)上的文章說(shuō)可以10倍于insert。使用方法也很簡(jiǎn)單:Create unlogged table ...
但是unlogged table 在遇到Postgre服務(wù)器異常重啟后會(huì)丟失全部數(shù)據(jù),所以如果你的數(shù)據(jù)不允許丟失,請(qǐng)不要使用。
使用后發(fā)現(xiàn),大概20s,1s插入5000條記錄。
說(shuō)明:x軸表示數(shù)據(jù)庫(kù)中已有的記錄數(shù),單位百萬(wàn),每個(gè)點(diǎn)是10W.Y軸表示每次插入所耗時(shí)間,單位秒。
藍(lán)色線(xiàn):insert;之所以后面比較穩(wěn)定是因?yàn)殡娔X沒(méi)有運(yùn)行其他程序。所以說(shuō),電腦工作狀態(tài)對(duì)Postgre效率有一定的影響。
粉紅色:copy;
黃色線(xiàn):copy+unlogged
雖然建了索引,并且表中的數(shù)據(jù)一直累加進(jìn)來(lái),對(duì)于后續(xù)插入數(shù)據(jù)性能并沒(méi)有任何影響,這個(gè)結(jié)果就是我想看到的。
四、查詢(xún)測(cè)試
按name字段搜索:
新聞熱點(diǎn)
疑難解答
圖片精選
網(wǎng)友關(guān)注