前言
最近因為工作的需要,要在Mysql里插入大量的數據大約1000w,目測會比較耗時。所以現在就像測試一下到底用什么插入數據的方法比較快捷高效。
下面就針對每一種方法分別測試不同數據量下的插入效率。
測試數據庫的基本與操作如下:
mysql> create database test;Query OK, 1 row affected (0.02 sec)mysql> use test;Database changedmysql> create table mytable(id int primary key auto_increment ,value varchar(50));Query OK, 0 rows affected (0.35 sec)mysql> desc mytable;+-------+-------------+------+-----+---------+----------------+| Field | Type | Null | Key | Default | Extra |+-------+-------------+------+-----+---------+----------------+| id | int(11) | NO | PRI | NULL | auto_increment || value | varchar(50) | YES | | NULL | |+-------+-------------+------+-----+---------+----------------+2 rows in set (0.02 sec)
方便測試,這里建了一個表,兩個字段,一個是自增的id,另一個是字符串表示內容。
測試時每次實驗結束都要mysql> truncate mytable
,來清空已存在的表。
方法一:逐條插入
測試代碼:(中間有1000條insert語句,用vim復制粘貼比較方便,寫完后保存到a.sql,然后在mysql提示符中輸入source a.sql)
set @start=(select current_timestamp(6));insert into mytable values(null,"value");......insert into mytable values(null,"value");set @end=(select current_timestamp(6));select @start;select @end;
輸出結果:
Query OK, 1 row affected (0.03 sec)......Query OK, 1 row affected (0.03 sec)Query OK, 0 rows affected (0.00 sec)+----------------------------+| @start |+----------------------------+| 2016-05-05 23:06:51.267029 |+----------------------------+1 row in set (0.00 sec)+----------------------------+| @end |+----------------------------+| 2016-05-05 23:07:22.831889 |+----------------------------+1 row in set (0.00 sec)
總共耗時31.56486s,事實上幾乎每條語句花的時間是差不多的,基本就是30ms。
這樣子1000w的數據就得花87h。
至于更大的數據量也就不試了,這種方法肯定不可取。
方法二:基于事務的批量插入
實際上就是把這么多的查詢放在一個事務中。事實上方法一中沒一條語句都開了一個事務,因此才會特別慢。
測試代碼:(與方法一基本類似,主要添加兩行,由于比較快,這里測試了多種數據量)
set @start=(select current_timestamp(6));start transaction;insert into mytable values(null,"value");......insert into mytable values(null,"value");commit;set @end=(select current_timestamp(6));select @start;select @end;
測試結果:
數據量 時間(s)1k 0.14581w 1.079310w 5.546006100w 38.930997
看出來基本是對數時間,效率還是比較高的。
方法三:單條語句一次插入多組數據
就是一條insert一次插入多個value。
測試代碼:
insert into mytable values (null,"value"), (null,"value"), ...... (null,"value");
測試結果:
數據量 時間(s)1k 0.151w 0.8010w 2.14100w *
看上去也是對數時間,而且比方法二要稍微快一點。不過問題在于單次SQL語句是有緩沖區大小限制的,雖然可以修改配置讓他變大,但也不能太大。所以在插入大批量的數據時也用不了。
方法四:導入數據文件
將數數據寫成數據文件直接導入(參照上一節)。
數據文件(a.dat):
null valuenull value.....null valuenull value
測試代碼:
mysql> load data local infile "a.dat" into table mytable;
測試結果:
數據量 時間(s)1k 0.131w 0.7510w 1.97100w 6.751000w 58.18
時間最快,就是他了。。。。
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作能帶來一定的幫助,如果有疑問大家可以留言交流,謝謝大家對VeVb武林網的支持。
新聞熱點
疑難解答