导入方法
两种方式导入100warehouse数据到crdbv1.1.0:
- 首先通过benchmarksql导入pg,然后
pg_dump
导出copy语句,crdb执行copy语句 - 首先通过benchmarksql生成csv文件,
性能比较
-
单线程导入
pg_dump
的文件,耗时132min -
导入csv文件
- 单线程顺序导入
- 2.1G order-line-nonull.csv 12m3.865125123s
- 2.9G stock 5m31.318018087s
- 1.7G customer 3m3.289160325s
- 并发执行大文件(都在a1上执行)
- 并发导入上面三个大文件 a1节点挂了
- 并发执行大文件(分别在a1,a2,a3上执行)
- customer 2m53.384404436s
- stock 6m8.894480399s
- bmsql_order_line 12m20.354396959s
- 单线程顺序导入
-
pg10通过benchmarksql,10线程导入
|
|
由此可见,crdb通过import语法直接导入csv文件效率最高,但是与pg10相比较,性能有差距。