LOAD DATA

功能描述

通过LOAD DATA命令实现从一个文件拷贝数据到一个表。

注意事项

  • 当参数enable_copy_server_files关闭时,只允许初始用户执行LOAD DATA命令,当参数enable_copy_server_files打开,允许具有SYSADMIN权限的用户或继承了内置角色gs_role_copy_files权限的用户执行,但默认禁止对数据库配置文件、密钥文件、证书文件和审计日志执行,以防止用户越权查看或修改敏感文件。
  • 只能用于表,不能用于视图。
  • 不支持列存表和外表。
  • 需要插入的表的insert权限, replace选项还需要表的delete权限。
  • 如果声明了一个字段列表,LOAD将只在文件和表之间拷贝已声明字段的数据。如果表中有任何不在字段列表里的字段,将为那些字段插入缺省值。
  • 声明的数据源文件,服务器必须可以访问该文件。
  • 如果数据文件的任意行包含比预期多或者少的字段,dolphin.sql_mode为严格模式时将抛出一个错误,宽松模式时缺少的字段将插入NULL,如果字段有NOT NULL约束则会插入类型基础值。
  • \N为NULL,如果要输入实际数据值\N ,使用\\N。

语法格式

  1. LOAD DATA
  2. INFILE 'file_name'
  3. [REPLACE | IGNORE]
  4. INTO TABLE tbl_name
  5. [CHARACTER SET charset_name]
  6. [{FIELDS | COLUMNS}
  7. [TERMINATED BY 'string']
  8. [[OPTIONALLY] ENCLOSED BY 'char']
  9. [ESCAPED BY 'char']
  10. ]
  11. [LINES
  12. [STARTING BY 'string']
  13. [TERMINATED BY 'string']
  14. ]
  15. [IGNORE number {LINES | ROWS}]
  16. [(col_name_or_user_var
  17. [, col_name_or_user_var] ...)]

参数说明

  • REPLACE

    插入的数据发生主键或唯一键冲突时才会起作用,会先将表中冲突的行进行删除,之后继续插入的数据。

  • IGNORE

    插入的数据发生主键或唯一键冲突时才会起作用,会忽略冲突行文件数据,继续插入后续的数据。

  • tbl_name

    表的名称(可以有模式修饰)。

    取值范围:已存在的表名。

  • col_name

    可选的待拷贝字段列表。

    取值范围:如果没有声明字段列表,将使用所有字段。

  • ESCAPED BY ‘char’

    用来指定逃逸字符,逃逸字符只能指定为单字节字符。

    默认值为双引号。当与ENCLOSED BY值相同时,会被替换为’\0’。

  • LINES TERMINATED BY ‘string’

    指定导出数据文件换行符样式。

    取值范围:支持多字符换行符,但换行符不能超过10个字节。常见的换行符,如\r、\n、\r\n(设成0x0D、0x0A、0x0D0A效果是相同的),其他字符或字符串,如$、#。

    LOAD DATA - 图1 说明:

    • LINES TERMINATED BY参数不能和分隔符、null参数相同。
    • LINES TERMINATED BY参数不能包含:.abcdefghijklmnopqrstuvwxyz0123456789。
  • CHARACTER SET ‘charset_name’

    指定文件编码格式名称。

    取值范围:有效的编码格式。

    缺省值:当前编码格式。

  • [OPTIONALLY] ENCLOSED BY ‘char’

    指定包裹符,完整包裹符内的数据将被当成一列的参数进行解析,OPTIONALLY没有实际意义。

    缺省值:双引号。

    LOAD DATA - 图2 说明:

    • ENCLOSED BY参数不能和分隔符参数相同。
    • ENCLOSED BY参数只能是单字节的字符。
  • FIELDS | COLUMNS TERMINATED BY ‘string’

    在文件中分隔各个字段的字符串,分隔符最大长度不超过10个字节。

    缺省值:缺省是水平制表符。

  • IGNORE number {LINES | ROWS}

    指定数据导出时,跳过数据文件的前 number行。

示例

  1. --创建load_t1表。
  2. openGauss=# CREATE TABLE load_t1
  3. (
  4. SM_SHIP_MODE_SK INTEGER NOT NULL,
  5. SM_SHIP_MODE_ID CHAR(16) NOT NULL,
  6. SM_TYPE CHAR(30) ,
  7. SM_CODE CHAR(10) ,
  8. SM_CARRIER CHAR(20) ,
  9. SM_CONTRACT CHAR(20)
  10. );
  11. --/home/omm/test.csv文件
  12. 1,a,b,c,d,e
  13. ,a,b,c,d,e
  14. 3,\N,a,b,c,d
  15. \N,a,b,c,d,e
  16. --从/home/omm/test.csv文件拷贝数据到表load_t1
  17. openGauss=# LOAD DATA INFILE '/home/omm/test.csv' INTO TABLE load_t1;
  18. --从/home/omm/test.csv文件拷贝数据到表load_t1,使用参数如下:字段分隔符为'\t' (fields terminated by E'\t') 换行符为'\r' (lines terminated by E'\r') 跳过前两行 (IGNORE 2 LINES)。
  19. openGauss=# LOAD DATA INFILE '/home/omm/test.csv' INTO TABLE load_t1 fields terminated by ',' lines terminated by E'\n' IGNORE 2 LINES;
  20. openGauss=# select * from load_t1;
  21. sm_ship_mode_sk | sm_ship_mode_id | sm_type | sm_code | sm_carrier | sm_contract
  22. -----------------+------------------+--------------------------------+------------+----------------------+----------------------
  23. 3 | | a | b | c | d
  24. 0 | a | b | c | d | e
  25. (2 rows)
  26. --删除load_t1
  27. openGauss=# DROP TABLE load_t1;