使用一种自定义格式
用户在CREATE EXTERNAL TABLE的FORMAT子句中指定一种自定义数据格式。
FORMAT 'CUSTOM' (formatter=format_function, key1=val1,...keyn=valn)
这里’CUSTOM’关键词表示数据是一种自定义格式,而formatter指定用来格式化该数据的函数,其后跟着给formatter函数的用逗号分隔的参数。
Greenplum数据库为格式化固定宽度的数据提供了函数,但是用户必须编写用于可变宽度数据的formatter函数。步骤如下。
- 编写并且编译输入和输出函数为一个共享库。
- 用CREATE FUNCTION在Greenplum数据库中指定该共享库函数。
- 使用CREATE EXTERNAL TABLE的FORMAT子句的formatter参数来调用该函数。
Parent topic: 装载和写入非HDFS自定义数据