数据源管理
概述
数据源的作用
FDP 根据数据源来读取数据所在位置。
数据源的类型
数据源分为内部(INTERAL)和外部(EXTERAL)两种类型。
内部数据源:
内部数据源类型目前主要支持mysql,主要针对企业内部系统。
在创建内部数据模型时,需要选择内部数据源,在此数据源上创建数据模型。
在数据集成步骤中,指定从那个数据源中集成数据。
外部数据源:
外部数据源除支持mysql外,还支持Oracle,DB2,CUSTOM,HANA,POSTGRESQL,KAFKA,ODPS等类型,后续可以根据客户需求来新增支持的数据类型,主要针对外部客户所提供的数据。
外部数据源和内部数据源一样,同样可以在创建外部数据模型,数据集成中使用,另外在数据导出中只能选择外部数据源进行导出
添加数据源
添加 MySQL 数据源步骤
1.在数据源管理界面中选择新增数据源:
1)选择创建数据源的分类,此处选择EXTERAL进行举例;
2)选择数据源的类型,此处选择mysql。
2.选择类型后,需要对数据库进行连接配置,如下:
3.测试 : 点击测试连接,确保数据源能连通。
如测试失败,可检查用户名或者密码是否配置失误,一般是以下几项配置错误造成:
成功后保存则可在数据源管理中看到配置好的数据源。
Kafka 的导出数据源配置
基础的配置如下:
针对特定需求要做配置修改。
如果需要写入的数据覆盖,去重,则建的模型指定对应的字段为主键。
ES 的导出数据源配置
本次导入的索引和类型信息在描述中添加
{"index":"label","type":"label"}
ODPS 的导出数据源配置
基础配置如下
在描述框中添加补充信息,分区信息,多个用逗号分隔
{"partition":"ds=123,ms=123","tunnelServer":"http://dt.odps.aliyun.com"}
链接地址填写endpoint信息;
数据库名称填写 projectName;
用户名 :对方提供的id或者称为ak;
密码 : 对方提供的secret 或者称为sk;
导出的模型名与maxcompute的tableName一致。
同一个数据源下多个前缀相同的mysql表(分库分表)
使用场景限制:同一个数据库下,有多张表,多张表表名均为 ABC_数字 。
格式:1.ABC相同(ABC中可以包含下划线);2.数字连续。
{"tablePrefix":"c_level_change_log_","tableMin":"0","tableMax":"251"}
tablePrefix 代表表名的前缀。
tableMin 代表开始的后缀。
tableMax 代表结束的后缀。
对于这种数据源,在配置数据模型时,只需配置一个数据模型即可,模型名为上文提到的ABC部分,不需要加后面的数字部分。在配置数据集成节点且运行后,上述所有表中的数据会集成到同一张表中。
数据源查询
对数据源名称,分类,类型,数据源标示等一个或多个填写后进行搜索