GS_OPT_MODEL
GS_OPT_MODEL是启用AiEngine执行计划时间预测功能时的数据表,记录机器学习模型的配置、训练结果、功能、对应系统函数、训练历史等相关信息。
表 1 GS_OPT_MODEL字段
名称
|
类型
|
描述
|
oid
|
oid
|
数据库对象id。
|
template_name
|
name
|
机器学习模型的模板名,决定训练和预测调用的函数接口,目前只实现了rlstm,方便后续扩展。
|
model_name
|
name
|
模型的实例名,每个模型对应aiEngine在线学习进程中的一套参数、训练日志、模型系数。此列需为unique。
|
datname
|
name
|
该模型所服务的database名,每个模型只针对单个database。此参数决定训练时所使用的数据。
|
ip
|
name
|
AiEngine端所部署的host ip地址。
|
port
|
integer
|
AiEngine端所侦听的端口号。
|
max_epoch
|
integer
|
模型每次训练的迭代次数上限。
|
learning_rate
|
real
|
模型训练的学习速率,推荐缺省值1。
|
dim_red
|
real
|
模型特征维度降维系数。
|
hidden_units
|
integer
|
模型隐藏层神经元个数。如果训练发现模型长期无法收敛,可以适量提升本参数。
|
batch_size
|
integer
|
模型每次迭代时一个batch的大小,尽量设为大于等于训练数据总量的值,加快模型的收敛速度。
|
feature_size
|
integer
|
[不需设置] 模型特征的长度,用于触发重新训练,模型训练后该参数自动更新。
|
available
|
boolean
|
[不需设置]标识模型是否收敛。
|
Is_training
|
boolean
|
[不需设置]标识模型是否正在训练。
|
label
|
“char”[]
|
模型的目标任务:
- S:startup time
- T:total time
- R:rows
- M:peak memory
目前受模型性能限制,推荐{S, T}或{R}。
|
max
|
bigint[]
|
[不需设置]标识模型各任务标签的最大值,用于触发重新训练。
|
acc
|
real[]
|
[不需设置]标识模型各任务的准确率。
|
description
|
text
|
模型注释。
|