Vector 缺失值填充预测组件
功能介绍
使用 Vecotor 缺失值填充模型对流Vector数据进行数据填充。
参数说明
名称 |
中文名称 |
描述 |
类型 |
是否必须? |
默认值 |
outputCol |
输出结果列 |
输出结果列列名,可选,默认null |
String |
|
null |
脚本示例
运行脚本
data = np.array([["1:3,2:4,4:7", 1],\
["1:3,2:NaN", 3],\
["2:4,4:5", 4]])
df = pd.DataFrame({"vec" : data[:,0], "id" : data[:,1]})
dataStream = dataframeToOperator(df, schemaStr="vec string, id bigint",op_type="stream")
data = dataframeToOperator(df, schemaStr="vec string, id bigint",op_type="batch")
vecFill = VectorImputerTrainBatchOp().setSelectedCol("vec")
model = data.link(vecFill)
VectorImputerPredictStreamOp(model).setOutputCol("vec1").linkFrom(dataStream).print()
StreamOperator.execute()
运行结果
vec |
id |
vec1 |
1:3,2:4,4:7 |
1 |
1:3.0 2:4.0 4:7.0 |
1:3,2:NaN |
3 |
1:3.0 2:4.0 |
2:4,4:5 |
4 |
2:4.0 4:5.0 |