功能介绍
按libsvm格式写出到文件
参数说明
名称 | 中文名称 | 描述 | 类型 | 是否必须? | 默认值 | |
---|---|---|---|---|---|---|
filePath | 文件路径 | 文件路径 | String | ✓ | ||
overwriteSink | 是否覆写已有数据 | 是否覆写已有数据 | Boolean | false | ||
vectorCol | 向量列名 | 向量列对应的列名 | String | ✓ | ||
labelCol | 标签列名 | 输入表中的标签列名 | String | ✓ |
脚本示例
运行脚本
URL = "http://alink-testdata.cn-hangzhou.oss.aliyun-inc.com/csv/iris_vec.csv";
SCHEMA_STR = "features string, label double"
data = CsvSourceBatchOp().setFilePath(URL).setSchemaStr(SCHEMA_STR)
LibSvmSinkBatchOp().setFilePath('/tmp/libsvm.csv') \
.setLabelCol("label").setVectorCol("features").setOverwriteSink(True).linkFrom(data)
BatchOperator.execute()