TripleToVector

功能介绍

将数据格式从 Triple 转成 Vector

参数说明

名称 中文名称 描述 类型 是否必须? 默认值
handleInvalid 解析异常处理策略 解析异常处理策略 String “ERROR”
tripleColumnCol 三元组结构中列信息的列名 三元组结构中列信息的列名 String
tripleValueCol 三元组结构中数据信息的列名 三元组结构中数据信息的列名 String
reservedCols 算法保留列名 算法保留列 String[] null
vectorCol 向量列名 向量列对应的列名 String
vectorSize 向量长度 向量长度 Long -1
tripleRowCol 三元组结构中行信息的列名 三元组结构中行信息的列名 String

脚本示例

脚本代码

  1. import numpy as np
  2. import pandas as pd
  3. data = np.array([[1,'1',1.0],[1,'2',2.0]])
  4. df = pd.DataFrame({"row":data[:,0], "col":data[:,1], "val":data[:,2]})
  5. data = dataframeToOperator(df, schemaStr="row double, col string, val double",op_type="batch")
  6. op = TripleToVectorBatchOp()\
  7. .setTripleRowCol("row").setTripleColCol("col").setTripleValCol("val")\
  8. .setReservedCols(["row"]).setVectorCol("vec").setVectorSize(5)\
  9. .linkFrom(data)
  10. op.print()

脚本运行结果

  1. |row|vec|
  2. |-|-----|
  3. |1|$5$1.0 2.0|