TripleToJson

功能介绍

将数据格式从 Triple 转成 Json

参数说明

名称 中文名称 描述 类型 是否必须? 默认值
handleInvalid 解析异常处理策略 解析异常处理策略 String “ERROR”
tripleColumnCol 三元组结构中列信息的列名 三元组结构中列信息的列名 String
tripleValueCol 三元组结构中数据信息的列名 三元组结构中数据信息的列名 String
reservedCols 算法保留列名 算法保留列 String[] null
jsonCol JSON列名 JSON列的列名 String
tripleRowCol 三元组结构中行信息的列名 三元组结构中行信息的列名 String

脚本示例

脚本代码

  1. import numpy as np
  2. import pandas as pd
  3. data = np.array([[1,'f1',1.0],[1,'f2',2.0],[2,'f1',4.0],[2,'f2',8.0]])
  4. df = pd.DataFrame({"row":data[:,0], "col":data[:,1], "val":data[:,2]})
  5. data = dataframeToOperator(df, schemaStr="row double, col string, val double",op_type="batch")
  6. op = TripleToJsonBatchOp()\
  7. .setTripleRowCol("row").setTripleColCol("col").setTripleValCol("val")\
  8. .setReservedCols(["row"]).setJsonCol("json")\
  9. .linkFrom(data)
  10. op.print()

脚本运行结果

  1. |row|json|
  2. |---|----|
  3. | 1 |{"f1":"1.0","f2":"2.0"}|
  4. | 2 |{"f2":"4.0","f4":"8.0"}|