Leap Frame 操作
Leap Frame 提供了如下基本操作:
- 创建新列并插入数据
- 删除列
- 读取一行数据
- 选出多列数据并插入到一条新的 Leap Frame 当中
插入数据
从已有字段中生成新的值非常简单,只需要指定输出字段的名字,输入字段的列表,以及一个能够生成新的输出的 Scala 函数。
// Insert some values into the leap frame
val leapFrame2 = leapFrame.withOutput("generated_field", "a_string", "an_int") {
(str: String, i: Int) => s"$str: $i"
}
// Extract our new data from the leap frame
val generatedStrings: Seq[String] = (for(lf <- leapFrame2;
lf2 <- lf.select("generated_field", "a_string", "an_int")) yield {
val str = lf2.dataset(0).getString(1) // get value of "a_string"
val i = lf2.dataset(0).getInt(2) // get value of "an_int"
assert(lf2.dataset(0).getString(0) == s"$str: $i")
lf2.dataset.map(_.getString(0))
}).get.toSeq
// Print out our generated strings
// > "Hello, MLeap!: 42"
// > "Another row: 43"
println(generatedStrings.mkString("\n"))
插入可选值
MLeap 中的 Null 值通过 Scala 中的 Option
单子来实现。让我们输出一些可选的 Null 值到 Leap Frame 中。
// Insert some values into the leap frame
val leapFrame3 = leapFrame.withOutput("optional_int", "a_double", "an_int") {
(d: Double, i: Int) =>
if(i > 42) {
Some(777)
} else { None }
}
// Extract our new data from the leap frame
val optionalInts: Seq[Option[Int]] = (for(lf <- leapFrame3;
lf2 <- lf.select("optional_int")) yield {
lf2.dataset.map(_.optionInt(0))
}).get.toSeq
// Print out our optional ints
// > Some(777)
// > None
println(optionalInts.mkString("\n"))
删除字段
从 Leap Frame 中删除一个字段。
assert(leapFrame.schema.hasField("a_double"))
for(lf <- leapFrame.dropField("a_double")) {
assert(!lf.schema.hasField("a_double"))
}
读取数据
访问 Leap Frame 中的数据行。
val data = leapFrame.dataset
assert(data.head == Row("Hello, MLeap!", 56.7d, 13.0f, 42, 67l))
assert(data(1) == Row("Another row", 23.4d, 11.0f, 43, 88l))
// Datasets are iterable over their rows
assert(data.toSeq.size == 2)
选取字段
通过选取已有字段,创建一帧新的 Leap Frame。
assert(leapFrame.schema.hasField("a_double"))
assert(leapFrame.schema.hasField("a_string"))
assert(leapFrame.schema.hasField("an_int"))
assert(leapFrame.schema.fields.size == 5)
for(lf <- leapFrame.select("a_double", "a_string")) {
assert(lf.schema.hasField("a_double"))
assert(lf.schema.hasField("a_string"))
assert(!lf.schema.hasField("an_int"))
assert(lf.schema.fields.size == 2)
}