4.1 通用保存
.format(source)
:设置数据格式- 返回
self
df.write.format('json').save('./data.json')
- 返回
.mode(saveMode)
:当要保存的目标位置已经有数据时,设置该如何保存。参数:
saveMode
可以为:'append'
:追加写入'overwrite'
:覆写已有数据'ignore'
:忽略本次保存操作(不保存)'error'
:抛出异常(默认行为)
返回
self
示例:
df.write.mode('append').parquet('./data.dat')
.partitionBy(*cols)
:按照指定的列名来将输出的DataFrame
分区。返回
self
示例:
df.write.partitionBy('year', 'month').parquet('./data.dat')
.save(path=None, format=None, mode=None, partitionBy=None, **options)
:保存DataFrame