最佳实践
Greenplum数据库最佳实践指南描述Greenplum数据库的最佳实践。最佳实践是一种方法或者技术,它得到的结果始终比用其他方法得到的要好。最佳实践通过实践得来并且被证明能可靠地得到想要的结果。通过利用所有可用来确保成功的知识和技能,最佳实践是一种正确且最佳使用任意产品的保证。
这份文档并不教授用户如何使用Greenplum数据库的特性。关于如何使用和实现特定的Greenplum数据库特性,请参考http://gpdb.docs.pivotal.io上的Greenplum数据库文档。这份文档主要致力于描述在设计、实现和使用Greenplum数据库时可遵循的最佳实践。
这份文档的目的并非覆盖整个产品或者特性的纲要,而是提供Greenplum数据库中要点的摘要。本文档不会介绍可以进一步利用这些Greenplum数据库特性或者从中受益的边缘用例。边缘用例要求这些特性的熟练知识和技能,以及对环境(包括SQL访问、查询执行、并发、负载和其他因素)的深入理解。
通过掌握这些最佳实践,读者将能提升其Greenplum数据库集群在维护、支持、性能和扩展性领域的成功率。
访问Kerberos化的Hadoop集群
使用外部表和gphdfs协议,Greenplum数据库能够从一个Hadoop文件系统(HDFS)读取和写入文件。Greenplum的Segment会并行地读写HDFS以获得快速的性能。