Geohashes
Geohashes 是一种将 经纬度坐标对(lat/lon
)编码成字符串的方式。
最开始这么做只是为了让地理位置在url上呈现的形式更加友好,
不过现在geohash已经变成一种在数据库中有效索引地理坐标点和地理形状的方式。
Geohashes 把整个世界分为32个单元的格子—4行8列—每一个格子都用一个字母或者数字标识。
比如 g
这个单元覆盖了半个格林兰,冰岛的全部和大不列颠的大部分。
每一个单元还可以进一步被分解成新的32个单元,这些单元又可以继续被分解成32个更小的单元,不断重复下去。gc
这个单元覆盖了爱尔兰和英格兰,gcp
覆盖了伦敦的大部分和部分南英格兰,gcpuuz94k
是伯明翰宫的入口,精确到了约5米。
换句话说,geohash的长度越长,它的精度就越高。
如果两个geohash有一个共同的前缀,如 gcpuuz
,就表示他们挨得很紧。
共同的前缀越长,距离就越近。
但那也就是说,两个刚好相邻的位置,会可能有完全不同的geohash。
一个实例,伦敦的 Millenium Dome 的geohash是 u10hbp
,
因为它落在了 u
这个大单元里,而紧挨着它东边的最大的单元是 g
。
地理坐标点可以自动关联到他们对应的 geohash。
需要注意的是,他们会被索引到了所有(各个层级)的 geohash 前缀(prefixes)。
例:索引伯明翰宫的门口—坐标纬度 51.501568
,经度-0.141257
—会在各种尺寸精度的 geohash 上建立索引,
如下表:
Geohash | Level | Dimensions |
---|---|---|
g | 1 | ~ 5,004km x 5,004km |
gc | 2 | ~ 1,251km x 625km |
gcp | 3 | ~ 156km x 156km |
gcpu | 4 | ~ 39km x 19.5km |
gcpuu | 5 | ~ 4.9km x 4.9km |
gcpuuz | 6 | ~ 1.2km x 0.61km |
gcpuuz9 | 7 | ~ 152.8m x 152.8m |
gcpuuz94 | 8 | ~ 38.2m x 19.1m |
gcpuuz94k | 9 | ~ 4.78m x 4.78m |
gcpuuz94kk | 10 | ~ 1.19m x 0.60m |
gcpuuz94kkp | 11 | ~ 14.9cm x 14.9cm |
gcpuuz94kkp5 | 12 | ~ 3.7cm x 1.8cm |
geohash单元过滤器( geohash_cell
filter )可以使用这些geohash前缀来找出与指定坐标点(lat/lon
)相邻的位置。