欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

JAVA实现空间索引编码——GeoHash的示例

程序员文章站 2024-03-12 19:36:44
之前自己在做基于lucene的内容检索过程中,了解到lucene可以实现对文本信息,数值信息的内容检索,对于空间距离好像并为为源码中实现;最近半年自己接触到solr,里面有...

之前自己在做基于lucene的内容检索过程中,了解到lucene可以实现对文本信息,数值信息的内容检索,对于空间距离好像并为为源码中实现;最近半年自己接触到solr,里面有一个空间距离检索(经纬度),最近对其中的实现做了下学习,了解到在实现空间距离检索的有一个比较常用的技术——geohash,下面就介绍下geohash。

geohash特点

  1. geohash用一个字符串表示经度和纬度两个坐标,比如我现在所在位置的geohash值为 wx4sv61q;
  2. geohash标识的并不是一个点,而是一个区域,比如 wx4sv61q 对应的就是一个矩形区域;
  3. 编码的前缀可以标识更大的区域,比如 wx4sv61 编码代表的区域要大于 wx4sv61q 代表的区域,但是 wx4sv61q 代表的区域一定在 wx4sv61 代表的区域内。

因此我们再去做距离检索的时候,只需要对geohash进行前缀匹配即可,具体的原因在后面内容进行介绍。

geohash原理

geohash最简单的解释就是将一个位置信息转化成一个可以排序、可以比较的字符串编码。下面就详细介绍以下其实现过程:

首先我们将纬度(-90, 90)平均分成两个区间(-90, 0)、(0, 90),如果坐标位置的纬度值在第一区间,则编码是0,否则编码为1。我们用 40.222012 举例,由于40.222012 属于 (0, 90),所以编码为1,然后我们继续将(0, 90)分成(0, 45)、(45, 90)两个区间,而40.222012 位于(0, 45),所以编码是0,依次类推,我们进行20次拆分,最后计算40.222012 的编码是 10111001001101000110。

对于经度采用同样的的方法,得到 116.248283 的编码是 11010010101010100101。

接下来我们对经纬度的编码合并,奇数为是纬度,偶数为是经度,得到的编码是 1110011101001001100011011001100000110110(这里需要特别注意,这里说的奇数、偶数是值数组的下标,从0开始的);

最后用base32编码,二进制串对应的十进制分别为 28, 29, 4, 24, 27, 6, 1, 22,转化为base32是wx4sv61q,因此就 得到(40.222012, 116.248283) 的编码为 wx4sv61q。(下图介绍了base32的对应关系)

JAVA实现空间索引编码——GeoHash的示例

 编码 wx4sv61q 在地图上对应的位置如下图:

 JAVA实现空间索引编码——GeoHash的示例

 这里我们geohash的编码长度为8,这时精度在19米,下表列出了不同的编码长度对应的精度:

JAVA实现空间索引编码——GeoHash的示例JAVA实现空间索引编码——GeoHash的示例

 由上面的精度可知,如果要选取和我(40.222012, 116.248283)相距2km内的物品,我们只需要查找物品坐标对应的geohash以wx4sv为前缀的即可。

geohash延伸

到目前为止我们对空间索引有了一定的了解,但是上面介绍的内容对下面的一种情况就无法实现:

JAVA实现空间索引编码——GeoHash的示例

我们从图中可以看出,红点与上方的绿点距离较近,与下方的绿点距离较远,但是红点与下方的绿点的编码字符串一样,都是wx4g0。对于geohash这种边界问题解决思路也十分简单,我们在做检索或者查询的时候,对周围的八个区域进行匹配,这样就很好的解决了边界问题。下面我们就对geohash用java进行实现。

java实现

在实现之前,我们首先定义一个locationbean,用它来表示经纬度信息:

 /**  
 *@description: 存储经纬度信息  
 */  
package com.lulei.geo.bean;  
  
public class locationbean { 
  public static final double minlat = -90; 
  public static final double maxlat = 90; 
  public static final double minlng = -180; 
  public static final double maxlng = 180; 
  private double lat;//纬度[-90,90] 
  private double lng;//经度[-180,180] 
   
  public locationbean(double lat, double lng) { 
    this.lat = lat; 
    this.lng = lng; 
  } 
  public double getlat() { 
    return lat; 
  } 
  public void setlat(double lat) { 
    this.lat = lat; 
  } 
  public double getlng() { 
    return lng; 
  } 
  public void setlng(double lng) { 
    this.lng = lng; 
  } 
} 

然后我们编写一个类,来实现geohash,在实现geohash的过程中,我们需要用定义一些常量以及经纬度信息,具体如下:

public class geohash { 
  private locationbean location; 
  /** 
   * 1 2500km;2 630km;3 78km;4 30km 
   * 5 2.4km; 6 610m; 7 76m; 8 19m 
   */ 
  private int hashlength = 8; //经纬度转化为geohash长度 
  private int latlength = 20; //纬度转化为二进制长度 
  private int lnglength = 20; //经度转化为二进制长度 
   
  private double minlat;//每格纬度的单位大小 
  private double minlng;//每个经度的倒下 
  private static final char[] chars = {'0', '1', '2', '3', '4', '5', '6', '7',  
        '8', '9', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'j', 'k', 'm', 'n',  
        'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z'}; 
} 

在geohash实例化时,我们需要对一些属性进行赋值:

public geohash(double lat, double lng) { 
  location = new locationbean(lat, lng); 
  setminlatlng(); 
} 
 
public int gethashlength() { 
  return hashlength; 
} 
 
/** 
 * @author:lulei  
 * @description: 设置经纬度的最小单位 
 */ 
private void setminlatlng() { 
  minlat = locationbean.maxlat - locationbean.minlat; 
  for (int i = 0; i < latlength; i++) { 
    minlat /= 2.0; 
  } 
  minlng = locationbean.maxlng - locationbean.minlng; 
  for (int i = 0; i < lnglength; i++) { 
    minlng /= 2.0; 
  } 
} 

我们在使用geohash的时候,需要设置最终编码的长度,因此编写一个方法实现对geohash长度的设置

public boolean sethashlength(int length) { 
  if (length < 1) { 
    return false; 
  } 
  hashlength = length; 
  latlength = (length * 5) / 2; 
  if (length % 2 == 0) { 
    lnglength = latlength; 
  } else { 
    lnglength = latlength + 1; 
  } 
  setminlatlng(); 
  return true; 
} 

有了这些设置之后,我们需要将经度、纬度转化为对应的二进制编码

private boolean[] gethasharray(double value, double min, double max, int length) { 
  if (value < min || value > max) { 
    return null; 
  } 
  if (length < 1) { 
    return null; 
  } 
  boolean[] result = new boolean[length]; 
  for (int i = 0; i < length; i++) { 
    double mid = (min + max) / 2.0; 
    if (value > mid) { 
      result[i] = true; 
      min = mid; 
    } else { 
      result[i] = false; 
      max = mid; 
    } 
  } 
  return result; 
} 

分别获取经纬度的二进制编码后,我们需要将两个二进制字符串合并成一个

private boolean[] merge(boolean[] latarray, boolean[] lngarray) { 
  if (latarray == null || lngarray == null) { 
    return null; 
  } 
  boolean[] result = new boolean[lngarray.length + latarray.length]; 
  arrays.fill(result, false); 
  for (int i = 0; i < lngarray.length; i++) { 
    result[2 * i] = lngarray[i]; 
  } 
  for (int i = 0; i < latarray.length; i++) { 
    result[2 * i + 1] = latarray[i]; 
  } 
  return result; 
} 

最后我们需要将获得的二进制转进行base32转化

/** 
 * @param lat 
 * @param lng 
 * @return 
 * @author:lulei  
 * @description: 获取经纬度的base32字符串 
 */ 
private string getgeohashbase32(double lat, double lng) { 
  boolean[] bools = getgeobinary(lat, lng); 
  if (bools == null) { 
    return null; 
  } 
  stringbuffer sb = new stringbuffer(); 
  for (int i = 0; i < bools.length; i = i + 5) { 
    boolean[] base32 = new boolean[5]; 
    for (int j = 0; j < 5; j++) { 
      base32[j] = bools[i + j]; 
    } 
    char cha = getbase32char(base32); 
    if (' ' == cha) { 
      return null; 
    } 
    sb.append(cha); 
  } 
  return sb.tostring(); 
} 
 
/** 
 * @param base32 
 * @return 
 * @author:lulei  
 * @description: 将五位二进制转化为base32 
 */ 
private char getbase32char(boolean[] base32) { 
  if (base32 == null || base32.length != 5) { 
    return ' '; 
  } 
  int num = 0; 
  for (boolean bool : base32) { 
    num <<= 1; 
    if (bool) { 
      num += 1; 
    } 
  } 
  return chars[num % chars.length]; 
} 

对于如何获取周围八个区域的geohash值这个问题我们可以做如下转化,我们已经知道当前点的经纬度值,我们也知道每一个区域内的经度、纬度的宽度,如果经度加上或减去这个宽度,我们就可以位于该区域左侧和右侧区域的经度,如果纬度加上或减去这个宽度,我们就可以获取该区域上部和下部的纬度,这样我们就可以分别获取到该区域周围八个区域内的一个点的坐标,我们分别计算这八个点的坐标,也就是八个区域对应的geohash编码。
 

public list<string> getgeohashbase32for9() { 
  double leftlat = location.getlat() - minlat; 
  double rightlat = location.getlat() + minlat; 
  double uplng = location.getlng() - minlng; 
  double downlng = location.getlng() + minlng; 
  list<string> base32for9 = new arraylist<string>(); 
  //左侧从上到下 3个 
  string leftup = getgeohashbase32(leftlat, uplng); 
  if (!(leftup == null || "".equals(leftup))) { 
    base32for9.add(leftup); 
  } 
  string leftmid = getgeohashbase32(leftlat, location.getlng()); 
  if (!(leftmid == null || "".equals(leftmid))) { 
    base32for9.add(leftmid); 
  } 
  string leftdown = getgeohashbase32(leftlat, downlng); 
  if (!(leftdown == null || "".equals(leftdown))) { 
    base32for9.add(leftdown); 
  } 
  //中间从上到下 3个 
  string midup = getgeohashbase32(location.getlat(), uplng); 
  if (!(midup == null || "".equals(midup))) { 
    base32for9.add(midup); 
  } 
  string midmid = getgeohashbase32(location.getlat(), location.getlng()); 
  if (!(midmid == null || "".equals(midmid))) { 
    base32for9.add(midmid); 
  } 
  string middown = getgeohashbase32(location.getlat(), downlng); 
  if (!(middown == null || "".equals(middown))) { 
    base32for9.add(middown); 
  } 
  //右侧从上到下 3个 
  string rightup = getgeohashbase32(rightlat, uplng); 
  if (!(rightup == null || "".equals(rightup))) { 
    base32for9.add(rightup); 
  } 
  string rightmid = getgeohashbase32(rightlat, location.getlng()); 
  if (!(rightmid == null || "".equals(rightmid))) { 
    base32for9.add(rightmid); 
  } 
  string rightdown = getgeohashbase32(rightlat, downlng); 
  if (!(rightdown == null || "".equals(rightdown))) { 
    base32for9.add(rightdown); 
  } 
  return base32for9; 
} 

运行结果

JAVA实现空间索引编码——GeoHash的示例

完整代码

上面的博客中已经有完整的loacationbean代码,这里就不再写了。
 

/**  
 *@description: geohash实现经纬度的转化 
 */  
package com.lulei.geo;  
 
import java.util.arraylist; 
import java.util.arrays; 
import java.util.list; 
 
import com.lulei.geo.bean.locationbean; 
import com.lulei.util.jsonutil; 
  
public class geohash { 
  private locationbean location; 
  /** 
   * 1 2500km;2 630km;3 78km;4 30km 
   * 5 2.4km; 6 610m; 7 76m; 8 19m 
   */ 
  private int hashlength = 8; //经纬度转化为geohash长度 
  private int latlength = 20; //纬度转化为二进制长度 
  private int lnglength = 20; //经度转化为二进制长度 
   
  private double minlat;//每格纬度的单位大小 
  private double minlng;//每个经度的倒下 
  private static final char[] chars = {'0', '1', '2', '3', '4', '5', '6', '7',  
        '8', '9', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'j', 'k', 'm', 'n',  
        'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z'}; 
   
  public geohash(double lat, double lng) { 
    location = new locationbean(lat, lng); 
    setminlatlng(); 
  } 
   
  public int gethashlength() { 
    return hashlength; 
  } 
   
  /** 
   * @author:lulei  
   * @description: 设置经纬度的最小单位 
   */ 
  private void setminlatlng() { 
    minlat = locationbean.maxlat - locationbean.minlat; 
    for (int i = 0; i < latlength; i++) { 
      minlat /= 2.0; 
    } 
    minlng = locationbean.maxlng - locationbean.minlng; 
    for (int i = 0; i < lnglength; i++) { 
      minlng /= 2.0; 
    } 
  } 
   
  /** 
   * @return 
   * @author:lulei  
   * @description: 求所在坐标点及周围点组成的九个 
   */ 
  public list<string> getgeohashbase32for9() { 
    double leftlat = location.getlat() - minlat; 
    double rightlat = location.getlat() + minlat; 
    double uplng = location.getlng() - minlng; 
    double downlng = location.getlng() + minlng; 
    list<string> base32for9 = new arraylist<string>(); 
    //左侧从上到下 3个 
    string leftup = getgeohashbase32(leftlat, uplng); 
    if (!(leftup == null || "".equals(leftup))) { 
      base32for9.add(leftup); 
    } 
    string leftmid = getgeohashbase32(leftlat, location.getlng()); 
    if (!(leftmid == null || "".equals(leftmid))) { 
      base32for9.add(leftmid); 
    } 
    string leftdown = getgeohashbase32(leftlat, downlng); 
    if (!(leftdown == null || "".equals(leftdown))) { 
      base32for9.add(leftdown); 
    } 
    //中间从上到下 3个 
    string midup = getgeohashbase32(location.getlat(), uplng); 
    if (!(midup == null || "".equals(midup))) { 
      base32for9.add(midup); 
    } 
    string midmid = getgeohashbase32(location.getlat(), location.getlng()); 
    if (!(midmid == null || "".equals(midmid))) { 
      base32for9.add(midmid); 
    } 
    string middown = getgeohashbase32(location.getlat(), downlng); 
    if (!(middown == null || "".equals(middown))) { 
      base32for9.add(middown); 
    } 
    //右侧从上到下 3个 
    string rightup = getgeohashbase32(rightlat, uplng); 
    if (!(rightup == null || "".equals(rightup))) { 
      base32for9.add(rightup); 
    } 
    string rightmid = getgeohashbase32(rightlat, location.getlng()); 
    if (!(rightmid == null || "".equals(rightmid))) { 
      base32for9.add(rightmid); 
    } 
    string rightdown = getgeohashbase32(rightlat, downlng); 
    if (!(rightdown == null || "".equals(rightdown))) { 
      base32for9.add(rightdown); 
    } 
    return base32for9; 
  } 
 
  /** 
   * @param length 
   * @return 
   * @author:lulei  
   * @description: 设置经纬度转化为geohash长度 
   */ 
  public boolean sethashlength(int length) { 
    if (length < 1) { 
      return false; 
    } 
    hashlength = length; 
    latlength = (length * 5) / 2; 
    if (length % 2 == 0) { 
      lnglength = latlength; 
    } else { 
      lnglength = latlength + 1; 
    } 
    setminlatlng(); 
    return true; 
  } 
   
  /** 
   * @return 
   * @author:lulei  
   * @description: 获取经纬度的base32字符串 
   */ 
  public string getgeohashbase32() { 
    return getgeohashbase32(location.getlat(), location.getlng()); 
  } 
   
  /** 
   * @param lat 
   * @param lng 
   * @return 
   * @author:lulei  
   * @description: 获取经纬度的base32字符串 
   */ 
  private string getgeohashbase32(double lat, double lng) { 
    boolean[] bools = getgeobinary(lat, lng); 
    if (bools == null) { 
      return null; 
    } 
    stringbuffer sb = new stringbuffer(); 
    for (int i = 0; i < bools.length; i = i + 5) { 
      boolean[] base32 = new boolean[5]; 
      for (int j = 0; j < 5; j++) { 
        base32[j] = bools[i + j]; 
      } 
      char cha = getbase32char(base32); 
      if (' ' == cha) { 
        return null; 
      } 
      sb.append(cha); 
    } 
    return sb.tostring(); 
  } 
   
  /** 
   * @param base32 
   * @return 
   * @author:lulei  
   * @description: 将五位二进制转化为base32 
   */ 
  private char getbase32char(boolean[] base32) { 
    if (base32 == null || base32.length != 5) { 
      return ' '; 
    } 
    int num = 0; 
    for (boolean bool : base32) { 
      num <<= 1; 
      if (bool) { 
        num += 1; 
      } 
    } 
    return chars[num % chars.length]; 
  } 
   
  /** 
   * @param lat 
   * @param lng 
   * @return 
   * @author:lulei  
   * @description: 获取坐标的geo二进制字符串 
   */ 
  private boolean[] getgeobinary(double lat, double lng) { 
    boolean[] latarray = gethasharray(lat, locationbean.minlat, locationbean.maxlat, latlength); 
    boolean[] lngarray = gethasharray(lng, locationbean.minlng, locationbean.maxlng, lnglength); 
    return merge(latarray, lngarray); 
  } 
   
  /** 
   * @param latarray 
   * @param lngarray 
   * @return 
   * @author:lulei  
   * @description: 合并经纬度二进制 
   */ 
  private boolean[] merge(boolean[] latarray, boolean[] lngarray) { 
    if (latarray == null || lngarray == null) { 
      return null; 
    } 
    boolean[] result = new boolean[lngarray.length + latarray.length]; 
    arrays.fill(result, false); 
    for (int i = 0; i < lngarray.length; i++) { 
      result[2 * i] = lngarray[i]; 
    } 
    for (int i = 0; i < latarray.length; i++) { 
      result[2 * i + 1] = latarray[i]; 
    } 
    return result; 
  } 
   
  /** 
   * @param value 
   * @param min 
   * @param max 
   * @return 
   * @author:lulei  
   * @description: 将数字转化为geohash二进制字符串 
   */ 
  private boolean[] gethasharray(double value, double min, double max, int length) { 
    if (value < min || value > max) { 
      return null; 
    } 
    if (length < 1) { 
      return null; 
    } 
    boolean[] result = new boolean[length]; 
    for (int i = 0; i < length; i++) { 
      double mid = (min + max) / 2.0; 
      if (value > mid) { 
        result[i] = true; 
        min = mid; 
      } else { 
        result[i] = false; 
        max = mid; 
      } 
    } 
    return result; 
  } 
   
 
  public static void main(string[] args) { 
    // todo auto-generated method stub  
    geohash g = new geohash(40.222012, 116.248283); 
    system.out.println(g.getgeohashbase32()); 
    system.out.println(jsonutil.parsejson(g.getgeohashbase32for9())); 
  } 
 
} 

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。