[TOC]
其实对于那种地理位置不会变的两个主体之间的距离,最好是直接将结果静态化。也就是直接写死在配置里。
比如,找自己家附近的地铁站。
这种情况下,一般而言“家”这个主体是不会轻易“跑来跑去”的。每次查询都计算一次距离没什么意义。最好是直接将距离持久化后直接查询。
另一种情况:
获取APP用户所在位置附近的地铁站
这种情况下,用户的地理位置是变动的。所以每次都得实时计算实际距离。
思路
将地球当做一个标准的球体,使用球面距离公式来计算球面两点间大圆的弧长。
- 球面距离
public static double getDistance2(double long1, double lat1, double long2, double lat2) { lat1 = rad(lat1); lat2 = rad(lat2); double a = lat1 - lat2; double b = rad(long1 - long2); double sa2 = Math.sin(a / 2.0); double sb2 = Math.sin(b / 2.0); return 2 * EARTH_MEAN_RADIUS_KM * Math.asin(Math.sqrt(sa2 * sa2 + Math.cos(lat1) * Math.cos(lat2) * sb2 * sb2));}
知道两点之间的经纬度就可以。
当然,这种计算不得不放在数据库里,然后根据距离排序返回。将上面的公式带入到SQL里就可以。
附近地铁站示例
- 建地铁站示例表
CREATE TABLE station( id INT AUTO_INCREMENT PRIMARY KEY, name VARCHAR(20) NULL COMMENT '地铁站名', lng DOUBLE NULL COMMENT '经度', lat DOUBLE NULL COMMENT '维度');
- SQL示例
SET @targetLat = 31.175702;SET @targetLng = 121.519095;SELECT s.id , s.name , s.lng , s.lat , ROUND( 6378.138 * 2 * ASIN( SQRT( POW( SIN( ( @targetLat * PI() / 180 - s.lat * PI() / 180 ) / 2 ) , 2 ) + COS( @targetLat * PI( ) / 180 ) * COS( s.lat * PI( ) / 180 ) * POW( SIN( ( @targetLng * PI() / 180 - s.lng * PI() / 180 ) / 2 ) , 2 ) ) ) * 1000 ) AS distanceFROM station sORDER BY distance ASC , s.idLIMIT 20;
其中的targetLat
和 targetLng
就是用户的地理位置。
这样的确可以达到目的。但是,这是对所有数据先计算了一次和用户的距离后再排序。
地铁站的数量太大的时候这种操作可就不太优雅了。不仅不够优雅,而且效率是很吓人的。
优化
其实,可以在计算距离之前就将很多数据先过滤掉。
没必要在 计算上海地铁站距离的时候将美国的地铁站距离也计算一遍吧。
这在大多数应用中都可以先将一些不需要的数据过滤掉。
比如在数据是区分城市的情况下就可以将SQL改为下面这样:
SET @targetLat = 31.175702;SET @targetLng = 121.519095;SET @cityId=605;SELECT s.id , s.name , s.lng , s.lat , ROUND( 6378.138 * 2 * ASIN( SQRT( POW( SIN( ( @targetLat * PI() / 180 - s.lat * PI() / 180 ) / 2 ) , 2 ) + COS( @targetLat * PI( ) / 180 ) * COS( s.lat * PI( ) / 180 ) * POW( SIN( ( @targetLng * PI() / 180 - s.lng * PI() / 180 ) / 2 ) , 2 ) ) ) * 1000 ) AS distanceFROM station swhere city_id=@cityId # 先将待计算的数据过滤的一部分ORDER BY distance ASC , s.idLIMIT 20;
上面的改进就是先将待计算的数据在计算之前就剔除大部分。找一个长沙地铁站,没有必要在上海先找一遍吧。
当然,这种情况比较特殊一点,因为你事先能知道用户所处的城市。
另一种改进就是:
以用户所在位置为圆心,画一个半径为R的圆,然后反推出这个圆圈的外接四边形的经纬度范围。在计算距离之前先将外接四边形经经纬度之外的数据过滤掉。
指定一个理想的半径R,先过滤掉不可能符合条件的数据。
- 反推外接四边形范围
/** * 获取距离指定经纬度的点{@code radius} KM 的外接四边形(严格来说应该是外接立方体)四个顶点的经纬度 * * @param lng 经度 * @param lat 纬度 * @param radius 半径,单位:KM * @return*/public static Tuple4 calcBoxByDistFromPt(double lng, double lat, double radius) { SpatialContext context = SpatialContext.GEO; Rectangle rectangle = context.getDistCalc()// .calcBoxByDistFromPt(// context.makePoint(lng, lat), // radius * com.spatial4j.core.distance.DistanceUtils.KM_TO_DEG, context, null// ); return new Tuple4<>(rectangle.getMinX(), rectangle.getMaxX(), rectangle.getMinY(), rectangle.getMaxY());}
这里用到的工具类maven坐标如下:
com.spatial4j spatial4j 0.5
此时的SQL可以改成这样:
SET @targetLat = 31.175702;SET @targetLng = 121.519095;SELECT s.id , s.name , s.lng , s.lat , ROUND( 6378.138 * 2 * ASIN( SQRT( POW( SIN( ( @targetLat * PI() / 180 - s.lat * PI() / 180 ) / 2 ) , 2 ) + COS( @targetLat * PI( ) / 180 ) * COS( s.lat * PI( ) / 180 ) * POW( SIN( ( @targetLng * PI() / 180 - s.lng * PI() / 180 ) / 2 ) , 2 ) ) ) * 1000 ) AS distanceFROM station sWHERE ( s.lng BETWEEN ${lng1} AND ${lng2} ) AND ( s.lat BETWEEN ${lat1} AND ${lat2} )ORDER BY distance ASC , s.idLIMIT 20;
上面的 lng1,lng2,lat1,lat2
就是外接四边形的范围。
引用资料
示例源码
- service:
- 初始化数据:
- 感谢这位仁兄提供的测试数据: