京东到家定位系统演化_京东到家用的地图坐标系统-程序员宅基地

文章概要

引言

依托达达的高效配送和大量优秀零售合作伙伴,京东到家为消费者提供生鲜蔬果、日用百货、医药健康、鲜花蛋糕、个护美妆等海量商品 1 小时配送到家的极致服务体验,在整个服务过程中,京东到家基于LBS将消费者和线下商家联系到一起,进而促成交易为消费者提供便利,在这背后定位系统是如何为京东到家提供基础的定位能力呢?本文从技术角度介绍了京东到家定位系统的演进过程以及遇到的问题。

定位系统是做什么的?

业务简介

打开京东到家app,进入首页然后下拉,我们可以看到附近的店铺模块,如下图所示,

这个“附近”模块是典型的定位系统的应用,图中蓝色方框区域内容为当前坐标的POI名称,红色方框区域内容为当前坐标附近的门店信息,红色椭圆区域内容为当前坐标与门店之间的距离。

简单介绍下实现流程

  • 第一步,打开app,手机可以通过内置的GPS模块获取当前位置的经纬度

  • 第二步,首页网关拿到当前位置的经纬度去请求地址系统,由地址系统访问相应的GIS服务得到POI信息并返回

  • 第三步,首页网关根据POI信息去请求定位系统,定位系统返回附近的门店列表以及距离信息

  • 第四步,首页网关补全门店的其他信息,比如评分、销量、运费等等信息,然后返回给app端展示

大体流程如下图所示:

除了这个典型的应用外,到家的很多系统都依赖定位系统,比如多门店的搜索、运费的计算、提单时的超区校验、订单时效的计算……统计下来有50+的系统,这些系统几乎涵盖了用户的整个购物过程,仔细想想也是情理之中,到家的许多业务都是基于位置展开的,这也正是o2o电商和传统电商的一个重要区别。

核心职责

从众多的业务场景归纳下来,定位系统有两个核心职责,如下图所示

距离计算

计算两个坐标点的距离,多数为门店坐标与用户坐标之间的距离

定位门店

得到用户坐标附近的门店信息,门店的配送范围多种多样,用户看到的为配送范围覆盖用户坐标的门店

架构演进过程

依据职责不同定位系统划分为距离服务和定位服务,下面分开介绍这两个服务的演进过程

距离服务

直线距离

这是所说的直线距离,实际为球面距离,我们认为地球是一个规则的球体,球面上的两个点,可以通过一系列的几何公式推导得出一个距离公式,将两个点的经纬度代入公式即可算出球面距离,这里就不展开了可自行搜索相关资料。那么我们为什么要升级,直线距离存在怎样的问题呢?如下图所示

图中,起点到终点之间直线距离为390米,由于两点之间隔着河和桥,实际的步行距离达到了1766米,实际的步行距离为直线距离的四倍之多,类似这种情况下展示给用户直线距离,存在一定的不合理,影响用户的体验;另一方面,由于达达侧计算运费使用的是步行距离,到家侧使用直线距离,两边测算的距离不一致,无形中也给到家平台带来一定的损失,基于以上的原因,距离服务升级为使用步行距离。

步行距离

计算两点之间的步行距离,由于涉及到道路的规划、距离的测算等等元素,自己实现不现实,我们采用的是使用GIS服务计算步行距离,但距离服务作为到家的一个基础的服务,同步请求GIS服务显然不能满足我们对性能的要求,因此也催生了我们现在的方案,如下图所示

大体上分为两个阶段

  • 阶段一,初始化阶段,初始化服务拉取近半年的订单信息,使用订单中的门店地址经纬度和用户收货地址经纬度结合GIS服务,计算出步行距离并初始化到距离信息库。

  • 阶段二,自更新阶段,对于已下过订单的老用户请求步行距离时,可命中返回距离信息库的步行距离;而对于新用户,在距离信息库中不能命中,此时我们采用的是估算步行距离,使用直线距离乘以经验参数作为估算步行距离返回给用户,新用户继续下单,距离服务实时的监听订单系统的订单消息,进一步的丰富距离信息库,此用户再次请求距离时,距离服务即可命中库中的步行距离;随着用户的不断下单,距离服务实时订阅订单消息,实现了自动更新、自我丰富。

定位服务

定位服务的演进基本分为三个阶段,如下图所示

朴素匹配

到家发展初期,只有少数几个门店,一一列举出这些门店,判断配送范围是否覆盖用户坐标,从而匹配出覆盖门店,但随着门店的增加,此方案不再适用进入到下一阶段。

最小覆盖矩形

计算门店的配送范围的最小覆盖矩形,将所有门店的最小覆盖矩形坐标持久化到数据库中,通过sql语句方式筛选出覆盖用户坐标的门店,此方案支撑了到家一段时间的业务发展,随着用户量的增加,到家访问量也不断增长,通过数据库查询的方式逐渐不能满足我们对性能的要求,进而开始继续演化。

基于墨卡托投影倒排

墨卡托投影

墨卡托投影是正轴等角圆柱投影,假设一个与地轴方向一致的圆柱切或割于地球,按等角条件,将经纬网投影到圆柱面上,将圆柱面展为平面后,即得本投影。经过墨卡托投影后的经线是均匀分布的,纬线是垂直于经线的一组平行直线,也就是说经过投影以后我们把球面转化成了平面。

墨卡托坐标

由上述公式经度λ、纬度θ对应的墨卡托坐标就是(x*R, y*R),其中R为地球半径。通过墨卡托投影,将坐标系转换为平面坐标系,由此,可以依照某种规则将我国所覆盖的区域分成若干大小相同的正方形区域进行标记编号,这些方格就是我们构建倒排索引的基础。

倒排索引

假设现在有三个门店s1、s2、s3,三个门店有不同形状的配送范围,每个方格都有自己的编号,如上图所示。

正排索引

构建出每个门店覆盖的方格列表,即正排索引

  • s1: B2,C2,D2,B3,C3,D3,B4,C4,D4

  • s2: C1,D1,C2,D2

  • s3: C0,D0,E0,C1,D1,E1,D2

倒排索引

依赖正排索引,构建出方格对应的覆盖门店的列表,即倒排索引

  • C0: s3

  • C1: s2, s3

  • D2: s1, s2, s3

  • ……

构建倒排

门店配送范围的倒排索引构建过程如下:

定位过程

依赖于倒排索引,定位门店的流程如下:

定位服务架构

采用倒排索引方案实现定位服务,极大的提升了定位服务的性能,系统不再是业务发展的瓶颈,架构图如下所示:

  • 服务节点:对外提供定位服务,本地内存存储全量倒排、门店基本信息,门店覆盖范围变更,节点需要重新构建对应的倒排信息,并且同步门店的基本信息。

  • 后台web:处理门店门店变更消息,构建对应正排索引,产生门店变更任务供服务节点使用。

问题以及优化

架构趋于稳定,但随着业务的发展,还是出现了一些新的问题,针对这些问题,我们也做了进一步的优化

新的问题

  • 定位精准度不足,如下图所示,虽然门店的配送范围覆盖了方格,但是红色标记区域实际不在门店的配送范围内,实际的运营过程中出现了不少类似的问题,给商家和用户造成了困扰。

  • 瞬时流量影响服务稳定性,平台存在一些配送范围特别大的门店,比如鲜花门店的配送范围是覆盖整个城市,由于倒排索引的构建在每个服务节点都会进行,一旦这种门店上下线,服务节点性能会产生较大的波动,造成调用方超时。

  • JVM内存暴涨,由于倒排索引存储于服务节点的JVM内存,门店不断增加,jvm使用内存越来越大,达到了22G+,大内存下GC时间也随着服务器的运行不断增加,yongGC时间过长,影响了服务的响应时间,一旦发生oldGC服务将处于不可用的状态,这个问题相当严重。

优化策略

  • 定位精准化,在定位过程中加入实时计算是否覆盖模块,过滤掉不覆盖用户坐标的门店。

  • 索引后置、流量削峰

  • 优化架构

服务架构也做了一些调整,新的架构如图所示

优化效果

经过这次优化以后,问题得到了很好的解决,数据对比如下图所示,值得一提的是,服务的平均性能由原来的2ms增加到了4ms,虽然响应时间有所增加,但增加的幅度完全在业务的可接受范围内,带来的好处却是相当明显的。

  • 不再需要大内存机器支撑服务,节约了资源

  • 不再需要定期手动GC,减少了人工运维的成本

  • 服务性能更加平稳,响应时间不再会出现较大波动

总结

定位系统作为京东到家的基础服务,为到家提供了核心的定位以及距离服务,随着到家平台的不断发展,定位系统也随着不断的演进优化,每一次演进优化都朝着提供稳定高可用服务的目标走出坚实的一步,为到家业务的飞速发展提供强有力的保障。

原文链接

https://mp.weixin.qq.com/s/gcHbxXtluHwNMDbaLLJbgw

服务推荐

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/gt9000/article/details/86227595

智能推荐

没有U盘Win10电脑下如何使用本地硬盘安装Ubuntu20.04(单双硬盘都行)_没有u盘怎么装ubuntu-程序员宅基地

文章浏览阅读3.6k次,点赞2次,收藏2次。DELL7080台式机两块硬盘。_没有u盘怎么装ubuntu

【POJ 3401】Asteroids-程序员宅基地

文章浏览阅读32次。题面Bessie wants to navigate her spaceship through a dangerous asteroid field in the shape of an N x N grid (1 <= N <= 500). The grid contains K asteroids (1 <= K <= 10,000), which are conv...

工业机器视觉系统的构成与开发过程(理论篇—1)_工业机器视觉系统的构成与开发过程(理论篇—1-程序员宅基地

文章浏览阅读2.6w次,点赞21次,收藏112次。机器视觉则主要是指工业领域视觉的应用研究,例如自主机器人的视觉,用于检测和测量的视觉系统等。它通过在工业领域将图像感知、图像处理、控制理论与软件、硬件紧密结合,并研究解决图像处理和计算机视觉理论在实际应用过程中的问题,以实现高效的运动控制或各种实时操作。_工业机器视觉系统的构成与开发过程(理论篇—1

plt.legend的用法-程序员宅基地

文章浏览阅读5.9w次,点赞32次,收藏58次。legend 传奇、图例。plt.legend()的作用:在plt.plot() 定义后plt.legend() 会显示该 label 的内容,否则会报error: No handles with labels found to put in legend.plt.plot(result_price, color = 'red', label = 'Training Loss') legend作用位置:下图红圈处。..._plt.legend

深入理解 C# .NET Core 中 async await 异步编程思想_netcore async await-程序员宅基地

文章浏览阅读2.2k次,点赞3次,收藏11次。深入理解 C# .NET Core 中 async await 异步编程思想引言一、什么是异步?1.1 简单实例(WatchTV并行CookCoffee)二、深入理解(异步)2.1 当我需要异步返回值时,怎么处理?2.2 充分利用异步并行的高效性async await的秘密引言很久没来CSDN了,快小半年了一直在闲置,也写不出一些带有思想和深度的文章;之前就写过一篇关于async await 的异步理解 ,现在回顾,真的不要太浅和太陋,让人不忍直视!好了,废话不再啰嗦,直入主题:一、什么是异步?_netcore async await

IntelliJ IDEA设置类注释和方法注释带作者和日期_idea作者和日期等注释-程序员宅基地

文章浏览阅读6.5w次,点赞166次,收藏309次。当我看到别人的类上面的多行注释是是这样的:这样的:这样的:好装X啊!我也想要!怎么办呢?往下瞅:跟着我左手右手一个慢动作~~~File--->Settings---->Editor---->File and Code Templates --->Includes--->File Header:之后点applay--..._idea作者和日期等注释

随便推点

发行版Linux和麒麟操作系统下netperf 网络性能测试-程序员宅基地

文章浏览阅读175次。Netperf是一种网络性能的测量工具,主要针对基于TCP或UDP的传输。Netperf根据应用的不同,可以进行不同模式的网络性能测试,即批量数据传输(bulk data transfer)模式和请求/应答(request/reponse)模式。工作原理Netperf工具以client/server方式工作。server端是netserver,用来侦听来自client端的连接,c..._netperf 麒麟

万字长文详解 Go 程序是怎样跑起来的?| CSDN 博文精选-程序员宅基地

文章浏览阅读1.1k次,点赞2次,收藏3次。作者| qcrao责编 | 屠敏出品 | 程序员宅基地刚开始写这篇文章的时候,目标非常大,想要探索 Go 程序的一生:编码、编译、汇编、链接、运行、退出。它的每一步具体如何进行,力图弄清 Go 程序的这一生。在这个过程中,我又复习了一遍《程序员的自我修养》。这是一本讲编译、链接的书,非常详细,值得一看!数年前,我第一次看到这本书的书名,就非常喜欢。因为它模仿了周星驰喜剧..._go run 每次都要编译吗

C++之istringstream、ostringstream、stringstream 类详解_c++ istringstream a >> string-程序员宅基地

文章浏览阅读1.4k次,点赞4次,收藏2次。0、C++的输入输出分为三种:(1)基于控制台的I/O (2)基于文件的I/O (3)基于字符串的I/O 1、头文件[cpp] view plaincopyprint?#include 2、作用istringstream类用于执行C++风格的字符串流的输入操作。 ostringstream类用_c++ istringstream a >> string

MySQL 的 binglog、redolog、undolog-程序员宅基地

文章浏览阅读2k次,点赞3次,收藏14次。我们在每个修改的地方都记录一条对应的 redo 日志显然是不现实的,因此实现方式是用时间换空间,我们在数据库崩了之后用日志还原数据时,在执行这条日志之前,数据库应该是一个一致性状态,我们用对应的参数,执行固定的步骤,修改对应的数据。1,MySQL 就是通过 undolog 回滚日志来保证事务原子性的,在异常发生时,对已经执行的操作进行回滚,回滚日志会先于数据持久化到磁盘上(因为它记录的数据比较少,所以持久化的速度快),当用户再次启动数据库的时候,数据库能够通过查询回滚日志来回滚将之前未完成的事务。_binglog

我的第一个Chrome小插件-基于vue开发的flexbox布局CSS拷贝工具_chrome css布局插件-程序员宅基地

文章浏览阅读3k次。概述之前介绍过 移动Web开发基础-flex弹性布局(兼容写法) 里面有提到过想做一个Chrome插件,来生成flexbox布局的css代码直接拷贝出来用。最近把这个想法实现了,给大家分享下。play-flexbox插件介绍play-flexbox一秒搞定flexbox布局,可直接预览效果,拷贝CSS代码快速用于页面重构。 你也可以通过点击以下链接(codepen示例)查_chrome css布局插件

win10下安装TensorFlow-gpu的流程(包括cuda、cuDnn下载以及安装问题)-程序员宅基地

文章浏览阅读308次。我自己的配置是GeForce GTX 1660 +CUDA10.0+CUDNN7.6.0 + TensorFlow-GPU 1.14.0Win10系统安装tensorflow-gpu(按照步骤一次成功)https://blog.csdn.net/zqxdsy/article/details/103152190环境配置——win10下TensorFlow-GPU安装(GTX1660 SUPER+CUDA10+CUDNN7.4)https://blog.csdn.net/jiDxiaohuo/arti