用户
 找回密码
 立即注册
搜索

26

主题

45

帖子

173

积分

游客

积分
173
发表于 2017-7-20 17:57:24
本帖最后由 超威 于 2017-7-20 17:57 编辑

作者|张凌宇编辑|小智

【“猜你想去”是滴滴出行大数据智能预测体系的主要功能之一。通过此功能,滴滴可为一些大型商超、火车站等人流密集场所提供出行解决方案建议。目前“猜你想去”功能已覆盖了滴滴平台上 30% 的订单,预测准确率达 90%。与“猜你想去”功能相关的专利也已提交受理。】

1写在前面

       滴滴的“猜您去哪”目的地预测系统是我们的一个非常酷炫的系统,背后有着强劲的算法和技术支撑。

当用户打开滴滴出行 app 的时候,如果我们的系统能够猜用户即将去往的目的地,就会填写到“猜您要去”的框中。大多数用户评论这个功能的时候,都会说我们猜的是准的,很酷炫。


      这个功能有什么用呢?我们在设计这个功能的时候,有这么几个出发点:一是要能方便用户,降低用户发单时候的输入成本;二是要惊艳用户,彰显滴滴的人工智能科技,以 90% 以上的准确率,预测 30% 以上的出行;三是预测人群的出行流向,从而更好的规划交通运力。

下面会从我们问题定义、模型抽象、用数据统计求解模型以及数据分享等几个方面进行介绍。


2定义问题:从业务场景到模型抽象

      研发工程师每天都会面对的一个场景,就是产品经理提需求。当时我们是把需求定义成这样一个问题:通过用户的出行历史,预测用户当前时间、当前地点下的出行目的地。


      有了问题定义之后接下来就是要把这个问题抽象成预测模型。T 是当前时间,S 是当前位置,X 是预测目的地,我在当前时间、当前地点出发,在这个条件下用户即将去往的那个目的地条件概率应该是远远大于他去其他地方的概率。比如说今天晚上九点我在酒店打开滴滴出行 APP,如果查出我去虹桥机场的远远大于外滩的概率,那么这个系统就猜去我去虹桥机场。这是一个条件概率的问题。

2.jpg


3从 0 到 1 快速搭建模型:基于互信息选择主要特征

      有了模型之后,我们由简单到复杂地从 0 到 1 快速搭建系统。目的地是待预测的变量,时间变量是一个复合变量,包含日期和时刻,比如日期为 2016 年 8 月 23 日,时刻是 18 点 10 分。地址变量也是复合变量,包括地址名称和经纬度。这些变量又包含不同的类型,比如说地址名称,是一个离散型的随机变量,经度和纬度是连续性变量,时间是周期型变量,经度和纬度两个联合起来又是一个二维的联合变量。把所有这些变量都用起来,让每个变量都充分发挥它的功能,是我们要研究的长期课题。而现阶段,我们的目标是快速搭建一个系统,快速上线。


      这个时候,面对这么多特征,我们需要做的首先是选择一个主要特征。特征选择的原则,是选择和被预测变量最相关的特征。通常,度量变量之间的相关性的指标是皮尔逊系数和互信息。皮尔逊系数通常用来衡量两个连续型随机变量的相关性,计算出来的结果是线性相关性。刚才我们说到我们的备选特征既有连续型,也有离散型,还有周期型和复合型的,所以在这我们选择了互信息来衡量变量之间的相关性。因为我们的目标是目的地,待选特征先圈定了出发地、出发时刻、出发时期这三个变量。


4精益求精:模型的进一步调优与优化

      简单的模型之后,下一步我们要追求更好的效果,也就是要一步步把这个模型做的越来越复杂。首先我们看另一个单一的特征,这次不选出发时刻了,选出发地经纬度。下面是一个用户出发目的地出发经纬度的聚合,这个特征也具有正态分布的性质,有一个中心点,离这个中心越来越远,对应的频次会越来越低。

8.jpg






使用道具 举报 回复
发表于 2017-7-20 17:57:24
看了,感觉不错
使用道具 举报 回复 支持 反对
发表于 2017-7-27 18:13:19
朋友不错,谢谢您的努力,顶了
使用道具 举报 回复 支持 反对
发表于 2018-1-24 02:33:51
做个记号,下次好找!
使用道具 举报 回复 支持 反对
请楼主继续发好贴,支持你
使用道具 举报 回复 支持 反对
发表于 2018-6-28 05:37:20
这个贴不错!
使用道具 举报 回复 支持 反对
发表于 2018-10-2 22:58:07
帮你顶,人还是厚道点好
使用道具 举报 回复 支持 反对
发表于 2018-12-26 05:42:05
辛苦了,请继续努力发好帖!
使用道具 举报 回复 支持 反对
发表于 2020-3-16 23:23:54
这个还不错,好帖子,大家来谈谈
使用道具 举报 回复 支持 反对
发表于 2020-3-17 22:36:03
看后有点感悟了,谢谢
使用道具 举报 回复 支持 反对
1234下一页
发新帖