谷歌利用机器学习攻克“停车难”,Uber开放全球20亿行程数据

wx60f930d18a1cf 2021-07-25 15:31:58 阅读数:654

本文一共[544]字,预计阅读时长:1分钟~
机器学习

 

 

谷歌利用机器学习攻克“停车难”

 

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

 

上周,谷歌地图在美国25个城市发布了一个面向Andriod的新功能,提供关于目的地附近的停车情况预测,以便司机能作出相应的计划。提供这一功能需要解决以下一些主要的难题:

 

  1. 空车位的情况根据时间、星期 、天气、特殊事件、假期等因素是高度变化的。问题如此复杂,所以关于免费停车位,目前几乎没有实时的信息。

     

  2. 即使是在那些用联网的停车计时器提供空车位信息的区域,这些数据并没有包含那些非法停车、持证停车或者提前离开的停车信息。

     

  3. 道路组成的是一个二维的图表,但是,停车图表的结构可能会是更加复杂的,车流的交汇包含多层信息,很可能包含了不同的布局。对于停车来说,供给与需求都是不断变化的,所以,即便是最好的系统也会面临着一建好就过时的风险。

 

 

要解决这些挑战,谷歌的研究员结合了众包(crowdsourcing)和机器学习技术,开发了一个系统,为司机提供关于目的地停车的信息,甚至还能帮助你决定出行方式。

 

在一个预览版本中,他们发现,出行方式按钮的点击率有显著的提高。这意味着,用户在对停车难的问题有了额外的了解后,他们会更愿意选择公共交通而不是驾车出行。

 

要为解决停车难的问题设计一个算法,需要三方面的技术:通过众包的方法获得地面实况数据;一个恰当的机器学习模型,以及一系列稳定的特征(features)来训练模型。

 

 

 

地面实况数据

 

搜集高质量的地面实况数据对于任何机器学习解决方案的开发来说通常都是一个关键的难题。谷歌的做法是,在不同的地点和时间,对司机进行采访,看他们是否遇到了停车难的问题。但是,我们发现,面对这样主观的问题,通常会得到相互矛盾的答案:在某一特定的地点,有人可能会觉得很“容易”找到停车位,但是其他人会觉得“很难”。

 

 

 

模型特征

 

有了这些可用的数据,下一步就是选择用来训练模型的特征。运用集体的智慧,该项目从愿意分享个人定位数据的用户中收集匿名信息,这已经是实时交通、热门停车时间和访问持续时间测量的重要信息来源。

 

谷歌研究员称,他们很快便发现,即便有了需要的数据,但是还是会有一些独特的挑战悬而未决。比如,如果有人在自己门前或者私人的停车位停车,系统不该错误地认为这里的停车位是可用的。用户搭乘出租车到达,可能会造成门前停车很多的假象,类似的,公共交通用户可能会被系统认为是在公家车站停车。这些错误的认知,都会误导机器学习系统。

 

因此,系统的设计需要更强大的聚合特征。不奇怪,其中一个功能的灵感来自谷歌所在的 Mountain View。如果Google导航观察到许多用户在午餐时间开着车在市中心绕圈,它表明停车可能非常困难:

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

谷歌的研究员在思考,如何把这些关于停车难的“蛛丝马迹”作为一个特征来进行训练。在这一例子中,研究员考虑了用户开车到门口和他们实际到达之间的差异,将绕圈、停车和步行作为参考因素。如果多数用户在二者之间所用的时间存在显著差异,就被认为是遇到了停车难的问题。

 

从那里,我们继续开发更多的功能,考虑到任何特定的目的地,停车位置的分散,日时钟和日期依赖的停车(例如,如果用户在清晨接近目的地,但是更远的繁忙时间?),历史停车数据等。

 

以这一点为基础,研究员进一步开发了更多的特征,将目的地的特殊性、停车位的分散、决定停车难问题的时间和日期、历史停车数据等都考虑了进来(例如,如果用户在早上停车离目的地比较近,但是在更繁忙的时候,只能停得远一些,会怎么样?)最终,他们得到了近20个不同的特征、4个模型。接下来就是调整模型性能了。

 

 

 

模型选择&训练

 

针对这些特征,研究员使用了一个标准的回归机器学习模型。这种选择有几个原因:首先,逻辑回归的原理是大家所熟知的,并且,在训练数据中,它对噪音是有弹性(resilient)的;第二,很自然地,可以将这些模型的输出解释为停车难的概率,然后可以将其映射成描述性术语,如“停车位有限”或“轻松停车”;第三,很容易理解每个特定特征的影响,这使得验证模型是否合理更加容易。例如,当我们开始训练时,我们许多人认为上述“蛛丝马迹”的功能将是“silver bullet”(良方),可以解决所遇到的难题。让人吃惊的是,情况根本不是这样,事实上,它是基于停车位置的分布特征的,这是停车难的最有力的预测之一。

 

 

 

结果

 

谷歌在官方博客中写道:使用我们的模型,我们能够生成关于任何地点和时间的停车难度的估计。下图给出了我们的系统的输出的几个例子,用于提供给定目的地的停车难度估计。例如,星期一上午,整个城市停车都是困难的,特别是在最繁忙的金融和零售区。在星期六晚上也很困难,但主要是在餐馆和景点地区。

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

谷歌的研究员说:“我们很高兴有机会根据用户反馈继续提高模型质量。如果我们能够更好地了解停车难度,我们将能够开发新的和更智能的停车辅助系统, 对于ML的未来应用,我们都很兴奋,希望AI能带来更让人享受的交通体验。”

 

 

 

 

Uber免费开放全球20亿行程数据 

 

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

 

自2011 年正式上线至今,Uber 在从超过 450 个运营城市中积累了超过 20 亿个行程订单,而这些行程提供了海量的数据。Uber 自己拥有一支强大的科学家团队,一直在用数据辅助产品和运营部门的决策——最常见的就是设定和调节峰值定价,让更多人更从容地坐上车。

 

今年一月初,Uber 决定将这些数据分享出来,提供给市政规划部门、社科专家学者和有所需求的人。Uber Movement 平台应运而生。

 

具体来说,每一个行程都至少有出发地、目的地、发生时间、行程用时四个数据,四个变量。而 Uber Movement 可以让用户设定自己的规则,观察这些数据的走势变化和不同,得出结论,或佐证判断。

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

 

举一些很简单的例子:如果我们锚定出发地(北京中关村)和目的地(北京首都机场)不变,观察一天中不同时间段的行程用时,则可以发现一天中从西北四环到机场高速拥堵的变化情况;再比如,我们可以把一年中所有晴天的行程持续时间拿出来跟雾霾天做个对比,就能做出雾霾是否影响交通的判断,得出影响程度究竟有多深——没错,Uber Movement 就是做这个用的。

 

Uber官网 已经提供了菲律宾-马尼拉、澳大利亚和美国-华盛顿特区三个案例,采用它们过去的行程数据,分析了节假日拥堵情况、一年中主要交通干道的承载情况,以及当路面交通与轨道交通相结合时的互补情况。

 

特别是华盛顿特区的案例:该地区有着全美第二大地铁轻轨系统 Metrorail,去年 3 月 16 日因起火而全线停运,进而导致了当天华府出现严重的交通崩溃。Uber Movement 提取了事故发生的当天,以及后来运输部门定期停运维修时的路面交通情况,制作了一张地图,找到受影响最严重的区域并结合实际情况分析其原因。现在,这份报告已经提交给了当地的交通和运管部门,助其优化 Metrorail 的线路和时刻表,并制订新的维修计划,从而将对城市交通造成的影响降到最低。

 

Uber 在官网上提供了 Movement 网页端工具,免费供人使用,不过感兴趣者仍需要写邮件申请才能获得使用的权限。Uber 现在还在邀请一些有初步合作意向的市政规划和科研单位进行早期测试,也表示会“尽快”向公众开放。

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

 

 

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

谷歌攻克停车难, Uber开放行程数据

- DataCastle -

 

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

 

 

版权声明:本文为[wx60f930d18a1cf]所创,转载请带上原文链接,感谢。 https://blog.51cto.com/u_15310860/3182146