如何提升网约车用户体验?南大&滴滴提出复合弱监督学习方法,AUC提升5%以上

2020-02-25 14:41:05 来源:网络整理 作者:管理员

原标题:如何提升网约车用户体验?南大&滴滴提出复合弱监督学习方法,AUC提升5%以上

作者 | 郭兰哲

编辑 | 贾伟

本文解读南京大学机器学习与数据挖掘LAMDA研究所李宇峰研究组与滴滴网约车技术团队合作完成的工作《Weakly Supervised Learning Meets Ride-Sharing User Experience Enhancement》,发表于AAAI 2020。

如何提升网约车用户体验?南大&滴滴提出复合弱监督学习方法,AUC提升5%以上

论文链接:https://arxiv.org/abs/2001.09027

现有机器学习技术得以成功的背后往往依赖充足的标记数据。然而,充足标记数据的获取非常困难,因为现实任务中数据标记的速度往往赶不上数据产生的速度。弱监督学习(不依赖充足标记数据的机器学习框架)[1]更为贴近现实任务,但也更为困难。

弱监督学习研究主要围绕各种特定弱监督数据信号开展[1]。例如,半监督学习旨在研究监督信息不完整(Incomplete)的数据;噪声标记学习旨在研究监督信息不准确(Inaccurate)的数据;多示例学习旨在研究监督信息不具体(Inexact)的数据等。南京大学LAMDA团队常年来对弱监督学习相关技术瓶颈开展基础研究,提出了具有性能保障的安全半/弱监督学习、自动半监督学习等工作[2][3]。

随着弱监督学习不断走向实际应用,单纯的弱监督学习技术已越来越难于满足现实任务的需求。其原因之一在于,往常的弱监督学习技术仅适合一种弱监督数据信号,类似于某药方(弱监督学习技术)仅适用于某特定病症(弱监督数据信号)。然而,现实任务的数据同时伴随着多种弱监督数据信号时有发生,类似于多种病症常伴随出现。能够协同处理多种病症的复合弱监督学习(Compound Weakly Supervised Learning)技术非常必要。然而,该方面鲜有相关基础研究工作,也包括结合实际业务数据的应用案例剖析,亟待开展研究。

本文基于滴滴智能司乘评价的实际业务场景,展示复合弱监督学习的必要性和实际效用。

具体而言,业务背景情况如下:随着移动互联网颠覆性变革,网约车不断发展普及,已进入人们日常生活。滴滴作为领先的一站式移动出行平台,深刻影响着人们的出行和生活方式。为尽可能地提升用户体验、建设良好的司乘生态,网约车智能司乘评价体系起着至关重要的作用,需兼顾乘客体验、司机接单公平性与平台效能。

在智能评价体系中,每个乘客乘车结束后手机端都会收到一个推荐的评价问题,如“司机是否绕路?”。如果该回答能够很好的反映出此次行程的不足,那将有助于平台对司机进行教育,以提高用户的体验。借助机器学习来进行评价问题推荐就是智能评价体系的主要目标。

然而,这其中存在两个严重影响机器学习性能的数据问题,

一是数据存在严重的标记噪声,因为评价结果往往受到乘客主观因素的影响,导致收集到的标记不准确,同时也存在着大量误操作和乘客随意评价的情况;

二是数据标记分布存在偏差,即训练数据中差评与好评数据的标记分布和真实线上环境的标记分布存在明显的差距。

围绕这类实际数据问题,需要发展复合弱监督学习技术。本文提出的复合弱监督学习技术明显优于单纯弱监督学习技术,可将AUC性能提升5%以上。

技术方案

本文技术方案采取一种基于双层优化的新框架。具体而言,针对标记噪声问题,我们对样本进行赋权,其目的是希望能够对噪声样本赋予较低的权重,从而减少其对模型性能的影响,目标函数如下所示:

如何提升网约车用户体验?南大&滴滴提出复合弱监督学习方法,AUC提升5%以上

其中w表示样本权值,θ为模型参数。

针对标记分布不匹配的问题,我们优化对标记分布更为鲁棒的性能指标AUC:

如何提升网约车用户体验?南大&滴滴提出复合弱监督学习方法,AUC提升5%以上

此外,“好”的样本赋权机制应该可以保证其得到的模型在验证数据上表现良好。综合以上思路,技术方案采用如下双层优化目标式实现:

如何提升网约车用户体验?南大&滴滴提出复合弱监督学习方法,AUC提升5%以上

其中内层优化步骤最小化训练数据上的经验风险,外层优化步骤评估验证数据上的性能表现。两者的结合,不断优化训练模型。

技术方案的整体流程如下图所示:

如何提升网约车用户体验?南大&滴滴提出复合弱监督学习方法,AUC提升5%以上

同时,文章为技术方案提出了高效的优化算法。详细优化技术细节请参见论文阐述。

应用效果

在滴滴司乘评价数据中,复合弱监督学习技术方案和仅考虑一种弱监督数据信号的单纯弱监督学习算法进行比较。比较方法包括标记分布修正[4]后的监督学习算法: Logistic Regression (LR)、Deep Neural Network (DNN)、XGBoost;处理标记噪声的SOTA算法 Rank Pruning[5],GLC[6]和LTR[7],具体的实验结果如下:

如何提升网约车用户体验?南大&滴滴提出复合弱监督学习方法,AUC提升5%以上

本文提出的复合弱监督学习技术方案明显优于单纯弱监督学习技术,可将AUC性能提升5%以上,并维持不错的效率。

该研究成果不仅在评价数据的利用上对推荐结果有很好的提升,并且对司乘纠纷公平判责、地图POI挖掘等场景有比较好的借鉴意义。

参考文献

[1] Zhi-Hua Zhou. "A brief introduction to weakly supervised learning." National Science Review 5.1 (2018): 44-53.

[2] Yu-Feng Li, Lan-Zhe Guo, and Zhi-Hua Zhou. "Towards Safe Weakly Supervised Learning." IEEE Transactions on Pattern Analysis and Machine Intelligence (2019).

[3] Yu-Feng Li, Hai Wang, Tong Wei, Wei-Wei Tu. Towards Automated Semi-Supervised Learning. AAAI'19, Honolulu, HI, 2019, pp.4237-4244.

[4] Dal Pozzolo, A., Caelen, O., Johnson, R. A., & Bontempi, G. "Calibrating probability with undersampling for unbalanced classification." IEEE Symposium Series on Computational Intelligence, 2015, 159-166.

[5] Northcutt, C. G.; Wu, T.; and Chuang, I. L. Learning with confident examples: Rank pruning for robust classification with noisy labels. UAI 2017.

[6] Hendrycks, D.; Mazeika, M.; Wilson, D.; and Gimpel, K. Using trusted data to train deep networks on labels corrupted by severe noise. NIPS 2018, 10456–10465.

[7] Ren, M.; Zeng, W.; Yang, B.; and Urtasun, R. Learning to reweight examples for robust deep learning. ICML 2018, 4331–4340.

显示全文
为您推荐
文艺复兴三杰分别是谁 前三杰后三杰共六人(皆是时代伟人)
文艺复兴三杰分别是谁 前三杰后三杰共六人(皆是时代伟人)

文艺复兴分为前三杰和后三杰,前三杰是指但丁、彼特拉克、薄伽丘,后三杰是拉斐尔、米开朗基罗、达芬奇。这六个人都有着杰出的作品,在各自领域上发扬光彩,当时的意大利就处在文化发展的高峰期,所以诞生出了很多的人才。...

发布时间:2023-10-03 03:00:10

原美颌龙:欧洲小型恐龙(长1.2米/出土于德国)
原美颌龙:欧洲小型恐龙(长1.2米/出土于德国)

【导读】 原美颌龙:欧洲小型恐龙(长1.2米/出土于德国),下面是小编为你收集整理的,希望对你有帮助!原美颌龙是一种兽脚类恐龙,诞生于2.22亿年前-2.19亿年前的三叠纪中期,体长普遍可达1.2米,属于小型肉食恐龙的一种,它们的骨骼非常轻盈,后肢和尾巴都非常修长,因此动作敏捷。第一批原美颌龙化石是在......

发布时间:2023-10-03 02:01:19

为什么宋朝之后无中国 宋朝这个朝代有什么特别的
为什么宋朝之后无中国 宋朝这个朝代有什么特别的

很多人都提到过宋朝之后无中国,这句话是有依据的。在宋朝之前,古代中国都是由汉人掌握政权的,但是到了元代,就由别的民族开始主张政权,清朝也是由别的民族执掌政权,和这句话并列的一句是明亡之后无华夏。...

发布时间:2023-10-03 02:00:12

狭盘龙高清图片
狭盘龙高清图片

【导读】 狭盘龙高清图片,下面是小编为你收集整理的,希望对你有帮助!狭盘龙说到恐龙,大家想到的都是大型或凶猛的恐龙,比如身长80米的易碎双腔龙,战斗力极强的霸王龙等。而为了丰富大家的恐龙知识,小编今天为大家介绍一个冷门恐龙,它就是狭盘龙,一种体型很小的恐龙。狭盘龙基本......

发布时间:2023-10-03 01:01:11

为什么恐怖片当中女性居多 女性角色比较多样化有戏剧性
为什么恐怖片当中女性居多 女性角色比较多样化有戏剧性

女性在古代社会中是属于底层的,男性的地位更高一些,在小说中把柔弱的女性写的很强大,这样会更可怕一些,在恐怖片中都是以女性和小孩为鬼的,弱势群体总是把男性强势群体吓的大喊大叫,这样也是在提高女性的地位。...

发布时间:2023-10-03 01:00:08

牛肉丝炒菜配哪些菜
牛肉丝炒菜配哪些菜

【导读】 牛肉丝炒菜配哪些菜,下面是小编为你收集整理的,希望对你有帮助!芹菜、茭白、香菜、胡萝卜、蒜薹等。芹菜炒牛肉丝的做法:1、备好香芹和牛肉丝。2、把芹菜去老叶,根后切段洗净。3、热锅倒油,油温7成热。4、把牛肉丝倒入煸炒至全部变色后捞起。5、把芹菜倒入,不断的煸炒至......

发布时间:2023-10-03 00:01:41

为何刘娥一生专宠 刘娥是怎么和赵恒相遇的
为何刘娥一生专宠 刘娥是怎么和赵恒相遇的

赵恒第一次遇到刘娥便对她一见钟情,但无奈家庭背景悬殊太大,赵恒只能把刘娥藏了起来,想方设法的与她幽会,但这一藏就是十几年。等赵恒登上皇位,才把刘娥接回宫中。刘娥利用这十几年时间不断精进自己,学习琴棋书画,甚至学习治国之道,入宫之后为人低调深得人心,帮赵恒分忧解难,当然她也因此受到了一生专宠。...

发布时间:2023-10-03 00:00:38

雪耳糖水的做法煮多久
雪耳糖水的做法煮多久

【导读】 雪耳糖水的做法煮多久,下面是小编为你收集整理的,希望对你有帮助!1、将红枣、枸杞子、桂圆干洗干净,红枣去核备用。2、将银耳泡10分钟,然后去蒂,撕成小块备用。3、将银耳、红枣、枸杞子、桂圆干一起放进锅里煲。4、大概煲40分钟左右,加入冰糖即可食用。银耳属于菌类食物......

发布时间:2023-10-02 23:01:26

铁西瓜为什么叫铁西瓜 它是因为什么而得名的
铁西瓜为什么叫铁西瓜 它是因为什么而得名的

铁西瓜得名的由来还是要从它成熟之后的表现说起,铁西瓜成熟之后的果实会在感受一定压力的时候发生爆炸,其爆炸的威力甚至可以把小鸟炸死炸残。它虽然外表光鲜,实际上它是不能食用的,它的表皮坚硬似铁,果肉呈现一种粘稠状,有异味,口感非常差,它主要被用在给游客们观赏。...

发布时间:2023-10-02 23:00:23

20寸有多大
20寸有多大

【导读】 20寸有多大,下面是小编为你收集整理的,希望对你有帮助!20寸等于66.67厘米,1寸=3.33厘米。照片的尺寸以长边的英寸计算,20寸照片即照片的长边为20英寸(1英寸=2.54cm)。另一边可以根据自己需要裁剪,一般标准尺寸为16*20英寸(40.64......

发布时间:2023-10-02 22:01:13

泰国恐怖片和日本恐怖片区别 哪个国家的恐怖片比较惊悚
泰国恐怖片和日本恐怖片区别 哪个国家的恐怖片比较惊悚

日本绝对算的上是拍摄恐怖片的顶级国家,日本有很多有名的恐怖片,在世界上都能排在前列,泰国的恐怖片也是比较吓人的,但是没有日本的如此恐怖,故事情节比日本的相对较强,两个国家的恐怖电影质量都比较高。...

发布时间:2023-10-02 22:00:09

太屑了是什么梗:比人渣还要渣是屑(对反派的愤慨)
太屑了是什么梗:比人渣还要渣是屑(对反派的愤慨)

【导读】 太屑了是什么梗:比人渣还要渣是屑(对反派的愤慨),下面是小编为你收集整理的,希望对你有帮助!我们在看电影电视剧和一些小说时,弹幕或者评论区也会有一些人在讨论,看到反派讨人厌的行为,或者是非常过分的行为时,大家就会骂那个人是人渣或者屑,虽然人渣大家都明白是什么意思,但是对于屑我们却有点陌生了,......

发布时间:2023-10-02 21:01:19