机器学习在搜索排序中的应用 一淘及搜索事业部-搜索技术 仁重.

Slides:



Advertisements
Similar presentations
简单迭代法的概念与结论 简单迭代法又称逐次迭代法,基本思想是构造不动点 方程,以求得近似根。即由方程 f(x)=0 变换为 x=  (x), 然后建立迭代格式, 返回下一页 则称迭代格式 收敛, 否则称为发散 上一页.
Advertisements

手工加工全框眼镜技术 前调整确定加工基准制作模板割边 磨边磨安全角 (抛光) 装配 后调整检测.
融资融券业务的保证金与保证金比例 光大证券 · 信用业务管理总部 2015 年 12 月 ★融资融券业务投资者教育活动材料★
蒙牛的市场定位 — 先创品牌,后占市场 2005 年,湖南电视台举办的超级女生大赛掀起了 一股狂热,而在这场文化运动的背后,超级女生大赛的 幕后导演 —— 蒙牛乳业成为了最大赢家,获得了巨大的 成功。 在宣传上,蒙牛的媒体曝光率可谓空前,长达 8 个 月的持续热捧,使得蒙牛和竞争对手在宣传方面拉开了.
道家養生保健長壽藥膳 藥膳應用原則: 天人相應,道法自然 藥膳有兩個職能: 一是保健增壽,一是治療疾病。 ◎ 黃蕙棻.
不要叫我外籍新娘 小組名單 張婉娟 卓莉秋 廖敬萱 廖敬萱 余淑釩 余淑釩.
《公路纵断面设计》 —— 纵断面设计的要求 道桥系 二○○七年五月. 纵断面设计的一般要求 1 .纵坡设计必须满足《公路工程技术标准》中的各项规定。 2 .为保证汽车能以一定的车速安全舒顺地行驶,纵坡应具有 — 定 的平顺性,起伏不宜过大及过于频繁。尽量避免采用极限纵坡 值.缓和坡段应自然地配合地形设置,在连续采用极限长度的.
未婚懷孕:你想清楚了嗎. 家事?國事?天下事? 台灣未成年小媽媽 比例冠亞洲 衛生署統計台灣性行為低齡化,最小的僅 十二歲半。 未成年懷孕,台灣是千分之十二點九五。 九月墮胎潮.
104-2 社團聯席會議 人社二館第五講堂 第 1 次社團聯席會 會議議程 一、邱學務長致詞 : 二、王麗倩組長致詞 : 三、課外組報告: 課外活動經費核銷事項 --- 松漢 社課鐘點費核銷事項 --- 松漢 3. 三社聯合成發之講堂租借規定說明.
第二节 脉搏的评估及异 常时的护理. 教学目标  1 、解释有关名词  2 、说出脉搏、呼吸的正常值  3 、叙述脉搏、呼吸的测量方法;识别脉搏、 呼吸的异常变化  4 、叙述测量脉搏、呼吸的注意事项  5 、正确记录脉搏、呼吸,做到认真负责,实 事求是。
项目四、腻子的施工  一、准备工作  二、安全与卫生  三、板件表面的处理  四、准备腻子  五、刮腻子  六、腻子的干燥  七、腻子的打磨  结束.
如何準備社工師考試 講 師:張雅惠 社工師 演講日期:
FD班座谈会 -结合学校目标 找准自己位置-
会计报表网上申报操作指南 (以小企业会计准则为例) 松江区税务局 2014年7月.
专利技术交底书的撰写方法 ——公司知识产权讲座
冷 热 疗 法.
600年前,鄭和率領世界上最強大的艦隊,浩浩蕩蕩的駛入印度洋,展開一場「文化帝國」的海上大秀。
個人理財規劃 第八章 投資規劃.
保育员工作职责.
進步觀的盛行 18世紀前:未曾流行 18世紀:啟蒙思潮時開始提出,因相信理性與教育 19世紀:進步觀因工業革命有成而流行
开天门 梅州市中医医院 郑雪辉.
小儿斜颈的诊断与治疗.
我征服了黃山 林達的黃山之旅 2006春.
中式面点技艺 长春市商业职业技术学校 王成贵 中式面点技艺 长春市商业职业技术学校 授课教师: 王 成 贵.
消防安全知识讲座 ---校园防火与逃生 保卫科.
大规模机器学习算法GBDT及应用 王志伟(冰逸)
Π π π 大學生你 了沒 別讓落伍找上你 嘉藥學程 幫你打造第二專長 讓你揚眉吐氣~ 嘉南藥理科技大學 教務處 課務組 製.
舊高等農林學校作業室.
关于在宝钢全体党员中开展“学党章党规、 学系列讲话,做合格党员”学习教育的 实施方案
第三章 儿童少年、女子及 中老年的体育卫生 第一节 儿童少年的体育卫生
第五讲 国家公务员制度 主要内容: 一、当代中国公务员制度的建立、发展 二、中国公务员制度建设的内涵与特色 三、中西公务员制度改革比较
高澱粉蔬菜是主食 文字取材: 蘇逸晴.
大家都来关注国家安全 南京市江宁中学 傅德柱.
学生学业水平诊断与提升策略探究 平阳中学 周秀丽.
第一章信託法 第一節 信託契約 第二節 信託財產 第三節 受益人 第四節 受託人 第五節 信託關係之消滅.
征服火灾是全社会的事业,它需要科技的进步,需要消防监督,也需要消防科学知识的普及和提高。通过各类的消防安全培训,从而使人们更好的掌握消防常识和了解消防法规,提高消防安全意识,提高自防自救能力,使我们的生产和生活远离火灾的侵袭。
微服務 心感動 讓購物也可以成為另一種品味生活的享受 【微笑達人】徵戰舞台 活動日期:104 年 2月 5日~104 年 3月24日.
如何做好財金人職涯規劃 演講者:張志豐
法國大革命                                                                            
足球運動情報蒐集與分析 趙榮瑞 教授.
揭秘 庄家 股市中的 为什么你的股票一买就跌,一卖就涨? 为什么出了利好,股价反而下跌? 为什么有的股票一直涨停?
第五冊 第九課 李 家 寶 朱天心.
講師:賴玉珊 心理師 證照:諮商心理師(諮心字第001495號) 學歷:國立台南大學諮商與輔導研究所 畢 現任:長榮大學諮商中心專任心理師
二、汽化和液化.
复习: 一、细胞膜的成分 1、脂质 2、蛋白质 3、糖类 二、生物膜的功能: 1、界膜 2、控制物质的进出 3、进行细胞间信息交流.
第九章 病人卧位与安全的护理.
四种命题 班级:C274 指导教师:钟志勤 任课教师:颜小娟.
糖 生命的天使 衰老的殺手.
第1节人体内物质的运输 人体的组织细胞每时每刻都需要营养物质和氧,并不断产生二氧化碳、尿素等废物。这些物质在人体内运输主要依靠 系统。人体的血液循环系统由 、 和 组成。 血液循环 血管 心脏 血液.
第3节 以水为主要传热介质 的烹调方法.
乳猪断奶后拉稀,掉膘与教槽料.
第一章 汽车的解体与清洗 第一节 汽车解体工艺 一、零件的拆卸原则 1、拆卸前应熟悉被拆总成的结构
交換生說明會 101學年度下學期 (2013年春季學期) 2013年2月18日 (工程一館106室)
組員:蔡惠雅 494D0032 楊雅惠494B0079 蔡騏鴻 葉時宇 余建霖495B0002 陳瑛淑495B0021
第一章 線性方程組.
项目三 百度平台营销:SEM(搜索引擎营销)
網路遊戲版 幸福農場168號.
因式定理.
2 轴向拉伸和压缩 2-1 轴向拉伸与压缩的概念 2-2 内力-轴力·轴力图 2-3 拉、压杆内的应力 2-4 拉、压杆的变形·胡克定律
浙江大学医学院公共技术平台 实验仪器预约管理系统系列培训 医学院公共技术平台 丁巧灵
2.3 平面与回转体表面相交 回转体截切的基本形式 截平面 截平面 截交线 截交线.
評分標準.
炎 峰 國 小 107學年上學期 班級親師會.
——向刑事案件被告人家属调查取证的伦理性讨论
第一章 十九世紀的民族主義.
全台灣最美的日出好美…好美… 這就是傳說中的潑墨二寮,耳聞她的日出有如國畫般 所以稱為潑墨二寮
~建構有創意的教學策略~ 培養學生創意思考與創造力
2014“瘦身世界”减肥冠军 英国阿什菲尔德的男子Stuart Eggleshaw因减肥22英石9磅(约280斤)而获冠军。
中三級專題研習 題目:本校學生環保意識薄弱 3D.
异常交易监管等监察业务培训 大连商品交易所 监察部 2018年4月.
Presentation transcript:

机器学习在搜索排序中的应用 一淘及搜索事业部-搜索技术 仁重

agenda 背景 LTR方法 评估 并行化与多目标

第一部分 背景 LTR在淘宝搜索应用的背景 LTR=Learning to Rank

背景 用户输入Query 引擎召回商品 商品计算feature Rank

项目背景-特征 通过线性模型来组合非线性的特征 计算效率高 可解释性好 相关性 商业业务逻辑 反作弊 购买转化率(GDBT) 点击转化率(LR) 二跳率(LR) 规则 个性化(LR、GDBT) 图片质量(SVM) 预估模型 W1,w2改为向量,方程改为内积 f(X) = w1* x1 + w2* x2 + w3* x3 + w4* x4 + w5* x5 + w6* x6 + … = 𝑊 ∗ 𝑥 通过线性模型来组合非线性的特征 计算效率高 可解释性好

背景问题 Learning To Rank,使用机器学习的方法来进行排序优化。 如何确定各个特征的权重W 能否不同的类目给出不同的权重W 如何在不同的系统中快速的迁移特征 之前用ABTest,现在使用LTR Learning To Rank,使用机器学习的方法来进行排序优化。

第三部分 方法 LTR应用的方法

转化为pairwise问题 把整体的排序问题转换为商品对好坏问题 两个商品哪个更好 Ctr Cvr 价格 VS

优化目标与样本 样本选择 人工标注(工作量巨大) 商品Ctr 商品转化率 详情页浏览时间

论文中使用的样本选择 样本选择 fA > fB > fC > fD > fE 单次pv点击位置 f A= w*xA 样本选择 单次pv点击位置 Click > Skip Above Last Click > Skip Above Click > Earlier Click Last Click > Skip Previous Click > No-Click Next fA > fB > fC > fD > fE f B= w*xB f C= w*xC f D= w*xD f E= w*xE

整体统计ctr样本选择 A > E > B > C = D A Ctr:1 A > E E > C B Ctr:0.5 A > B E > D 相同 query A > C B > C C Ctr:0.1 A > D B > D Ctr差值有置信度 E > B D Ctr:0.1 相同Query统计商品ctr来生成pair ctr差值需要有一定置信度 没有位置信息 E Ctr:0.6

ctr单次PV样本选择 计算特征值需要还原到单次PV下具体的用户以及当前环境 通过规则过滤掉其中的噪音 购买>点击>无行为 B产生了购买行为,D产生了点击行为 A整体Ctr:1 B整体Ctr:0.5 C整体Ctr:0.1 A > E E > C D整体Ctr:0.1 A > B E > D A > C B > C E整体Ctr:0.6 A > D B > D E > B

优化目标与样本 避免样本选取的偏差 Pvlog特征分布(人气,卖家,文本) 100亿数据 训练样本分布(人气,卖家,文本) 千万训练样本 量级

样本特征分析 特征分布不好的特征进行改进 对分布不合理的特征样本进行按比例抽样

样本特征分析 特征与目标值的关系 相关性差 相关性好

无点击样本选择 保持权重的一定程度稳定性 无点击数据 在现有排序下对Topquery没有点击的数据,前30与后30形成pair,随机抽取 按不同比例混合无点击与Ctr样本 约50%的无点击样本 无点击样本训练后的权重反映线上使用权重w 保持排序的稳定性

模型优化 调整无点击与有点击比例 调整抽样策略 对特征值进行改进 分类目的模型 Query类目预测结果的行业区分训练数据 手机类目的价格权重高于其他类目

RankSVM模型(一) RankSVM训练数据 ∀ 𝑑 𝑖 , 𝑑 𝑗 ∈ 𝑟 1 :𝑤Φ 𝑞 1 , 𝑑 𝑖 >𝑤Φ 𝑞 1 , 𝑑 𝑗 … ∀ 𝑑 𝑖 , 𝑑 𝑗 ∈ 𝑟 𝑛 :𝑤Φ 𝑞 𝑛 , 𝑑 𝑖 >𝑤Φ( 𝑞 𝑛 , 𝑑 𝑗 )

RankSVM模型(二) A: 1 qid:x fA1 fA2 fA3 fA4… B: 0 qid:x fB1 fB2 fB3 fB4… f(x) =w1*(fA1-fB1)+w2*(fA2-fB2)+w3*(fA3-fB3)+… x1= fA1-fB1 ,x2= … f(x)≥1 √ f(x)<1 ×(产生loss)

RankSVM模型 Loss: min 𝑓 𝑤 = 1 2 𝑤 𝑇 𝑤+𝐶 𝑖∈𝐼 ( max 0, 1− 𝑦 𝑖 𝑤 𝑇 𝑥 𝑖 ) 2 (无约束) Loss: min 𝑓 𝑤 = 1 2 𝑤 𝑇 𝑤+𝐶 𝑖∈𝐼 1− 𝑦 𝑖 𝑤 𝑇 𝑥 𝑖 2 St: 1− 𝑦 𝑖 𝑤 𝑇 𝑥 𝑖 >0 𝑖𝑓 𝑖∈𝐼 ≤0 𝑖𝑓 𝑖∉𝐼 对于一个query只有1个pair的情况: 𝛻𝑓 𝑤 = 𝐼+ 𝑖∈𝐼 2𝐶 𝑋 𝑇 𝑋 𝑤−2𝐶 𝑖∈𝐼 𝑋 𝑇 𝑦 由于是2次方所以无约束 2次方程的导数为0 wTx=xTw Y为1,-1,y满足交换律,y^2=1

RankSVM模型 given w0 for k=0, 1… If 𝛻𝑓 𝑤 𝑘 =0, stop. Set up I 𝐼 𝑘 ={𝑖|1− 𝑦 𝑖 𝑤 𝑘 𝑇 𝑥 𝑖 >0} Solve 𝛻𝑓 𝑤 = 0, obtain 𝑤 𝑘′ Let 𝑠 𝑘 = 𝑤 𝑘′ − 𝑤 𝑘 Find 𝛼 𝑘 =𝑎𝑟𝑔𝑚𝑖𝑛𝑓( 𝑤 𝑘 +𝛼 𝑠 𝑘 ) 𝑤 𝑘+1 = 𝑤 𝑘 + 𝛼 𝑘 𝑠 𝑘

RankSVM模型 对于一个query有多个pair的情况: A: 1 qid:x fA1 fA2 fA3 fA4… B: 0 qid:x fB1 fB2 fB3 fB4… C: 1 qid:x fC1 fC2 fC3 fC4… Loss: min 𝑓 𝑤 = 1 2 𝑤 𝑇 𝑤+𝐶 (𝑒−𝐴𝑋𝑤) 𝑇 𝐷 𝑤 (𝑒−𝐴𝑋𝑤) A=[0…0 1 0…0 -1 0…0] labels 𝐷 𝑤 = 1 𝑖𝑓 1− 𝑤 𝑇 𝑥 𝑖 − 𝑥 𝑗 >0 0 𝑜𝑡ℎ𝑒𝑟𝑤𝑖𝑠𝑒 𝛻𝑓 𝑤 =𝑤+2𝐶 𝑋 𝑇 ( 𝐴 𝑇 𝐷 𝑤 𝐴𝑋𝑤− 𝐴 𝑇 𝐷 𝑤 𝑒) 不可导 使用TRON方法求解

第三部分 【评估】 模型评估与效果评估

模型评估 baseline 按线上参数计算pair准确率 按模型参数计算pair准确率 Abtest验证

收益评估 模拟rank逻辑对Pvlog进行重排 计算CNDCG收益,全局计算目标收益 找出CNDCG差异的case 交易的商品相关性为2(价格) 点击的商品相关性为1 DCG[i] = DCG[i-1] + G[i] / log 2 (𝑖+1) CNDCG收益与线上收益的比例通过abtest获得 找出CNDCG差异的case

模型迭代 Pv log 按线上参数排序 CNDCG 按训练好的模型进行排序 CNDCG NDCG收益 NDCG差异query分析 样本混合比例调整 样本选择策略调整 抽样策略调整 模型训练

第四部分 模型优化 并行化与多目标

并行化(一) 需要解决的问题 两种基于MPI的方法 内存问题 训练时间过长 行列分割的并行SVM 行分割的并行Coordinate Ascent算法,用于求解NDCG为目标值的样本 

并行化(二) 行列分割的并行的SVM算法 行分割+列分割:目标函数值求解、梯度函数求解,搜索最优解 优点: Set up I 𝐼 𝑘 ={𝑖|1− 𝑦 𝑖 𝑤 𝑘 𝑇 𝑥 𝑖 >0} Solve 𝛻𝑓 𝑤 = 0, obtain 𝑤 𝑘′ Let 𝑠 𝑘 = 𝑤 𝑘′ − 𝑤 𝑘 Find 𝛼 𝑘 =𝑎𝑟𝑔𝑚𝑖𝑛𝑓( 𝑤 𝑘 +𝛼 𝑠 𝑘 ) 𝑤 𝑘+1 = 𝑤 𝑘 +𝛼 𝑠 𝑘 优点: 行分割:对样本进行了拆分缩小了单个节点的计算规模 列分割:每个节点只保存部分全局向量(长度与特征数量相同),减少内存开销;内积操作被拆分,提高计算速度 500万的样本集 并行版本分为5个part,每个100万,耗时4分钟 单机版本耗时1个小时 最终模型训练结果一致

多目标(二) 需要解决的问题 方法 现实应用中,需要同时解两个目标问题 例如:CTR、 客单价 Multi-loss Pair-wise Learning 再ctr样本的基础上,再加上价格的label 基于目标函数中,loss函数进行改造,使其兼容多种目标。

多目标(二) A: 1 0 qid:x fA1 fA2 fA3 fA4… B: 0 1 qid:x fB1 fB2 fB3 fB4… y=1, y’=-1 Loss: min 𝑓 𝑤 = 1 2 𝑤 𝑇 𝑤+𝐶 𝑖∈𝐼 (𝛼 1− 𝑦 𝑖 𝑤 𝑇 𝑥 𝑖 2 + 𝛽 1− 𝑦 𝑖 ′ 𝑤 𝑇 𝑥 𝑖 2 ) St: 1− 𝑦 𝑖 𝑤 𝑇 𝑥 𝑖 >0 𝑖𝑓 𝑖∈𝐼 ≤0 𝑖𝑓 𝑖∉𝐼 , 𝛼+𝛽=1 𝛻𝑓 𝑤 = 𝐼+ 𝑖∈𝐼 2𝐶 𝑋 𝑇 𝑋 𝑤−2𝐶+ 𝑖∈𝐼 𝑋 𝑇 (𝛼𝑦+𝛽 𝑦 ′ )

Never try,never know Q&A @曾翔-仁重