DeepPath 周天烁 2018.04.04.

Slides:



Advertisements
Similar presentations
第一讲:导论 The Introduction  哲学与中国哲学  哲学与哲学史  中国哲学史的历史.
Advertisements

酒店绩效考核攻略 一 业务流程再造 管理环节突破 利润急速倍增 专为您企业量身裁衣服务 突破导师 : 周忠亭副教授 北京大学管理案例研究 中心特聘餐饮讲师 北洋战略研究院研究员 北大时代光华高级讲师 中国十大餐饮管理讲师 中华酒店管理专家教授 教育部首批中国餐饮经理人 师资成员.
教育部 1 教育部技職司 南區: 2010 年 11 月 5 日 北區: 2010 年 11 月 8 日 中區: 2010 年 11 月 9 日 產學攜手合作計畫 政策宣導.
104 年度環保小學堂 經費編列注意事項 會計室 : 丁子芸 中華民國 103 年 10 月 22 日 會計室 : 丁子芸 中華民國 103 年 10 月 22 日.
人民幣國際化的階段 一 在中期內逐步成為廣為接受的國際貿 易結算貨幣;(跨境人民幣贸易结算; 海外项目的融资、人民幣境外直接投资试 点) 二 在中長期逐步開放資本項下管制後成 為越來越重要的國際投資貨幣(低於 1 %的 外匯交易是為了貿易結算,絕大部分都是 投資目的); 三 在長期內逐步成為儲備貨幣。
人力资源工作总结 行政部 人力资源部年度工作 一方面通过招聘管理、劳动合同管理、 入离职管理等,确保各项人事管理工作 的合法性、规范性. 另一方面通过建立员工培训计划,加强 企业文化的贯彻和渗透,提升员工的凝 聚力和归属感,提升员工的敬业度。
海盈丰人力资源出品 HYF HUMAN RESOURCE PRODUCE 时间管理 时间管理就是自我管理 Time Management.
配樂:夢的序曲 ( 鋼琴 ) 雁蕩山因山頂有湖,蘆葦茂密,結草為湯,南歸秋雁多宿於此,故名雁蕩。始於 南北朝,興於唐,盛於宋,雁蕩山來晚了一步,未能在 “ 五岳 ” 中占得一席之地。 沒有金碧輝煌的涂飾,村野之山的雁蕩倒因此多了份瀟灑風神。
1. 法律學系助教群: 大學部助教 徐碧霜 行政助教 葉靜芳 研究所助教 阮博謙 台中 法政學院 1. 台北 法商學院 民國 50 年 中興大學合併法商學院法律系 民國 89 年 法商學院改制為台北大學.
传媒学生应该如何度 过四年大学生活?. 进入大学一个多月了,用一个词形容大 学生活 自卑感 不适应 空虚感 被动感 孤独感 失望感 一、大学新生不适应大学生活的表现:
4.体词 体词包括:名词,处所词,方位词,时间词,区别词,数词,量词以及一部分代词。.
第一节 职业基础知识 第二节 社会需要剖析 第三节 用人单位认知
精神疾病与社区处理.
从生命伦理学角度 对转基因食品市场准入标准及道德评价标准的研究
人力资源管理师——招聘与配置实操         .
学党章党规、学系列讲话,做合格党员 学习教育
创新大赛经验浅谈 高二(18)班 黄佳淇.
會計資訊系統 專章A.
第三章 調整與編表.
《疯 娘》 --100个人看后99个人会落泪的故事 图文:网络
綜合交易帳戶制度暨申報作業宣導說明會 2016年4月.
面 试 技 巧.
面试技巧探讨.
2015届就业指导课程教学大纲介绍.
公民行動方案 (Project Citizen)介紹與實做
大规模深度学习算法 Deep Belief Network及其应用
第1章第3节 量化研究与质化研究 案例1:关于中学思想政治教师专业发展现状和需求的调查研究
詞彙—物品01 下擺 千斤頂 叉子 口紅 口袋 口罩 大哥大 小椅子 工具 下跤裾 衫仔裾 千斤秤 攕仔 胭脂 橐袋仔 褲袋仔 喙掩 手機仔
关于在宝钢全体党员中开展“学党章党规、 学系列讲话,做合格党员”学习教育的 实施方案
自殺防治守門人 班級心理衛生宣導活動 長榮大學學務處  諮商中心.
生命關懷與服務學習 指導老師:胡翰平教授 指導助教: 鍾雅婷助教 組長:物二甲 姚烜鈞 組員:物一乙 何乃翔 物一乙 李昭蓉 物一乙 劉晏君
學習目標 瞭解生涯規劃的意義及其功能 說明生涯規劃的責任者及其應擔負的職責 闡述生涯的發展階段 列舉並解說生涯規劃的影響因素
Personal Mission Statement
运营管理(Operations Management)
第四章 人才选拔 第一节 简历筛选  .
第1,2课时 教学要求 教学内容 教学难点 教学重点 课后作业.
2012年度人力资源部工作总结
现代教育管理专题 4
DDI® 基于行为的结构化面试方法 Targeted Selection Working Slides 01-5 张勉 西安交通大学管理学院
执行《劳动合同法》中 应当注意的十大问题.
自殺防治守門人 班級心理衛生宣導活動 長榮大學學務處  諮商中心.
项目申报及投资推进工作实务 更多模板、视频教程: 兰溪市发展和改革局 2013年9月 1.
AN INTRODUCTION TO OFDM
Large-Scale Malware Indexing Using Function-Call Graphs
毕业论文报告 孙悦明
NLP Group, Dept. of CS&T, Tsinghua University
Manifold Learning Kai Yang
行動研究就是一種行動性的研究,由行動者來進行研究,而不是由外於行動領域的學者與與科學家來進行,研究的問題也取自行動。
Source: IEEE Access, vol. 5, pp , October 2017
第十二章 資料探勘、商業智慧、知識管理 第三篇 企業對消費者B2C篇.
Yonghui Wu, Mike Schuster, Zhifeng Chen, Quoc V. Le, Mohammad Norouzi
第一章 線性方程組.
Introduction 2. Radial Basis Function (RBF)
赵才荣 同济大学,电子与信息工程学院,智信馆410室
How to Backpacking in Japan- Taking Kyoto as an Example
Kinect 女裝試衣系統 • Introduction • Gesture Control • Button Function
期末報告-- [ridge regression]
期末報告 Clustering DBSCAN
1.
Representation Learning of Knowledge Graphs with Hierarchical Types
北投溫泉博物館 建築特色 ★小組成員:高103林孟璇、林念儀、施妤柔★.
A Data Mining Algorithm for Generalized Web Prefetching
第三章 世界文明的蛻變與互動 第一節 歐洲社會的蛻變 第二節 世界文明的交匯 第三節 亞洲大帝國的發展 1.
红利、年金、满期金自动转入聚宝盆,收益有保底,升值空间更大
序贯监督学习框架下的 耀斑短期预报 哈尔滨工业大学 黄鑫.
Speaker : YI-CHENG HUNG
期末報告 Isolation Forest 學號:R 姓名:林韋宏
Speaker : YI-CHENG HUNG
第四章 買賣業會計.
Gaussian Process Ruohua Shi Meeting
Presentation transcript:

DeepPath 周天烁 2018.04.04

Outline Introduction Reinforcement Learning recap Methodology Modeling Training Experiment Conclusion

Introduction (h,?,t) (h,r,?)

Reinforcement Learning recap Markov Decision Processes (MDP) М = <S, A, T, R> S : state space A : action space T : transition R : reward

Methodology —— Modeling М = < ?, ?, ?, ? >

Methodology —— Modeling М = <S, A, T, R> States Actions Transition Reward Global accuracy Path efficiency Path diversity ?

Methodology —— Training Target Function expected total rewards Supervised Policy Learning Retraining with Rewards

Experiment —— setup Dataset Tasks Metric FB15K-237 NELL-995 link prediction (h , r , ?) fact prediction (h , ? , t) Metric MAP (Mean Average Precision) 例如:假设有两个主题,主题1有4个相关网页,主题2有5个相关网页。某系统对 于主题1检索出4个相关网页,其rank分别为1, 2, 4, 7;对于主题2检索出3个相关网 页,其rank分别为1,3,5。对于主题1,平均准确率为(1/1+2/2+3/4+4/7)/4=0.83。对 于主题2,平均准确率为(1/1+2/3+3/5+0+0)/5=0.45。 则MAP= (0.83+0.45)/2=0.64。 取值 [ 0 , 1 ]

Experiment —— result

Experiment —— example reasoning paths

Conclusion pros cons Novel Code public Selective experiment : didn’t cover the dataset Baseline too old Time consuming

Reference Wenhan Xiong, Thien Hoang, and William Yang Wang. 2017. Deeppath: A reinforcement learning method for knowledge graph reasoning Yang, Fan, Zhilin Yang, and William W. Cohen. http://www.cs.cmu.edu/~christos/courses/826.F11/FOILS-pdf/992_rwr.pdf https://medium.com/machine-learning-for-humans/reinforcement-learning-6eacf258b265

Q & A