DeepPath 周天烁 2018.04.04.

Slides:

Advertisements

Similar presentations

第一讲：导论 The Introduction  哲学与中国哲学  哲学与哲学史  中国哲学史的历史.

Advertisements

酒店绩效考核攻略一业务流程再造管理环节突破利润急速倍增专为您企业量身裁衣服务突破导师 : 周忠亭副教授北京大学管理案例研究中心特聘餐饮讲师北洋战略研究院研究员北大时代光华高级讲师中国十大餐饮管理讲师中华酒店管理专家教授教育部首批中国餐饮经理人师资成员.

教育部 1 教育部技職司南區： 2010 年 11 月 5 日北區： 2010 年 11 月 8 日中區： 2010 年 11 月 9 日產學攜手合作計畫政策宣導.

104 年度環保小學堂經費編列注意事項會計室 : 丁子芸中華民國 103 年 10 月 22 日會計室 : 丁子芸中華民國 103 年 10 月 22 日.

人民幣國際化的階段一在中期內逐步成為廣為接受的國際貿易結算貨幣；（跨境人民幣贸易结算；海外项目的融资、人民幣境外直接投资试点）二在中長期逐步開放資本項下管制後成為越來越重要的國際投資貨幣（低於 1 ％的外匯交易是為了貿易結算，絕大部分都是投資目的）；三在長期內逐步成為儲備貨幣。

人力资源工作总结行政部人力资源部年度工作一方面通过招聘管理、劳动合同管理、入离职管理等，确保各项人事管理工作的合法性、规范性. 另一方面通过建立员工培训计划，加强企业文化的贯彻和渗透，提升员工的凝聚力和归属感，提升员工的敬业度。

海盈丰人力资源出品 HYF HUMAN RESOURCE PRODUCE 时间管理时间管理就是自我管理 Time Management.

配樂：夢的序曲 ( 鋼琴 ) 雁蕩山因山頂有湖，蘆葦茂密，結草為湯，南歸秋雁多宿於此，故名雁蕩。始於南北朝，興於唐，盛於宋，雁蕩山來晚了一步，未能在 “ 五岳 ” 中占得一席之地。沒有金碧輝煌的涂飾，村野之山的雁蕩倒因此多了份瀟灑風神。

1. 法律學系助教群：大學部助教徐碧霜行政助教葉靜芳研究所助教阮博謙台中法政學院 1. 台北法商學院民國 50 年中興大學合併法商學院法律系民國 89 年法商學院改制為台北大學.

传媒学生应该如何度过四年大学生活？. 进入大学一个多月了，用一个词形容大学生活自卑感不适应空虚感被动感孤独感失望感一、大学新生不适应大学生活的表现：

4.体词体词包括：名词，处所词，方位词，时间词，区别词，数词，量词以及一部分代词。.

第一节职业基础知识第二节社会需要剖析第三节用人单位认知

精神疾病与社区处理.

从生命伦理学角度对转基因食品市场准入标准及道德评价标准的研究

人力资源管理师——招聘与配置实操　　　　　　　　　.

学党章党规、学系列讲话，做合格党员学习教育

创新大赛经验浅谈高二（18）班黄佳淇.

會計資訊系統專章A.

第三章調整與編表.

《疯娘》 --100个人看后99个人会落泪的故事图文：网络

綜合交易帳戶制度暨申報作業宣導說明會 2016年4月.

面试技巧探讨.

2015届就业指导课程教学大纲介绍.

公民行動方案（Project Citizen）介紹與實做

大规模深度学习算法 Deep Belief Network及其应用

第1章第3节量化研究与质化研究案例1：关于中学思想政治教师专业发展现状和需求的调查研究

詞彙—物品01 下擺千斤頂叉子口紅口袋口罩大哥大小椅子工具下跤裾衫仔裾千斤秤攕仔胭脂橐袋仔褲袋仔喙掩手機仔

关于在宝钢全体党员中开展“学党章党规、学系列讲话，做合格党员”学习教育的实施方案

自殺防治守門人班級心理衛生宣導活動長榮大學學務處　諮商中心.

生命關懷與服務學習指導老師：胡翰平教授指導助教: 鍾雅婷助教組長：物二甲姚烜鈞組員：物一乙何乃翔物一乙李昭蓉物一乙劉晏君

學習目標瞭解生涯規劃的意義及其功能說明生涯規劃的責任者及其應擔負的職責闡述生涯的發展階段列舉並解說生涯規劃的影響因素

Personal Mission Statement

运营管理(Operations Management)

第四章人才选拔第一节简历筛选 .

第1,2课时教学要求教学内容教学难点教学重点课后作业.

2012年度人力资源部工作总结

现代教育管理专题 4

DDI® 基于行为的结构化面试方法 Targeted Selection Working Slides 01-5 张勉西安交通大学管理学院

执行《劳动合同法》中应当注意的十大问题.

自殺防治守門人班級心理衛生宣導活動長榮大學學務處　諮商中心.

项目申报及投资推进工作实务更多模板、视频教程：兰溪市发展和改革局 2013年9月 1.

AN INTRODUCTION TO OFDM

Large-Scale Malware Indexing Using Function-Call Graphs

毕业论文报告孙悦明

NLP Group, Dept. of CS&T, Tsinghua University

Manifold Learning Kai Yang

行動研究就是一種行動性的研究，由行動者來進行研究，而不是由外於行動領域的學者與與科學家來進行，研究的問題也取自行動。

Source: IEEE Access, vol. 5, pp , October 2017

第十二章資料探勘、商業智慧、知識管理第三篇企業對消費者B2C篇.

Yonghui Wu, Mike Schuster, Zhifeng Chen, Quoc V. Le, Mohammad Norouzi

第一章線性方程組.

Introduction 2. Radial Basis Function （RBF）

赵才荣同济大学，电子与信息工程学院，智信馆410室

How to Backpacking in Japan- Taking Kyoto as an Example

Kinect 女裝試衣系統 • Introduction • Gesture Control • Button Function

期末報告-- [ridge regression]

期末報告 Clustering DBSCAN

Representation Learning of Knowledge Graphs with Hierarchical Types

北投溫泉博物館建築特色 ★小組成員：高103林孟璇、林念儀、施妤柔★.

A Data Mining Algorithm for Generalized Web Prefetching

第三章世界文明的蛻變與互動第一節歐洲社會的蛻變第二節世界文明的交匯第三節亞洲大帝國的發展 1.

红利、年金、满期金自动转入聚宝盆，收益有保底，升值空间更大

序贯监督学习框架下的耀斑短期预报哈尔滨工业大学黄鑫.

Speaker : YI-CHENG HUNG

期末報告 Isolation Forest 學號：R 姓名：林韋宏

Speaker : YI-CHENG HUNG

第四章買賣業會計.

Gaussian Process Ruohua Shi Meeting

Presentation transcript:

DeepPath 周天烁 2018.04.04

Outline Introduction Reinforcement Learning recap Methodology Modeling Training Experiment Conclusion

Introduction (h,?,t) (h,r,?)

Reinforcement Learning recap Markov Decision Processes (MDP) М = <S, A, T, R> S : state space A : action space T : transition R : reward

Methodology —— Modeling М = < ?, ?, ?, ? >

Methodology —— Modeling М = <S, A, T, R> States Actions Transition Reward Global accuracy Path efficiency Path diversity ?

Methodology —— Training Target Function expected total rewards Supervised Policy Learning Retraining with Rewards

Experiment —— setup Dataset Tasks Metric FB15K-237 NELL-995 link prediction (h , r , ?) fact prediction (h , ? , t) Metric MAP (Mean Average Precision) 例如：假设有两个主题，主题1有4个相关网页，主题2有5个相关网页。某系统对于主题1检索出4个相关网页，其rank分别为1, 2, 4, 7；对于主题2检索出3个相关网页，其rank分别为1,3,5。对于主题1，平均准确率为(1/1+2/2+3/4+4/7)/4=0.83。对于主题2，平均准确率为(1/1+2/3+3/5+0+0)/5=0.45。则MAP= (0.83+0.45)/2=0.64。取值 [ 0 , 1 ]

Experiment —— result

Experiment —— example reasoning paths

Conclusion pros cons Novel Code public Selective experiment : didn’t cover the dataset Baseline too old Time consuming

Reference Wenhan Xiong, Thien Hoang, and William Yang Wang. 2017. Deeppath: A reinforcement learning method for knowledge graph reasoning Yang, Fan, Zhilin Yang, and William W. Cohen. http://www.cs.cmu.edu/~christos/courses/826.F11/FOILS-pdf/992_rwr.pdf https://medium.com/machine-learning-for-humans/reinforcement-learning-6eacf258b265

Q & A