Deep Learning Research & Application Center

Slides:

Advertisements

Similar presentations

第十五课词汇与句子. 学前导航在本课里，我们将学习韩国语的词汇和句子。进入学习韩国语的词汇一共可分为 4 类，即固有词、汉字词、外来词、混合词。固有词是指韩国国民按照固有的语言资料和造词方法创造的词语。韩国语的固有词不到整个词汇的 20% ，但是都是历史上流传下来的基本词汇。

Advertisements

DOC 推廣活動月餅星光大道. 中秋  農曆八月十五日，是中國傳統的中秋節。古人將一年分成春夏秋冬四季，而一季又分為孟、仲、季三月，八月是仲秋之月，而十五又是這個月中間的一天，正處在秋季的正中，所以把八月十五稱為「中秋」或「仲秋」。  中秋夜，月亮最圓，月色最美，因此人們把月圓看成是團圓的象徵，同時也稱八月.

足太阴脾经在足大趾与足阳明胃经衔接，在胸部与手少阴心经相接。联系的脏腑器官有咽、舌，属脾，络胃，注心中。络脉从本经分出，走向足阳明经，进入腹腔，联络肠胃。经别结于咽，贯舌本。经筋结于髀，聚于阴器，上腹，结于脐，散于胸中。第四章足太阴经络与腧穴第一节足太阴经络.

中五級中五級戰後國共關係與中華人民共和國成立中國歷史科 1 ）認識國共政治協商的概況 2 ）認識國共內戰的概略經過及結果 3 ）中華人民共和國成立.

不吃早餐的影響：體內的葡萄糖無法足夠供應給大腦與肌肉，會感覺疲勞，注意力無法集中。。營養的早餐：乳品 + 全榖類食品 + 蛋白質 + 水果早餐你吃了嗎？

北京师范大学生命科学学院北京师范大学生命科学学院余跃强章腾勋王航余跃强章腾勋王航 2 目录目录目录目录  前言前言  概述概述  形态和生活史形态和生活史  寄生适应特征寄生适应特征  致病机制与症状致病机制与症状  诊断诊断  流行情况流行情况.

寓言何謂寓言？寓言中的主角選擇以動物為主角，形象分析—以成語及諺語中來歸納動物形象以人為主角，形象分析

极目古今话短长 ——中国侠的历史文化文化诠释汪聚应

人文地理專題研究王志明.

103年度學生健康檢查.

2014年爱婴医院复核方案解读省卫生计生委妇幼处邱灵.

导言第四单元凡尔赛—华盛顿体系与第二次世界大战

選擇性逐字紀錄臺北市立教育大學張德　銳.

社團經費申請及核銷相關規定製作：世新大學會計室.

Word2010的使用讲解人:常蕊.

舌尖上的昭通.

老子的素朴厦门大学计算机科学系庄朝晖.

“卓越工程师”培养的质量保障体系构建探索

土地出让转让的政策与实务岳晓武国土资源部利用司.

专题三生物圈中的绿色植物.

正修科技大學典範人物專訪寫作徵文比賽實施要點

关于在宝钢全体党员中开展“学党章党规、学系列讲话，做合格党员”学习教育的实施方案

老師：鍾郁芬老師指導組長：陳欣怡組員：曾郁雯倪敏富王宣化簡宏倫黃郁涵

题目回顾泉水在地下蓄积，一旦有机会，它便骄傲地涌出地面，成为众人瞩目的喷泉，继而汇成溪流，奔向远方。但人们对地下的泉水鲜有关注，其实，正是因为有地下那些默默不语的泉水的不断聚集，才有地上那一股股清泉的不停喷涌。请根据你对材料的理解和感悟，自选一个角度，写一篇不少于800字的文章，文体自定,标题自拟。要求：立意明确，不要套作，不得抄袭。

校內科學園遊會製作說明會教務處設備組

广东技术师范学院美术学院装潢专业 2012级（3）班郑可珊

第十九章散文教学要求：了解散文的含义、分类、特点，学习写作抒情散文。重点：散文的特点，散文的写作。难点：散文的写作训练。

新办企业办税须知 --新办企业纳税人涉税事项介绍

課程大綱課程大綱:養生休閒活動」是探討休閒、生涯規劃與晚年健康之間的關係，且介紹各類老人機構所適合的休閒活動，並學習如何透過規劃及帶領老人休閒活動進而因應高齡化的社會需求。本課程分為11章節，包括:健康為老年生活之基礎、老人休閒與健康、老人生涯規劃與休閒治療及健康維護、休閒活動設計與規劃的基本概念、長青學苑休閒遊憩活動規劃與設計、老人日托的休閒活動設計、社區關懷照顧據點的休閒遊憩活動、老人安養機構的休閒遊憩活動設計、護理之家休閒活動規劃與設計、銀髮休閒生活的未來與發展等。

模块4 授导型教学的设计陈冬.

农机化项目管理培训会柳州市农机局郑崇宁

一二·九运动 0712班.

中小学教育科研课题的选择王典伟.

温馨提示感谢您从“河姆渡教师教育网”下载使用该PPT文件，仅供学习参考，未经作者同意勿在公开场合使用，谢谢合作！

出口农产品风险管理企业分类及监督管理表格

教育部補助「大專校院社團帶動中小學社團發展」

● 四 (2)班家长网络交流会 ● 快乐成长与您共享家庭学校社会.

学科科研工作与科研奖励政策解读讲座朱文斌博士教授 2015年9月8日.

第9章金融监管.

企業講座組長：張仁杰組員：指導老師：洪伯毅楊巧歆楊明芬陳璿安

中国科学院档案数字化工作情况介绍潘亚男 2013年10月24日

消費者行為分析講師吳秀珍.

首都师范大学.

Adversarial Multi-Criteria Learning for Chinese Word Segmentation

Text Segmentation for Chinese Spell Checking

Source: IEEE Access, vol. 5, pp , October 2017

Factors Impacting on the Interaction of Online Chinese Language Learning 影响网络汉语教学互动的几个因素 Henry Ruan May 15， 2010.

關心今天的老人，就是關心明天的自己作者：周儀.

台灣中部地區勞資爭議事件研究以組織衝突管理論論之論文解析指導老師孫德修教授第四組洪美怡梁正庸.

Yonghui Wu, Mike Schuster, Zhifeng Chen, Quoc V. Le, Mohammad Norouzi

Interval Estimation區間估計

基于规则抽取的时间表达式识别.

可能受益的商业活动客户保留目标营销欺诈检测购物篮分析客户细分客户忠诚度信用打分信用风险评估营销组合管理和评估盈利能力分析

sequence-to-sequence

最大熵模型简介 A Simple Introduction to the Maximum Entropy Models

Answering aggregation question over knowledge base

研究技巧與論文撰寫方法中央大學資管系陳彥良.

Research 裴澍炜 Shuwei Pei Tel:

《郑伯克段于鄢》黎兰老师制作.

Word –圖片處理資訊教育.

Developmental Growth in Students’ Concept of Energy: Analysis of Selected Items from the TIMSS Database Xiufeng Liu, Anne McKeough Journal of Research.

李宏毅專題 Track A, B, C 的時間、地點開學前通知

Speaker : YI-CHENG HUNG

窗外林文月 10 周芸廷 14 邱婷鈺 16 康毓芷.

電子網路編輯學網站首頁拍攝.

仲裁处理细则及常见问题解析.

嘉義縣立溪口國民中學辦理96年度推動自由軟體學校資訊融入教學

自动控制原理.

校內科學園遊會製作說明會教務處設備組

Presentation transcript:

Deep Learning Research & Application Center Fake News on Weibo Deep Learning Research & Application Center 19 December 2017 Claire Li

Content Preprocessing the weibo data in variable-length interval size Chinese text segmentation tools

Preprocessing the weibo data in interval length Total 4,664 events (original posts) Maximum number of posts: 59,318 from 2012-10-16 11:07:05 to 2014-11-04 19:02:35 Minimum number of posts: 10 from Wed, 11 Nov 2015 09:50:31 to 11 Nov 2015 18:26:44 Minimum time span: 23 posts from 2015-11-21 15:00:03 to 2015-11-21 15:07:20 (7 mins 17 seconds) Unlikely to model RNN sequence length in the number of posts with each post as an input instance Batch posts within time intervals as RNN time serious given an interval length (sequence length in RNN) N which is tuned from experiments

[2] Ex1, N=96, 56,155 posts, from 2012-08-06 00:03:15 to 2014-12- 31 12:31:50 interval-length=248400 ts, json Ex2, N=103,135 posts, from 2010-12-23 10:08:25 to2010-12-30 23:15:14, interval-length = 93 ts, json

Popular Chinese Segmentation tools THULAC, LTP-3.2.0 、ICTCLAS(2015版) 、jieba(C++ 版) 等国内具代表性的分词软件 Test From Microsoft Research From pku test

THULAC[1]具有如下几个特点能力强。利用我们集成的目前世界上规模最大的人工分词和词性标注中文语料库（约含5800 万字, 需填写“资源申请表.doc”）训练而成，模型标注能力强大。准确率高。该工具包在标准数据集Chinese Treebank（CTB5）上分词的F1值可达97.3％，词性标注的F1值可达到92.9％，与该数据集上最好方法效果相当。速度较快。同时进行分词和词性标注速度为 300KB/s，每秒可处理约15万字。只进行分词速度可达到1.3MB/s。 Java, C++, and Python versions available

并且在工程上做了很多优化，比如：用DAT存储训练特征（压缩训练模型），加入了标点符号的特征（提高分词准确率）采用character-based 的结构化感知器（Structured Perceptron, SP）分词模型 SP以 Maximum Entropy准则建模score函数，分词结果则等同于最大score函数所对应的标注序列。使用了 Word-lattice based re-ranking algorithm

Related works 孙茂松, 陈新雄, 张开旭, 郭志芃, 刘知远. THULAC：一个高效的中文词法分析工具包. 2016, http://thulac.thunlp.org/ Detecting Rumors from Microblogs with Recurrent Neural Networks, IJCAI-16