Deep Learning Research & Application Center

Slides:



Advertisements
Similar presentations
第十五课 词汇与句子. 学前导航 在本课里, 我们将学习韩国语的词汇和句子。 进入学习 韩国语的词汇一共可分为 4 类,即固有词、汉字词、 外来词、混合词。 固有词是指韩国国民按照固有的语言资料和造词方 法创造的词语。韩国语的固有词不到整个词汇的 20% , 但是都是历史上流传下来的基本词汇。
Advertisements

DOC 推廣活動 月餅星光大道. 中秋  農曆八月十五日,是中國傳統的中秋節。 古人將一年分成春夏秋冬四季,而一季又 分為孟、仲、季三月,八月是仲秋之月, 而十五又是這個月中間的一天,正處在秋 季的正中,所以把八月十五稱為「中秋」 或「仲秋」。  中秋夜,月亮最圓,月色最美,因此人們 把月圓看成是團圓的象徵,同時也稱八月.
足太阴脾经在足大趾与足阳明胃经衔接, 在胸部与手少阴心经相接。 联系的脏腑器官有 咽、舌,属脾,络胃,注心中。 络脉从本经分出,走向足阳明经,进入腹腔,联络肠胃。 经别结于咽,贯舌本。 经筋结于髀,聚于阴器,上腹,结于脐,散于胸中。 第四章 足太阴经络与腧穴 第一节 足太阴经络.
中 五 級中 五 級 戰後國共關係 與 中華人民共和國成立 中國歷史科 1 )認識國共政治協商的概況 2 )認識國共內戰的概略經過及結果 3 )中華人民共和國成立.
不吃早餐的影響: 體內的葡萄糖無法 足夠供應給大腦與 肌肉,會感覺疲勞, 注意力無法集中。。 營養的早餐:乳品 + 全榖類食品 + 蛋白質 + 水果 早餐你吃了嗎?
北京师范大学生命科学学院 北京师范大学生命科学学院 余跃强 章腾勋 王航 余跃强 章腾勋 王航 2 目 录目 录目 录目 录  前言 前言  概述 概述  形态和生活史 形态和生活史  寄生适应特征 寄生适应特征  致病机制与症状 致病机制与症状  诊断 诊断  流行情况 流行情况.
寓言 何謂寓言? 寓言中的主角選擇 以動物為主角,形象分析—以成語及諺語中來歸納動物形象 以人為主角,形象分析
极目古今话短长 ——中国侠的历史文化文化诠释 汪聚应
人文地理專題研究 王志明.
103年度學生健康檢查.
2014年爱婴医院复核方案解读 省卫生计生委妇幼处 邱灵.
导言 第四 单元 凡尔赛—华盛顿体系与第二次世界大战
選擇性逐字紀錄 臺北市立教育大學 張 德 銳.
社團經費申請 及核銷相關規定 製作:世新大學會計室.
会计实验.
Word2010的使用 讲解人:常蕊.
舌尖上的昭通.
老子的素朴 厦门大学计算机科学系 庄朝晖.
“卓越工程师”培养的质量保障体系构建探索
土地出让转让的政策与实务 岳晓武 国土资源部利用司.
专题三 生物圈中的绿色植物.
正修科技大學典範人物專訪 寫作徵文比賽實施要點
关于在宝钢全体党员中开展“学党章党规、 学系列讲话,做合格党员”学习教育的 实施方案
老師:鍾郁芬 老師 指導 組長:陳欣怡 組員:曾郁雯 倪敏富 王宣化 簡宏倫 黃郁涵
题目回顾 泉水在地下蓄积,一旦有机会,它便骄傲地涌出地面,成为众人瞩目的喷泉,继而汇成溪流,奔向远方。但人们对地下的泉水鲜有关注,其实,正是因为有地下那些默默不语的泉水的不断聚集,才有地上那一股股清泉的不停喷涌。 请根据你对材料的理解和感悟,自选一个角度,写一篇不少于800字的文章,文体自定,标题自拟。要求:立意明确,不要套作,不得抄袭。
校內科學園遊會 製作說明會 教務處設備組
广 东 技 术 师 范 学 院 美术学院 装潢专业 2012级(3)班 郑可珊
第十九章 散文 教学要求: 了解散文的含义、分类、特点,学习写作抒情散文。 重点: 散文的特点,散文的写作。 难点: 散文的写作训练。
新办企业办税须知 --新办企业纳税人涉税事项介绍
課程大綱 課程大綱:養生休閒活動」是探討休閒、生涯規劃與晚年健康之間的關係,且介紹各類老人機構所適合的休閒活動,並學習如何透過規劃及帶領老人休閒活動進而因應高齡化的社會需求。 本課程分為11章節,包括:健康為老年生活之基礎、老人休閒與健康、老人生涯規劃與休閒治療及健康維護、休閒活動設計與規劃的基本概念、長青學苑休閒遊憩活動規劃與設計、老人日托的休閒活動設計、社區關懷照顧據點的休閒遊憩活動、老人安養機構的休閒遊憩活動設計、護理之家休閒活動規劃與設計、銀髮休閒生活的未來與發展等。
模块4 授导型教学的设计 陈冬.
农机化项目管理培训会 柳州市农机局 郑崇宁
一二·九运动                                                                    0712班.
中小学教育科研课题的选择 王典伟.
温 馨 提 示 感谢您从“河姆渡教师教育网”下载使用该PPT文件,仅供学习参考,未经作者同意勿在公开场合使用,谢谢合作!
出口农产品风险管理 企业分类及监督管理表格
教育部補助 「大專校院社團帶動中小學社團發展」
● 四 (2)班 家 长 网络交 流 会 ● 快乐成长 与您 共享 家庭 学校 社会.
学科科研工作与科研 奖励政策解读讲座 朱文斌 博士 教授 2015年9月8日.
第9章 金融监管.
企業講座 組長: 張仁杰 組員: 指導老師:洪伯毅 楊巧歆 楊明芬 陳璿安
中国科学院档案数字化 工作情况介绍 潘亚男 2013年10月24日
消費者行為分析 講師 吳秀珍.
首都师范大学.
Adversarial Multi-Criteria Learning for Chinese Word Segmentation
Text Segmentation for Chinese Spell Checking
Source: IEEE Access, vol. 5, pp , October 2017
Factors Impacting on the Interaction of Online Chinese Language Learning 影响网络汉语教学互动的几个因素 Henry Ruan May 15, 2010.
關心今天的老人, 就是關心明天的自己 作者:周儀.
台灣中部地區勞資爭議事件研究 以組織衝突管理論論之 論文解析 指導老師 孫德修教授 第四組 洪美怡 梁正庸.
Yonghui Wu, Mike Schuster, Zhifeng Chen, Quoc V. Le, Mohammad Norouzi
Interval Estimation區間估計
基于规则抽取的 时间表达式识别.
可能受益的商业活动 客户保留 目标营销 欺诈检测 购物篮分析 客户细分 客户忠诚度 信用打分 信用风险评估 营销组合管理和评估 盈利能力分析
sequence-to-sequence
最大熵模型简介 A Simple Introduction to the Maximum Entropy Models
Answering aggregation question over knowledge base
研究技巧與論文撰寫方法 中央大學資管系 陳彥良.
Research 裴澍炜 Shuwei Pei Tel:
《郑伯克段于鄢》 黎兰老师制作.
Word –圖片處理 資訊教育.
Developmental Growth in Students’ Concept of Energy: Analysis of Selected Items from the TIMSS Database Xiufeng Liu, Anne McKeough Journal of Research.
李宏毅專題 Track A, B, C 的時間、地點開學前通知
Speaker : YI-CHENG HUNG
窗 外 林文月 10 周芸廷 14 邱婷鈺 16 康毓芷.
電 子 網 路 編 輯 學 網站首頁拍攝.
仲裁处理细则及常见问题解析.
嘉義縣立溪口國民中學 辦理96年度推動自由軟體學校資訊融入教學
自动控制原理.
校內科學園遊會 製作說明會 教務處設備組
Presentation transcript:

Deep Learning Research & Application Center Fake News on Weibo Deep Learning Research & Application Center 19 December 2017 Claire Li

Content Preprocessing the weibo data in variable-length interval size Chinese text segmentation tools

Preprocessing the weibo data in interval length Total 4,664 events (original posts) Maximum number of posts: 59,318 from 2012-10-16 11:07:05 to 2014-11-04 19:02:35 Minimum number of posts: 10 from Wed, 11 Nov 2015 09:50:31 to 11 Nov 2015 18:26:44 Minimum time span: 23 posts from 2015-11-21 15:00:03 to 2015-11-21 15:07:20 (7 mins 17 seconds) Unlikely to model RNN sequence length in the number of posts with each post as an input instance Batch posts within time intervals as RNN time serious given an interval length (sequence length in RNN) N which is tuned from experiments

[2] Ex1, N=96, 56,155 posts, from 2012-08-06 00:03:15 to 2014-12- 31 12:31:50 interval-length=248400 ts, json Ex2, N=103,135 posts, from 2010-12-23 10:08:25 to2010-12-30 23:15:14, interval-length = 93 ts, json

Popular Chinese Segmentation tools THULAC, LTP-3.2.0 、ICTCLAS(2015版) 、jieba(C++ 版) 等国内具代表性的分词软件 Test From Microsoft Research From pku test

THULAC[1]具有如下几个特点 能力强。利用我们集成的目前世界上规模最大 的人工分词和词性标注中文语料库(约含5800 万字, 需填写“资源申请表.doc”)训练而成,模 型标注能力强大。 准确率高。该工具包在标准数据集Chinese Treebank(CTB5)上分词的F1值可达97.3%,词 性标注的F1值可达到92.9%,与该数据集上最 好方法效果相当。 速度较快。同时进行分词和词性标注速度为 300KB/s,每秒可处理约15万字。只进行分词速 度可达到1.3MB/s。 Java, C++, and Python versions available

并且在工程上做了很多优化,比如:用DAT存储 训练特征(压缩训练模型),加入了标点符号 的特征(提高分词准确率) 采用character-based 的结构化感知器 (Structured Perceptron, SP)分词模型 SP以 Maximum Entropy准则建模score函数,分 词结果则等同于最大score函数所对应的标注序 列。 使用了 Word-lattice based re-ranking algorithm

Related works 孙茂松, 陈新雄, 张开旭, 郭志芃, 刘知远. THULAC:一个高效的中文词法分析工具包. 2016, http://thulac.thunlp.org/ Detecting Rumors from Microblogs with Recurrent Neural Networks, IJCAI-16