GOOGLE FLU TRACKER If you want to know what's up with the flu at the moment, you have a few choices: You can get the latest information at Google Flu Trends.

Slides:



Advertisements
Similar presentations
走进社区、走进部门、走进农村 民进海宁市总支部. 民进海宁总支开展 “ 走进社区、走进部门、走进农村 ” 活动: 1 、为了积极履行民主党派的职能,搜集社情民意,为政府工作出谋划策。 2 、让民主党派走进群众,让群众了解民主党派。 3 、通过 “ 三走进 ” ,进行访贫问苦,搜集民情民声,构筑群众与政府的桥梁,
Advertisements

學童常見感染性疾病 蕭添木 醫師 美國哈佛大學公共衛生碩士 壢新醫院職業醫學科 主任 家庭醫學科 主治醫師.
流感是什么? 流感是由什么引起的? 流感有什么症状? 为什么春季是流感高峰期? 流感的防疫方法 我问你答.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
限制性定语从句和非限制性定语从句 区别:( 1 )限制性定语从句与其先行词 关系密切,如果去掉该从句,剩余部分 的意思不完整甚至失去意义;非限制性 定语从句只是其先行词的附加说明,如 去掉,句子剩余部分意思仍然完整。 A man who does not try to learn from others.
什 麼 是 大 數 據 ?. Q :大數據是什麼? A :大數據( Big Data )又被稱為巨量資料,其概念其實就是過去 10 年廣泛用於企業內部的資料分析、商業智慧( Business Intelligence ) 和統計應用之大成。但大數據現在不只是資料處理工具,更是一種 企業思維和商業模式,因為資料量急速成長、儲存設備成本下降、
國立高雄第一科技大學 H1N1新型流感防疫小常識
Avian Influenza ( Bird Flu) 禽流行性感冒 (禽流感)
PROJECT NAME 项目名称 上海xx文化传播有限公司.
~學生事務處衛生保健組關心您的健康與生命安全~
江苏省人感染H7N9禽流感疫情 监测方案 江苏省疾病预防控制中心 鲍倡俊 南京.
学校人感染H7N9禽流感 防 控 知 识 培 训 长沙县健康教育所 李涛.
Unit1 What’s the matter? (section A 1a-1c).
H1N1新型流感病毒 為A型流感病毒,常見病毒有H1N1、 H1N2、H3N1與H3N2等,為具有高度傳染性的急性呼吸道疾病,傳染途徑為空氣中的細小微粒或直接接觸。 墨西哥大流行為變種病毒,同時帶有豬流感、禽流感和人流感的基因。 病毒跨種及基因變異重組,將使病毒強度增強,威脅更嚴重。
(供学校/社区/单位等开展健康教育使用)
學校護理專業發展數據說~ 學校護理的數據迷雲
第五組 組員:廖俊明、田景文、陳坤利、鄭可萱、張東銘、劉俊麟、廖佩茹、張家誠
C++面试笔试精要 张立伦 讲师的CSDN博客地址
开题报告.
第八章 了解法律制度 自觉遵守法律.
第 8 课 美国经济的发展.
師資培育中心外埠教育參觀.
文献与信息检索 李树青.
学校冬春季传染病防控 椒江区疾控中心
中国企业社会责任探讨 2010思政四组
空间看看就看看看 打发打发 大数据时代高中生诚实素养教育 李亚娟.
第三节 预付账款.
学习雷锋好榜样 ——高一年12班主题班会.
第四次大作业 登陆学校图书馆网站的电子数据库
计算思维.
(供学校/社区/单位等开展健康教育使用)
什么是京剧? 它是一门音乐、舞蹈、艺术和杂技的综 合艺术。是中国最有影响、最有代表性的戏剧。
我 读 书 我 快 乐 五(2)中队读书活动主题班会.
                                                                                                                                                                
Review of Unit 1 What’s the matter?.
学习前的准备工作 讲师:burning.
Chinese Virtual Observatory
R in Enterprise Environment 企业环境中的R
1. It only takes a spark to get a fire going 圍在火旁的人
李杰 首都经济贸易大学 安全与环境工程学院 个人主页:
网络常用常用命令 课件制作人:谢希仁.
Windows网络操作系统管理 ——Windows Server 2008 R2.
EMMC Embedded MultiMediaCard.
数据挖掘工具性能比较.
Get Started 1. Use USB cable or power adapter to power on the WisCore board. Make sure the power LED is on. Also, the WLED is flash. 2. Please download.
ScienceDirect高级检索功能及使用视频、说明发现路径
用event class 从input的root文件中,由DmpDataBuffer::ReadObject读取数据的问题
DevDays ’99 The aim of this mission is knowledge..
搜 刘智 iLife信息素养协会 索.
WSDM见闻 程龚.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
九十八學年度第一學期期末 校務會議學務處業務報告
SOA – Experiment 2: Query Classification Web Service
2019/4/16 关注NE官方微信,获取更多服务.
数据库使用指南 Nature全文数据库.
2019/4/ /4/25 学习科研好助手 NoteExpress文献管理与检索系统 北京爱琴海乐之技术有限公司.
Lightweight Data-flow Analysis for Execution-driven Constraint Solving
实体描述呈现方法的研究 实验评估 2019/5/1.
获奖类别: 获奖题目: 获奖学生: 指导教师: 研究内容:(400~500字,2~3幅插图)
English song What’s the matter? (Go for it)八年级下
第4课时 绝对值.
基于最大margin的决策树归纳 李 宁.
计算机绘图 AutoCAD2016.
深 圳 职 业 技 术 学 院 SHENZHEN POLYTECHNIC
一點星星之火,可以將火點燃起, 圍在火旁的人,立時便感到暖意﹔ 真神慈愛極豐富,你經歷過之後, 也必願意將這慈愛,向每個人傳開。
基于列存储的RDF数据管理 朱敏
無悔今生.
第十七讲 密码执行(1).
LOGO HERE 单击此处添加 您的标题标题标题 PRESENTED BY JANE DOE
校园之路.
Presentation transcript:

GOOGLE FLU TRACKER If you want to know what's up with the flu at the moment, you have a few choices: You can get the latest information at Google Flu Trends. Or you can get the official word from the Centers for Disease Control and Prevention, which is based on data that's by now a couple of weeks old. 头脑风暴组 陈馨雨 张国安 胡奥 申中一 盛炜博

这是一个互联网的时代 这是一个大数据的时代 “我们重视发挥互联网对经济建设的推动作用,实施互联网+政策,鼓励更多产业利用互联网实现更好发展。” ——习近平 2015中美互联网论坛 这是一个大数据的时代 大数据的四大特征: ①海量的数据规模(vast) ②快速的数据流转和动态的数据体系(velocity) ③多样的数据类型(variety) ④巨大的数据价值(value)。 ——国际数据公司

Google Flu Trends 谷歌流感预测 大数据在公共卫生领域的尝试 ——An attempt to track flu outbreaks based on search terms 谷歌流感预测 大数据在公共卫生领域的尝试 谷歌作为全球第一大搜索网站,每日的搜索量是一个巨额的数字。如果把全部搜索信息进行整合,这本身也是一种巨大的资源。

目录 预测原理 应用实例 数据出错 原因分析 解决措施

GFT的原理 谷歌工程师发现:在流感季节,与流感有关的搜索会明显增多;到了过敏季节,与过敏有关的搜索会显著上升;而 到了夏季,与晒伤有关的搜索又会大幅增加。 如果一个人患了流感, 那么他很可能上网搜索 流感的相关信息。通过 监测一个地区某些与流 感相关检索词的数量, 就可以估计出该地区流 感流行的情况。

2008年11月,Google Flu Trends正式上线 GFT分析谷歌搜索引擎中与流感相关条目数量,利用关键词追踪技术搜集大量有价值的数据,从而判断各地流感爆发情况 当然,并不是每个检索流感的人都会患流感,但将所有的流感相关的检索词汇总后,就会发现有一些词汇在流感流行的高峰检索总数目明显升高,通过计算这些词汇被检索的频率,就有可能获得该地区流感流行的趋势。

数据出错 从2011年8月到2013年9月108周中,谷歌开发工具超估流感 流行高达100个周。2012 - 2013与2011 - 2012的季节相比, 它高估了流感流行趋势超过50%。 2013年2月,《自然》杂志发文指出,GFT预测的流感样病 例门诊数超过了美国疾病预防控制中心(Centers for Disease Control and Prevention,CDC)根据全美各实验室 监测报告得出的预测结果的两倍! 如此海量的统计 为何会出错?

应用实例 2009年,甲型H1N1流感暴发的几周前,“谷歌流感趋势”成功预测了流感在美国境内的传播,其分析结果甚至具体到特定的地区和州,并且非常及时,令公共卫生官员备感震惊。因为传统上,美国疾病控制中心要在流感暴发一两周之后才可以做到这些。

原因分析 1.大数据傲慢(Big Data Hubris) 2.算法变化 ——大卫·拉泽(David Lazer)

“大数据傲慢”:即认为大数据可以完全取代传统的数据收集 方法,而非作为后者的补充。这种观点的最大问题在于,绝 大多数大数据与经过严谨科学试验得到的数据之间存在很大 的不同。 ①很多关键词只是看似与流感相关,但实际上却并无关联; ②媒体对于流感流行的报道会增加与流感相关的词汇的搜索 次数; ③搜索建议(recommended search)也会进一步增加某些热 门词汇的搜索频率 ——算法变化

在2012年,为了响应对症状的搜索,谷歌开始提供诊断术语 当然不同的语言差别也是很大的

“数据量的大幅增加会造成结果的不准确,一些错误的数据会混进数据库” 大数据为研究人类行为和人与人之间大规模的互动提供了新 的方式。然而,由于大数据的搜集做不到像“小数据”那样精 确,因此分析解读大数据是一件十分复杂的事。 “数据量的大幅增加会造成结果的不准确,一些错误的数据会混进数据库” ——维克托·迈尔·施恩伯格 《大数据的时代》

Dr. Dugas says Google's approach is no substitute for lab tests, hospital reports and on-the-ground data. And it's important to note that it's not tracking actual flu caused by influenza viruses — rather, it's identifying common symptoms like fever, cough and sore throat. 换季 实证明,很大一部分与CDC流感发生率数据相关的搜索词,并非是得流感的人引起的,而是由季节产生的——那些特定的搜索词是随时间而发生变化的,但这些搜索显然与病毒无关 着凉 搜索

在互联网时代,无法否认大数据在帮助公共卫生事 业方面具有巨大的潜力但如果没有足够的背景信息, 仅仅靠数字可能是会误导人的 综上所述: 大数据=更多的信息=更多虚假关系的信息 在互联网时代,无法否认大数据在帮助公共卫生事 业方面具有巨大的潜力但如果没有足够的背景信息, 仅仅靠数字可能是会误导人的 大数据本身的缺陷+ 公众搜索的偶然变化 +谷歌的统计方法 =GFT的错误

解决措施 在21世纪,我们不能否认互联网的巨大作用,也无法拒绝大数据所带来的冲击 唯有抓住机遇,迎接挑战,方能求生存,求发展 科学是一个是站在巨人肩膀上逐渐累积的过程,需要科学家能够不断地评估他们建立的工作,而知识的积累需要数据形式的燃料 在通往未来的道路上,没有捷径和坦途。 ——《环球科学》执行主编

我们可以试着: 更好的方法—— 改变追踪机制 最好的结果来自两个来源的信息和技术,即将大数据与小数据(传统的控制数据集)结合起来。 “流感”与“流感症状”是完全不同的概念 “榨菜指数”:根据畅销全国的涪陵榨菜这几年在各地区销售份额变化情况,推断人口流动趋势。 更好的方法—— 最好的结果来自两个来源的信息和技术,即将大数据与小数据(传统的控制数据集)结合起来。 取代谈论“大数据革命”的应该是“全数据革命”(all data revolution),应该用全新的技术和方法对各种问题进行更多更好的分析。

谢谢观赏 互联网时代,人类究竟应当去向何方? 究竟如何让互联网为人类所用? ——每个人都应当思考的问题