报告人:高 攀 导 师:王宗敏 教授 指导老师:陈刚 老师

Slides:



Advertisements
Similar presentations
分享人:張益源. 個人資料介紹 姓名:張益源 畢業:體育系 97 級 專長:田徑、籃球、游泳 任教學校:慈濟大學實驗國民小學 學校職務:體育兼資訊老師.
Advertisements

国家税务总局关于修改企业所得税年度纳税申报表( A 类, 2014 年版) 部分申报表的公告(国家税务总局公告 2016 年第 3 号) 一、对《企业基础信息表》( A )及填报说明修改如下: (一) “107 从事国家非限制和禁止行业 ” 修改为 “107 从事国家限制或禁止行业 ”
2014 年 12 月 企业所得税年度纳税申报表 (A 类, 2014 版 ) 辅导材料(二) A 企业基础信息 A 主表.
Edu.51cto.com. 讲师: 大侠唐在飞(小侠唐在飞) 唐志强 edu.51cto.com 姓名:唐志强 网名:小侠唐在飞、大侠唐在飞 年龄:差点成 80 后 地址:乌鲁木齐 (切糕、大盘鸡、干果什么的) 擅长领域:扛显示器、装机、装系统、杀病毒、重启电脑、部署服务器、做网线、做电话头、帮领导下片、看监控、
物流运输管理.
煤矿瓦斯监测监控系统应用管理.
當我已老 謹以此文獻給像我一樣流浪在外的子女們.
白玉苦瓜 余光中.
景观水池渗漏的研究 年级专业:12级土木工程 指导教师: ××× 教 学 点: ××××教学点 新疆工程学院继续教育学院 20 年 月 日
企业所得税年度纳税申报表(A类,2014版) 中小企业主要报表辅导材料
2015年12月14日-2015年12月20日 缩略版.
指導老師:羅夏美 組別:第四組 組員: 車輛二甲 蔡中銘 車輛三甲 莊鵬彥 國企二甲 陳于甄 國企二甲 詹雯晴 資傳二乙 林怡芳
教育信息技术中心 2009年工作汇报 2010年1月.
第六章 专题地图 本 章 要 点 1、掌握专题地图、地图集、电子地图集的定义、分类及其基本特征。
计算机网络高级工 梁绍宇.
计算机网络基础 Internet基础.
公共部门人力资源管理课程导学 学习本课程的三步 3、利用网络 2、掌握方法 1、了解课程.
数字化教学资源建设在大学化学教学中的 探索与实践 刘志广 大连理工大学 2007年5月12日 济南.
工程定额与计价方法 教材名称:工程建设定额原理与实务
建设工程施工管理 模拟卷 一、单项选择题 1.下列选项中,除( )以外都属于施工机械使用费。 A.购置费 B.安拆费及场外运费 C.折旧费 D.修理费.
繁星推薦及申請入學 家長說明會 教務處試務組.
审计案例研究 第一讲 辅导教师 周桂芝.
阳光工程引导性培训 宁夏自治区盐池县农广校
南通市卫生监督所副主任医师 南京医科大学副教授 施 飞
《毛泽东思想和中国特色社会主义体系概论》 第一章马克思主义中国化两大理论成果
二十世纪外国文学专题 章丘电大 李颜.
2010年春季开学学校食堂食品安全知识培训 徐汇区食品药品监督所
精進警政統計業務 內政部警政署統計室 主任 謝文政 104年 3月 4日.
进出口食品检验监管 基础讲课内容 我国进出口食品安全管理体系介绍 法律法规 进口食品的检验检疫 出口食品的检验检疫.
龍騰高中地理(三) 第六章 地形學的應用.
授课班级 安全技术管理0605班 第 5 次 课 授课时间 2008年3月10日 星期一 授课地点 科技楼401多媒体教室 课题内容:
汇报大纲 一、报送系统总体介绍 二、自查及检查评分报送流程 三、自查及检查方法及关键点 四、建议及注意事项.
2015版《中国地震动参数区划图》 对我市城乡建设的影响
典型案例---医院.
“网络问政”给九江新闻网 带来新的发展机遇 -- 九江新闻网 高立东 --.
總務處營繕組簡報 1.業務職掌 2.九十四年度工作績效 3.工程一覽 4.歷年工作成果 5.未來展望 6.困難及建議.
2014年企业所得税汇算清缴相关税收政策 新华区地方税务局 卿继红
城市地理学.
第十章 季节施工 ——冬期施工准备.
危险废物环境管理情况 河南省固体废物管理中心  韩晓晗 2007年6月6日.
第一篇 生命科学 第2课时 细胞.
古蹟導覽系列活動 前進大稻埕.
工程地质学 教师简介: 杨志双 副教授 1990年毕业于长春地质学院 获硕士学位 年到日本京都大学访问学习
食品添加剂生产许可审查通则起草说明.
俄语字母的发音体系 阅读规则.
概述 检索图书的检索工具 检索期刊的检索工具 检索特种文献的检索工具
餐饮服务从业人员 食品安全知识培训 孔莉 朔州市食品药品监督管理局.
首次数据采集填报说明 内蒙古自治区校车信息管理系统 靳 丽 内蒙古自治区教育信息中心 2013年5月
第一章 百度不能出现问题.
社会工作概论 个案工作 课程培训 深圳电大 赖小乐.
大 纲 一、备案系统数据迁移方案 二、备案系统过程数据处理方案 三、备案系统内存量数据核验方案 四、新备案系统信息真实性核验方案※
北京汉邦高科数字技术股份有限公司 2015年年报交流.
防空地下室审批要点 主讲人:陈玉亭.
治超新政相关文件解读 厅执法局 江涛 二零一六年九月.
面对经济全球化.
科技服务业统计 报表填报说明 江苏省科技统计中心 2008年12月 镇江.
前言.
商品学 高学芹.
关于加强城市排水防涝有关政策解读 吉林省住房和城乡建设厅 臧 锐.
海珠区第二次全国经济普查服务业培训 二〇〇八年十二月二十三日.
2016年度税收新政策解读 主讲 石敖 湖南省中税网天一税务师事务所 2018/11/7.
第8章 电子商务的物流配送 《实用电子商务》教学组.
保護智慧財產權宣導 及執行小組 執行秘書:劉嘉卿老師
用相频曲线测阻尼系数的探索 指导教师 陈乾 吉新程.
外贸型网站的建设与推广 第一节 建设外贸型网站的必要性与基本原则 第二节 建设外贸型网站的基本流程 第三节 外贸型网站的推广和监测.
手提電話與我們日常生活的關係 六年級專題研習報告 班別:6A 姓名:林芷晴 日期:2007年12月19日
知识点六 草原资源保护法及渔业资源保护法.
目次检索 打印 下载 文字摘录 更换背景 多窗口阅读.
超星电子图书.
基于C#的.NETFramework 程序设计语言
Presentation transcript:

报告人:高 攀 导 师:王宗敏 教授 指导老师:陈刚 老师 基于校园网DNS日志数据的可视化分析 报告人:高 攀 导 师:王宗敏 教授 指导老师:陈刚 老师

主要内容 背景及研究现状 数据准备及特征提取 数据可视化呈现 小结及后续工作 参考文献 数据说明 算法选择 数据处理 时间区间 特征对比 属性特征 图形维数 小结及后续工作 参考文献 2017/2/26 2/15

背景及研究现状 DNS日志蕴含的信息及分析价值 数据可视化 记录了用户访问互联网所需的DNS解析记录 真实反映了用户的网络需求,对认知网络有重要价值和意义 数据可视化 利用人类视觉感知和形象化思维,将分析数据以图形化方式从不同角度呈现出来,快速直观地展示数据中所蕴含的特征信息 增强对数据的认知 挖掘数据内部所隐藏的规律 2017/2/26 3/15

背景及研究现状(二) 研究现状 具体方法 实现目标:归纳出系统的可视化方法 数据挖掘:提出对挖掘结果可视化 基于时间信息:时间墙模型,河流模型 基于GIS系统:地形数据,配电网数据,雷电数据 具体方法 对数据的多种特征属性从不同的角度进行可视化 探讨不同的数据特征提取手段和呈现方法 认识可视化对不同特征信息、数据类型和数据规模的适用规律 实现目标:归纳出系统的可视化方法 2017/2/26 4/15

数据准备及特征提取 数据说明 流式数据:高速,连续不断,数据量大 行为记录 数据规模 请求记录:时间戳、序列号、用户IP、请求解析的域名、请求分类 回答记录:时间戳、序列号、解析结果IP 数据规模 一天数据,500多个文件,大小3GB以上,请求记录3000万条以上 2017/2/26 5/15

数据准备及特征提取(二) ——数据处理算法选择 数据准备及特征提取(二) ——数据处理算法选择 主要特征信息是IP地址和域名地址,要统计在一定时间周期内的非重复IP数量和每个IP的请求行为累计次数、非重复域名地址数量和每个域名地址的被关注数据 IP地址,移位异或哈希算法 addr=(k[0] <<24)+(k[1]<<16)+(k[2]<<8)+k[3],hash=(addr^(addr>>16))&MASK,MASK=SIZE-1 空间216,时间2小时58分25秒,平均查找次数2344.27 空间217,时间1小时20分52秒,平均查找次数176.83 (44264个IP) 域名地址,旋转哈希算法 for(hash=strlen(str),i=0;i<strlen(str);i++) hash=(hash<<4)^(hash>>28)^ord(str[i]); hash=(hash^(hash>>10)^(hash>>20))&MASK; 空间221,时间2小时6分43秒,平均查找次数1.85 (668527个url) 2017/2/26 6/15

对原始日志数据,分别使用分钟、小时时间区间和日、周、月等不同的数据规模进行处理和可视化呈现 数据准备及特征提取(三) ——数据处理 处理流程: 对原始日志数据,分别使用分钟、小时时间区间和日、周、月等不同的数据规模进行处理和可视化呈现 一天(20100701)的数据,IP在10:00-10:10时间段的数量为6297,10:00-10:30的数量为8901,10:00-12:00的数量为15802,一天的数量为44254。 观察者 PHP 原始数据 数据整理 计算 数据格式 MATLAB 出图 分析 特征提取 2017/2/26 7/15

数据可视化呈现 时间区间 对一天、一周、一个月的数据规模,按每十分钟的时间周期进行可视化呈现。 对于IP活跃用户的规模,可以使用每个时间周期内的IP地址数量来表示;IP用户活跃程度用所有IP请求总次数和每个IP平均请求次数表示,用平均请求次数的标准差辅助分析。 2017/2/26 8/15

数据可视化呈现(二) 特征对比 不同日期的数据在同一时间点的纵向对比 不同类别的数据在同一时间点的纵向对比 2017/2/26 9/15

数据可视化呈现(三) 属性特征 特征维度可以是按时间轴对数量属性进行展示,也可以以散点表示IP地址是否有访问行为 2017/2/26 10/15

数据可视化呈现(四) 图形维数 三维空间中,平面坐标表示IP地址,z轴表示IP的请求次数 2017/2/26 11/15

小结及后续工作 小结 后续工作 探索了从不同角度对数据进行特征提取 提供了数据多种属性的直观表现形式 帮助管理者迅速发现在海量数据中所隐藏的特征信息和规律 后续工作 进一步积累和丰富可视化的手段 图形转化成动态表现的视频 多维信息的关联 总结不同呈现方式的适用规律 归纳出系列化的可视化工具集合 2017/2/26 12/15

参考文献 [1] 刘本仓.基于采样数据流挖掘的网络行为分析研究[D].西安:西安电子科技大学,2009. [3] 丁青,周留根,朱爱兵等.基于K-means聚类算法的校园网用户行为分析研究[J].微计算机应用,2010,31(6):74-80. [4] 邓莉琼,吴玲达,谢毓湘.基于时间信息的可视化表现方法研究[C].第三届和谐人机环境联合学术会议(HHME2007)论文集,2007,109-115. 2017/2/26 13/15

[5] 崔彬.数据挖掘中多维数据可视化的研究[D].武汉:武汉理工大学,2006. 参考文献(二) [5] 崔彬.数据挖掘中多维数据可视化的研究[D].武汉:武汉理工大学,2006. [6] 孙广宇,李海洋,赵向东等.地形数据的可视化研究[J].测绘与空间地理信息,2010,33(3):40-44. [7] 孙珂,金超,刘永生.基于GIS技术的配电网实时数据可视化监控系统的开发[J].广东电力,2011,24(1):44-47. [8] 路明月,张其林,甘文强等.基于GIS的雷电数据可视化地图组件设计与实现[J].气象科技,2011,39(6):823-827. 2017/2/26 14/15

谢谢! 欢迎各位老师同学批评指正!