IEBLOCKER個人版 不當網站防制系統

Slides:



Advertisements
Similar presentations
分享人:張益源. 個人資料介紹 姓名:張益源 畢業:體育系 97 級 專長:田徑、籃球、游泳 任教學校:慈濟大學實驗國民小學 學校職務:體育兼資訊老師.
Advertisements

安裝 ASP 應用程式 - 檢查系統環境 - 第一步, 打開控制台。 第二步 打開 「系統管理工具」
报告人:高 攀 导 师:王宗敏 教授 指导老师:陈刚 老师
计算机网络高级工 梁绍宇.
大学计算机基础 主讲:张建国 电话: 实验及交作业网址:
保良局何壽南小學 使用牙膏對我們生活的影響 六年級專題報告 姓名﹕李燊樺 班別﹕6B 日期﹕
中國歷史人物武則天 G組組員 韋紫恩, 余詩琪 蔡煦齡, 黃榮紳,.
电子商务网络技术 主讲:苑毅 电子商务教研室.
社区卫生人力资源管理在机构的运用 武侯区玉林社区卫生服务中心 曾 玲
北京教育资源服务平台培训 2008年3月13日.
第三节 渐开线圆柱齿轮精度等级及应用.
Chapter 1 網站架設流程與空間申請 無論是網頁設計還是架設網站,除了依靠少許美術天份,再加上必要的設計技能外,還需要了解一些基本的概念,例如什麼是網站?什麼是網頁?如何較好地架設網站?每個設計師都必須知道這些基礎概念,才能夠設計更佳的網站。 大綱 下一章 開始 離開.
疾病的分布 (Distribution of Disease)
2013年度企业财务会计决算 布置培训会.
07 網拍相片後製 7.1 商品攝影的重要性 7.2 如何讓自己的拍賣商品更有特色 7.3 調整相片尺寸 7.4 設計商品相片的版面 7.5 為版面加上文字標語及配色 7.6 加入去背的商品相片.
网 站 设 计 与 建 设 Website design and developments
歐美國家AIDS疫情獲得控制,中國、印度疫情快速成長,亞洲未來疫情很可能超越非洲
教学网站设计与制作教程 第四周 主讲:黄光芳 TEL:
第2课 共享网络资源.
日本体贴入微的服务业.
一、国家“守重”网上评价流程(1) 企业 9、公示 工商 2、注册 3、登录 5 、申报 6、报送 8、推荐 1、预申报 4、审核 7、计算
管理系统使用注意事项 1.每个事业单位只有一张唯一的专用光盘。但为防止事业单位专用光盘损坏,可以自行刻录一张新的光盘作为备份。用于网上登记的计算机必须有光驱才行、计算机必须是xp或更好版本的的操作系统,浏览器必须是IE6.0版本以上。 2.事业单位专用光盘中“网下填表与上网提交”功能未开通,待开通后再告知大家。
全国工会企事业资产统计系统操作说明 登录地址:http://qsyzc.acftu.org/ 或
一、登录界面 (一)登录方式 1、访问广东工程咨询网 ( 动态里,“咨询师登记工作”专栏 2、 IE地址栏中直接键入管理系统 地址(
企业网搭建及应用 重庆市永川职业教育中心
网络地址转换(NAT) 及其实现.
TQC 雲端技術及網路服務.
使用手冊 /9/11 馮光齊 中壢高商電子郵件系統 使用手冊 /9/11 馮光齊
教育部「生技產業創新人才培育計畫 」 104 年度成果展暨105年度計畫交流會議 黃俞寧 政治大學經濟系
PHP平台安裝-如何取得軟體 各軟體支援機構網站: Apache Server:
Chapter7 全球資訊網與瀏覽器介紹 網路應用入門(一) Chapter7 全球資訊網與瀏覽器介紹
空中英語教室影音典藏學習系統 主講人:彭鉯茹 大鐸資訊股份有限公司 TudorTech Systems Co., Ltd.
【VA虚拟应用管理平台】专题培训 资源管理及个性化 陕西益和信息技术开发有限责任公司 2011年2月.
如何使用IP通远程访问系统 申请及使用方法介绍.
欢迎各位领导莅临胜利科技检查指导工作 安徽省公共电子阅览室 免费软件安装培训 全国公共文化发展中心安徽省级分中心 2014年09月.
HedEx Lite产品介绍 轻松获取、使用华为文档
13.1 用框架劃分工作區,方便演示資訊 13.2 使用連結及鎖定點連接資訊 13.3 使用列表及表單演示資訊
校園網路電話專案 建置說明 2019/1/2 D-Link Taiwan Version 1.03.
陸、會計作業 線上管理系統說明 會計室系統管理師 施堯賓
2006「新進專任教師」研習營 研習營日期:95年4月11日(星期二)、 95年4月12日(星期三)
正荣集团企业门户 基本流程培训
校 園 雲端輸出管理系統 新印科技股份有限公司 聯絡人:伍宏一 電 話: /
北極熊 華德學校 田根繩.
電腦基本故障排除與維護 (軟體) 淡江大學資訊中心教學支援組 劉育辰.
网站信息员 2011年2月.
外贸型网站的建设与推广 第一节 建设外贸型网站的必要性与基本原则 第二节 建设外贸型网站的基本流程 第三节 外贸型网站的推广和监测.
使用前请注意 请将IE或上网助手、google工具条等设置的禁止弹出窗口设为允许弹出窗口。
网站信息员 2011年2月.
AWS雲端企業 馮治平 2016/10/06.
第 5 章 加 入 圖 片.
【VA虚拟应用管理平台】专题培训 资源管理及个性化 陕西益和信息技术开发有限责任公司 2011年2月.
有向無環圖支援向量機於多類 音樂識別之應用研究
3-6-1 愛滋風暴如同原子彈 戴著無比的威力蔓延開來 你是否能安然度過這場 風暴呢?.
瀕臨絕種—北極熊 設計者:吳柏曦 班別:5B1 學校:華德學校.
本 次 课 教 学 思 路 此次课总的教学思路如下: 1、阐述本次课程的任务介绍以及应该掌握的要相关能力技术。
四部叢刊09增補版
論四端 孟子 一. 關於孟子…… 孟子,名軻,字子輿,戰國時鄒人。他受業於孔子孫子思的門人,是繼孔子後,儒家的另一位代表人物,給人尊稱為「亞聖」。 你想了解孟子更多的生平事蹟嗎?你聽過「孟母三遷」的故事嗎? 試用滑鼠指向孟子畫像,然後在滑鼠左邊連按兩下。
106學年度第1學期 精神、社區及臨床選習 實習前說明會
WWW 大觀園─ Internet Explorer
遠見雜誌知識庫 udndata.com 操作使用手冊.
研究生出国申请流程 学生使用手册.
107學年度 精神、社區及臨床選習 實習前說明會 護理科實習組
校園群組寄信操作手冊 國立宜蘭大學 圖資館 系統設計組 2017年更新版.
空中英語教室 影音典藏學習系統 1.
【VA虚拟应用管理平台】专题培训 接入防火墙 陕西益和信息技术开发有限责任公司 2011年2月.
黑龙江省科学基金 项目验收填报培训 黑龙江省计算中心 2015年09月.
積極人生,憂鬱遠離 生命可貴,輕生是不智之舉
经销商DERP 网络测试指南 EM-DERP项目组.
项目一 了解网站的概念 项目二 创建个人网站“鸿渐工作室” 项目三 制作“鸿渐工作室”的主页 项目四 HTML语言 项目五 制作“家乡特产”网页 项目六 制作“给我留言”网页 项目七 制作“应用技巧”网页 项目八 模板制作及应用.
「高級中等學校學生學習歷程資料庫」與學校自行建置 「校內學生學習歷程檔案紀錄模組」 資料串接全國說明會
Presentation transcript:

IEBLOCKER個人版 不當網站防制系統 邱志傑 王明習 謝錫堃 賴溪松* 國立成功大學 計算機與網路中心 *國立成功大學 電機工程學系 報告人:邱志傑   2006年11月

大綱 前言 不當網站資料庫系統 IEBLOCKER功能架構 IEBLOCKER功能簡介 資料庫數量及阻擋成效 結論

前言(一) 在2004年6月的Internetpolicy中指出,全球色情網站大約有四千六百多萬的網頁,而隨著網路頻寬的增加,瀏覽網頁不再受限於以往的網路頻寬過慢,反而更以多媒體聲音及動畫影片來突顯網頁的豐富性。 各區網中心代理伺服器瀏覽統計中,每日瀏覽次數前一百大排名的網站平均約有四個網站是屬於不適合存取網站。 全台各區網中心平均每天約有一百五十六個不當網站被使用者所瀏覽,平均每日約有七萬多次的瀏覽次數及965MB的網頁下載量 。

前言(二) Region Webpages Europe 28,430,600 Pacific 12,352,600 Asia 3,193,000 Latin America 1,048,600 Africa 389,400 Canada 283,600 Caribbean 255,000 Middle East 77,800 Total 46,030,600 資料來源:Internetpolicy分析全球色情網頁 http://gipi.typepad.com/internetpolicy/2004/06/

教育部之防制措施 教育部電算中心主導TANet技術整合

不當網站資料庫系統架構圖

搜尋引擎過濾結果 利用Google、Gais及Yahoo搜尋400個不當關鍵字辭,每個關鍵字詞取前100大排名。 搜尋結果有37,978筆資訊,分別為29,567筆不重複網頁及6,465筆不重複網站。 過濾結果 4,936筆正常網站 783筆空白網站 416筆不當網站 330筆無效網站

網站分析系統(一) Website Analysis System(WAS) 檔案數量 所佔比例(%) .htm(.html) 5430 70.95 .asp 508 6.64 .php 597 7.80 .txt 1038 13.56 .cgi 67 0.88 .pl 7 0.09 .jsp .cfm 6 0.08 分析1000個網站副檔名的比例

網站分析系統(二) 自動擷取該網站下所有內容 快速整合該網站下所有符合htm、html、txt、asp及php的網頁成一個網站內容資料庫 WAC處理整合後的資訊 下載 分析附檔名格式 整合 資料庫分類

網站分析核心(一) Website Analysis Core (WAC) 關鍵字詞(keyword)資料庫 計算該網站出現哪些不當關鍵字詞 中文詞彙(chinese)資料庫 分析該網站有多少中文詞彙 網站名稱(dns)資料庫 偵測網頁原始檔中包含哪些伺服器主機名稱 內部相關網頁鏈結(link)資料庫 偵測網頁原始檔中有哪些頁面在本身網站下面 外部相關網頁鏈結(friend) 資料庫 偵測網頁原始檔中有哪些頁面不在本身網站下面 圖檔鏈結(gif)資料庫 偵測網頁原始檔中包含哪些圖檔網頁位址 網站分級(icra)資料庫 偵測網頁原始檔中是否包含有註明網站分級之資訊或電子郵件位址

網站分析核心(二) 檔案內容 資料數量 Keyword Chinese Dns Link Friend Gif Icra teen 1(個) Chinese 站內導覽 系所介紹 74(列) Dns www.ncku.edu.tw www.macromedia.com 4(筆) Link http://www.es.ncku.edu.tw/index.php http://www.es.ncku.edu.tw/cla_doctor.htm http://www.es.ncku.edu.tw/cla_outline.htm 137(筆) Friend http://www.ncku.edu.tw/~acad/question.htm http://download.macromedia.com/pub/shockwave Gif http://www.es.ncku.edu.tw/icon/e_activity.gif http://www.es.ncku.edu.tw/icon/new123.gif http://www.es.ncku.edu.tw/layout/bottom.gif 79(筆) Icra ccwen@mail.ncku.edu.tw 1(筆) www.es.ncku.edu.tw網頁內容的相關資訊

網站分析核心(三) 本系統軟硬體設備 支援平行處理 平行處理四個WAC之畫面 WAS平行擷取100網站內容之畫面 MS Windows2000 Server Dual Xeon2.8G及2G ECC Memory,105Gb HD Apache(1.329)+Php(4.34)+Mysql(4.016), C, BCB. 支援平行處理 平行處理四個WAC之畫面 WAS平行擷取100網站內容之畫面

WAS效率分析 下載1000個不當網站 下載google之18,240筆網站 下載5000個不當網站 運算時間接近於一個工作天 分成25個批次檔同時執行 檔案總大小為1.2Gb,當中包含59,007個檔案、6,378個資料夾、9,602張jpg圖檔及7,947張gif圖檔。 下載google之18,240筆網站 花費時間約小於五個工作天 分成100個批次檔同時執行 檔案總大小為48.6Gb,當中包含1,462,835個檔案及238,147個資料夾。 下載5000個不當網站 花費時間約小於三個工作天 檔案總大小為2.53Gb,當中包含139,619個檔案及30,929個資料夾。

WAC效率分析 1000個網站之檔案資料庫(Content DB)總大小為912MB。 WAC處理完畢後資料庫大小為260MB。 1200MB 912MB 260MB

網站之關鍵字詞比對流程 擷取網頁內容與關鍵字詞資料庫比對 計算每個網頁之不當關鍵字詞個數 計算每個網頁之不當權重 計算每個網站之平均不當權重 權重設限為3.38 擷取網頁內容與關鍵字詞資料庫比對 計算每個網頁之不當關鍵字詞個數 計算每個網頁之不當權重 計算每個網站之平均不當權重

關鍵字詞代理器實驗結果 精準率為0.96(確實為不當網站/被認定為不當網站) 召回率為0.86(確實為正常網站/被認定為正常網站) 偵測率為0.85(1000個不當網站偵測出852個) 誤判率為0.04(1000個正常網站偵測出47個) 檢測率為0.90(如下定義)

圖片偵測代理器(Graphic Agent) 搜尋網站下特定格式與副檔名之圖片 色彩空間轉換 RGB =>YCbCr 圖片膚色特徵 膚色特徵之強化 動態人種膚色門檻值 膚色強化及動態人種膚色 計算該網站目錄下之膚色圖片比例 計算該網站膚色權重

膚色分佈 82個不當網站之膚色權重 85個正常網站之膚色權重

網站連結代理器(Link Agent) Link Agent 100個正常網站平均權重為0.84 100個不適合存取網站平均權重為2.59 分析該網站被連結與連結的權重分數 100個正常網站平均權重為0.84 100個不適合存取網站平均權重為2.59

網站分類及評分系統(WRACE) 採用SVM (Support Vector Machine)演算法 SVM訓練樣本 SVM測試樣本 本研究採用Radial Basis Function Kernel來做訓練及測試的樣本 SVM採向量方式處理訓練及測試資料 SVM可處理線性不可分割的問題 SVM在分類上有極佳之效果 SVM訓練樣本 100筆正常網站 100筆不正常網站 SVM測試樣本 100筆隨機網站 訓練與測試過程 svmscale.exe -l -1 -u 1 -s train.range train.txt >train.scale svmtrain train.scale svmscale.exe -l -1 -u 1 -s test.range test.txt >test.scale svmpredict test.scale train.scale.model result.txt

判斷結果 精準率為0.95、召回率為0.96、檢測率為0.95。 偵測率為0.88、誤判率為0.04。 46 54 4 96 88 12 資料來源 偵測為不適合網站 偵測為正常網站 100筆隨機網站 46 (46筆當中有46筆 為不適合存取網站) 54 (54筆當中有52筆 為正常網站) 100筆正常網站 4 96 100筆不當網站 88 12

不適合存取網站國別分佈 五萬筆不適合存取網站的分佈圖

國內不當網站分佈狀況 95年四月提供 教育部603筆 架設於台灣 之不當網站

國內不當網站分佈狀況

IEBLCOKER個人版防制軟體 動機與目的 網路上色情資訊、賭博等不當資訊氾濫,對未成年的青少年來說,無疑是身心上之一大傷害。 本系統的功能主要是針對使用者的瀏覽器,防止Internet上有關色情、賭博、暴力等不當資訊透過瀏覽器顯示於使用者的電腦畫面上。 可偵測TICRF網站分級標籤的功能。 可統計使用者被阻擋的紀錄。 已完成新版安裝介面。

瀏覽器使用分佈表 成大計網中心提供流覽成大網站單日LOG。 本單位將LOG資訊量化。 使用IE瀏覽器比例超過七成。 MSIE 1401644 72.3% KKman 465210 24.0% FireFox 36879 1.9% MyIE2 10404 0.5% Opera 1042 0% Others 22045 1.1% Total 1,937,224 100% 成大計網中心提供流覽成大網站單日LOG。 本單位將LOG資訊量化。 使用IE瀏覽器比例超過七成。

IEBLCOKER個人版防制軟體 IEBLOCK 安裝畫面及阻擋畫面 舊版安裝畫面 新版安裝前 隱藏檔 安裝檔 滑鼠點選安裝檔 安裝完成

可自訂阻擋資料庫

IEBLOCKER運作流程

IEBLCOKER個人版防制軟體 新增IEBLOCKER回報阻擋機制 可紀錄使用者阻擋之網頁。 可紀錄使用者電腦之IP 可紀錄阻擋網頁之日期與時間

IEBLCOKER個人版防制軟體 新增符合新聞局TICRF META偵測功能 可阻擋網頁內含TICRF META之網頁。 META格式為 <meta http-equiv="PICS-Label" content='(PICS-1.1 "http://www.ticrf.org.tw/chinese/html/06-rating-v11.htm" l gen true for “your website" r (s 3 l 0 v 3 o 0))'>

IEBLOCKER使用狀況 IEBLOCKER被 阻擋的網站排名 IEBLOCKER被 阻擋的IP排名

IEBLCOKER個人版防制軟體 安裝IEBLOCKER後的阻擋動作,包含使用者IP、使用者瀏覽的日期時間及被阻擋的網站,都會回傳給伺服器統計(自95年4月開始統計)。 至95年9月13日止,共有1,934人次下載IEBLOCKER軟體。 在阻擋不當網站的次數一共有17,256次,阻擋網站內容含有不當分級標籤共有3,371次,以上一共有20,627次阻擋使用者瀏覽不當網站之紀錄。 在阻擋紀錄資料庫中共有1,596個網站被阻擋。

結論 建立不當網站資料庫系統 開發IEBLOCKER個人版不當網站防制系統 網站搜尋 網站擷取 網站分析 網站過濾 網站評分 網站分類 阻擋不當網站 阻擋含有限制級網站標籤的網站 統計阻擋狀況 提供申訴檢舉網站

問題與討論