資四B 91156295 劉光祖 資四A 91156198 蔡世煌 指導老師:郭育政 專題 F 組 垃圾郵件過濾系統 資四B 91156295 劉光祖 資四A 91156198 蔡世煌 指導老師:郭育政
1.何謂垃圾郵件(SPAM Mail) ? 安全威脅的垃圾郵件 藏有木馬的郵件,發作時會惡意攻擊造成電腦癱瘓。或者成為殭屍電腦 (zombies),被駭客做不當行為使用(如:被用來散發垃圾郵件)。 帶有病毒的郵件。 廣告垃圾郵件 不當內容的垃圾郵件,如:情色郵件 。 一般商業廣告的行銷郵件。 內容找不到廣告性質的垃圾郵件 笑話,連署或者奇文共賞的垃圾郵件。 網路謠言類的垃圾郵件。
2.垃圾郵件對個人的影響 不易找到該收的信,浪費搜尋正常信件的時間。 不小心會刪掉重要的信件。 擔心信箱空間不足容量爆滿。
3.垃圾郵件對企業的影響 降低公司網路的頻寬與效能,進而影響公司正常的商務運作,導致生產力降低,增加無謂的企業整體營運成本。 隱藏資安危機,如:病毒、後門程式。
4.垃圾郵件的發送方式 名單發送: 購買或搜集可靠的E-Mail名單發送垃圾郵件。 字典檔發送: 以字典檔亂數產生收件者,並全數發給E-Mail Server,以達到散發信件目的。
垃圾信件過濾模式 關鍵字比對(Keyword):針對來信的標題、寄信人名稱...等,針對信件內容,以關鍵字進行過濾,然後判斷是否阻擋。 域名反查:把發信來源所提供的 Domain和IP進行反查,倘若不存在的話,則直接判定為垃圾信件。 Language:假設內定的語言只有繁體。 Header 白 名 單 黑 名 單 關 鍵 字 Dos 域 名 反 查 BlackList Language 貝 氏 分 析 啟 發 氏 過 濾 其 他 過 濾 條 件 Content
此作為黑、白名單來源分析 也作為RBL資料分析 此作為域名反查分析 此作為Dos時間分析 此作為黑、白關鍵字分析 此作為語言分析(參考) 01 Jun 2005 20:20:20 +0800 (CST) 此作為黑、白名單來源分析 也作為RBL資料分析 此作為域名反查分析 此作為Dos時間分析 此作為黑、白關鍵字分析 此作為語言分析(參考) 01 Jun 2005 12:26:40 -0000 01 Jun 2005 12:26:40 -0000
其他:電郵分身 使用者可以製造多個E-MAIL ADDRESSES當作分身信箱。 這些分身都是指向同一個 E-MAIL 位置。 當某個分身遭到垃圾攻擊,使用者就可以將該分身刪除,以杜絕垃圾郵件。
PROF_ @scu.edu.tw
ANTI-SPAM POP3 Outlook Express SERVER MAIL Mail Server FILTER 使用者請求 使用者回饋 Server 轉求 Mail Server MAIL FILTER
白名單(White List, Access List): 針對非寄送垃圾信件之郵件伺服器、非發送垃圾的寄信來源信箱位址,給予通行。 黑名單 (Black List, Block List): 針對專門寄送垃圾信件之郵件伺服器、經常發送垃圾的寄信來源信箱位址,進行阻擋。
阻斷服務攻擊(Denial-of-Service,簡稱 DoS),就是利用部分網路系統或者相關通信協定等,在設計或實作上的漏洞,在一段期間內透過大量且密集的封包傳送,導致被攻擊的目標伺服器無法正常運作而提供對內對外的網路服務。 運用 偵測大量寄送之信件:由於許多垃圾郵件採同時間大量寄送的方式,因此可以針對寄送大量相同信件之同一伺服器的通過時間進行判別,來分析處理。
有些組織或是公司都有所謂的黑名單,也就是不受歡迎的郵件名單。一些反垃圾信組織聯盟,會收集這些垃圾郵件成為線上黑名單資料庫,也接受使用者檢舉加入網路黑名單,並不定期提供 Live Update。 運用 Blacklist:連上第三方的RBL(Realtime Blackhole List )來判斷此E-mail是否為垃圾信件。
Bayesian Filtering(貝氏過濾):貝氏過濾理論是依據電子郵件的內容,計算出為垃圾郵件可能性的機率,其計算依據不只是垃圾郵件,還有一般合法的郵件,成為反垃圾電子郵件解決方案的過濾演算法的一種選擇。 如有致富兩字在郵件上出現的話,它80%是垃圾郵件,而請問則只會出現在5%的垃圾郵件中。
找出特徵字來算特徵值的過濾方式,只能針對已知的特徵字部份進行處理,這是因為垃圾信件寄送的技巧越來越高超,傳統的關鍵字比對方式,將無法因應未來垃圾信件的快速變化與發展。所以,結合關鍵字比對與常用垃圾郵件的字眼的觀念,根據信件中出現的字句進行分析,來判別是否為垃圾信件。
信體內容帶有特殊的HTML tag: 為了嵌入更多的內容和script,垃圾郵件往往會使用一些一般電子郵件不會使用的HTML tag,如使用看不見的內嵌網頁連結至廣告信網站或計數器…等。 發送時間為可疑的時間: 有些垃圾郵件為了在客戶端保持最前端的位置,會將發送時間強行修改到一個未來的時間,例如2038年1月19日。