Semantic-Synaptic Web Mining: A Novel Model for Improving the Web Mining 報告者:陳宜樺 報告日期:2015/9/25
outline Introduction Semantic web Synaptic web Entropy Semantic-Synaptic web mining architecture
Introduction The enormous amount of unstructured information available on the web, results in inaccuracy and irrelevant information while user extract desired information from the web 大量的非結構化資訊可在網路上取得,當使用者要從網路上截取他們需要的資訊,造成不正確和不相關的資訊 為了解決此問題,所已提出這篇paper ,利用三種技術來改善當搜尋資料時多又不精確,導致找到不相關又浪費時間的困境
Semantic web Semantic web, a technique to manage content and process with creation and use of semantic metadata 主要管理內容和處理,同時也創作和使用語意資料相關聯的技術
Synaptic web Synaptic web, it is the connection between different neurons in the brain the synaptic connections between objects (Content/ Information) are more important than the object themselves makes the smarter web. Synaptic web 是一種生物學的術語,就像大腦的不同神經元相互連結, 重點不是內容或資訊,主要是每個資料中相關聯的結果
Entropy(1/2) Information Theory Entropy(熵),is a measurement of uncertainty and inconsistency in random variable, which evaluate the information content in a message. Mostly, the information content is the uncertainty of each event. 熵是種熱力學的概念,主要用來測量不確定性和隨機多變的方法,未知的消息越多不確定性越大,熵也就越大 當對問題越不清楚,所要搜尋的資料也就越多
Entropy(2/2) Semantic-Synaptic Web Noisy-Unorganized Web Semantic-Unorganized Web Noisy-Synaptic Web 最具有效率且相關而有效率的資訊 多數內容非結構化且不相關需要用關鍵字索引或搜尋無組織的網站 內容是有結構的但相對的連結出許多複雜且沒組織 像部落格 內容不相關且非結構化,但網站是有標籤且有過濾過值得推薦的資料
Semantic-Synaptic web mining architecture the nodes are to be distributed at a hierarchical range of entropy which results in relevant and accurate data 主要節點具有分散在每個層級的 在整理過後的少量資訊,每個結果具有相互關聯且相關且準確的
Thank You!