Large-Scale Malware Indexing Using Function-Call Graphs

Slides:



Advertisements
Similar presentations
校园及周边治安防范 暨应急预案桌面演练 实 训 乐山应急管理学会 贾 伟. 目 录 校园治安问题包含的内容 校园治安问题的特点 避免引发校园治安问题的对策 校园应急预案桌面演练实训 校园治安问题的成因.
Advertisements

教育部 1 教育部技職司 南區: 2010 年 11 月 5 日 北區: 2010 年 11 月 8 日 中區: 2010 年 11 月 9 日 產學攜手合作計畫 政策宣導.
“ 我不能 上学了,我 每天还要帮 家里拾柴火 呢。 ” 给远方的小学生写一封信 书信的基本格式: 开头顶格写称呼,打上冒号; 换行空两格写问候语; 接下来换行空两格写正文部分; 正文结束后,换行写祝颂语; 最后在右下方写上寄信人姓名和 写信日期。
104 年度環保小學堂 經費編列注意事項 會計室 : 丁子芸 中華民國 103 年 10 月 22 日 會計室 : 丁子芸 中華民國 103 年 10 月 22 日.
中醫藥就醫用藥 - 婦女篇 中醫藥安全衛生教育資源中心 中醫藥就醫用藥百分百、就是藥做到: 停、看、聽、選、用專業.
下背痛 林口長庚醫院內科 住院醫師 毛畯台. 下背痛常見原因 軟組織受傷/背部筋膜發炎 椎間盤突出症 脊椎退化性關節炎 壓迫性骨折 椎間盤滑脫 惡性腫瘤 泌尿道疾患 姿勢不良.
華德學校上午校 「協助小學中國語文科教師建立專業學習型社群」計劃 (2008) 總結分享會 二零零九年一月十日.
園藝二乙 1 號 丁楷儒 32 號 孫子恩. 1. 福山萵苣 ( 大陸妹 ) : 福山萵苣,萵苣家族成員之一,鮮甜脆綠又帶有萵苣類的 特殊苦味,用來代替生菜搭配烤肉也別具風味。極少病蟲 害,只需定時澆水施肥就能健康長大,是相當容易種植又 能有大收穫的蔬菜 。 感想: 雖然大陸妹好吃又好種,但種了太多而吃不完.
第五单元 口语交际和作文.
工业财务状况表 财务部分培训 (2010年年报).
性教育教學模組設計 主題:身體自主權 台中市忠明國小 巫偉鈴.
从生命伦理学角度 对转基因食品市场准入标准及道德评价标准的研究
整体销售方案 中山市美好物业代理有限公司
北京市工作居住证办理讲解.
热爱党、热爱祖国、热爱人民 泉州九中初二年(10)班主题班会.
实际问题与一元二次方程(一).
臺中市頭家國小 生理衛生講座 青春期的奧秘 ‧說到青春期,你會想到? ‧班級表現最好的,有獎徵答有優先權。 葉孟娟老師、黃文玲老師.
近期国内景区安全事故.
学风建设- 班级-我 ERP 班.
审题与立意 夏邑高中高四语文组.
XXX分析室组长竞聘 演讲人: XXX
语言文字运用知识讲座 安徽师范大学附属中学 张祥云.
述职报告 ( 二○○七年度 ) 述职人: xxx 部 门: 计划财务部 岗 位: 部门经理.
转正述职报告 电商文案策划 XXX.
护患沟通技巧 护理部 马红云.
第五单元 群星闪耀 复法指导 阅读与欣赏 单元重点 1.了解传记文的基本体例与特征。
思想道德修养与法律基础 主讲人:XXX.
如何打造学习型团队 主讲:詹琼然 选送单位:重庆市长寿区妇幼保健院 0903NX《中国医院内训师高级研修班》学员.
特种设备安全法简介 中原油田分公司 杜习广 2015年4月 视频.
马街乡综治维稳工作情况汇报 汇报人:xxx.
1. 民主社會裡,公民的參與有其重要性,而透過政治參與無法達成下列哪一項目的?
通病文章 休 闲   今天天气真好,晴空万里,天上飘着朵朵白云。(偶可从没见过这样的情景^_^)我和同学小刚一起骑车去上学,突然他的车气门芯坏了,我就把我车上的拔下来给他装上,我俩继续一起高高兴兴地骑车往学校赶。(原来“我”的自行车可以不用气门芯啊^_^)   我们经过一家百货商店时,我不禁感慨道:啊!看来人民生活水平的确提高了,你看那位农民老大爷,左手一台电冰箱,右手一台电视机,一溜小跑回家去了。(比周星弛在《功夫》里还要厉害?!)都说一心不能二用,当我注视老大爷的时候,冷不丁岔道里冲出来一位老太太,说
科學與科技課程 教師分享會 二OO四年五月七日.
Chapter 12 圖形結構 12.1 圖形的一些專有名詞 12.2 圖形資料結構表示法 12.3 圖形追蹤 12.4 擴展樹
应如何深化普通高中学生综合素质评价 北京教科院基础教育研究所 赵学勤 2010、12、14-15.
資料結構與C++程式設計進階 資料結構概論 講師:林業峻 CSIE, NTU 6/ 7, 2010.
Minimum Spanning Trees
Jiahui Jing +*, Samamon Khemmarat *, Lixin Gao *, Junzhou Luo +
Chap5 Graph.
樹狀結構 陳怡芬 2018/11/16 北一女中資訊專題研究.
Chapter 6 Graph Chang Chi-Chung
Graph 2 Michael Tsai 2012/5/1 連載: 學生上課睡覺姿勢大全
Journal of High Speed Networks 15(2006)
Top-k search的实现技术 邵菲 MF /12/25.
ZEEV ZEITIN Delft University of Technology, Netherlands
七年级下册第二单元 爱国诗文 土地的誓言 端木蕻良.
2.3.1 导向传输媒体 双绞线 同轴电缆 光缆 屏蔽双绞线 STP (Shielded Twisted Pair)
樹 2 Michael Tsai 2013/3/26.
Advisor : Prof. Frank Y.S. Lin Presented by Yen-Yi, Hsu
Version Control System Based DSNs
計算機程式 授課教師:廖婉君教授 第六單元 Arrays
Hashing Michael Tsai 2013/06/04.
圖論的介紹 第二組 徐榮德 鄭又齊 陳俊嘉.
生成树.
BiCuts: A fast packet classification algorithm using bit-level cutting
鄧姚文 資料結構 第八章:圖(Graph) 鄧姚文
Efficient Query Relaxation for Complex Relationship Search on Graph Data 李舒馨
唐常杰 四川大学计算机学院 计算机科学技术系
赵才荣 同济大学,电子与信息工程学院,智信馆410室
整合線上軟體開發工具、線上廣播與加密技術之軟體工程線上考試系統
Hashing Michael Tsai 2017/4/25.
第六章 类属B树索引技术 对基于树的索引方法给出一种通用算法。该算法是建立在类属B树的概念之上开发的。它将类型系统开放,使系统能支持用户自定义的数据类型、函数和某些特殊的查询谓词的集合。并且,将新的数据类型、函数、查询谓词等登记到数据库管理系统中,
進貨管理介接更動 有關「匯入進貨資料」傳,請注意「上游業者出貨單號」,上游業者出貨單號要配合「匯出上游出貨資料」中的「出貨單號」或是「自有系統上傳的出貨單號」。 Ø  若「自有系統上傳的出貨單號」有值,則「匯入進貨資料」中的「上游業者出貨單號」就要key入「匯出上游出貨資料」中的「自有系統上傳的出貨單號」。
第六章 样本及抽样分布 §2 抽样分布 4) 正态总体的样本均值与样本方差的分布: 定理1.
厉害了,我的国! 15会计2班团支部 2018年4月20日.
以碎形正交基底和時間情境圖為基礎進行之視訊檢索 Video retrieval based on fractal orthogonal bases and temporal graph 阿凡達 研究生:張敏倫 指導教授:蔣依吾博士 國立中山大學資訊工程學系.
Advanced Competitive Programming
Graph 1 Michael Tsai 2012/4/24 連載: 學生上課睡覺姿勢大全
JAVA 程式設計與資料結構 第十七章 Tree.
JAVA 程式設計與資料結構 第二十一章 Graph.
Presentation transcript:

Large-Scale Malware Indexing Using Function-Call Graphs 3/15 黃瀚嶙 今天我要報告的xxx

REFERENCES Large-Scale Malware Indexing Using Function-Call Graphs Xin Hu ,Kang G. Shin, Tzi-cker Chiueh, CCS’09 這篇論文選自ccs2009

Outline Introduction Function-Call Graph Extraction Graph-Similarity Metric Multi-Resolution Indexing Evaluation Conclusion 這是我今天的outline

Introduction SMIT:Symantec Malware Indexing Tree 作者在這篇paper裡面介紹了一種xxx 以往病毒分析主要是以signature 或者病毒行為分析為主 不過面對大量的新型病毒signature base的方式難以辨別變種 而病毒行為分析則消耗過多的人力 因為作者在這邊提出了一個方法在smit 這個架構我在後面講

Function-Call Graph Extraction Definition (Function-Call Graph): g = (Vg,Eg, Ig,Lg), -Vg:function -Eg:directed edge -Ig:symbolic function name, mnemonic sequence and CRC value -Lg:labeling function from Vg->Ig 作者在這邊用一個叫function call graph的方式來對病毒做特徵化 這個方法跟base差別的地方在於他不是比較bit而是 把malware的code轉換成一張圖 下面有個g的一張directed graph用來表示作者設計的圖 他分別包函四個元素分別是function directed edge labeling function symbolic function

Function-Call Graph Extraction 這邊是一個簡單的範例 用來講解在labeling裡面element他的組成 作者認為變種的病毒會有相同的sequence所以他會透過一個轉換 而crc是用來做快速比較查循所使用

Graph-Similarity Metric -Graph Edit Distance Vertex-edit operations -σR : relabel a vertex -σIV :insert an isolated vertex -σRV :remove an isolated vertex Edge-edit operations -σIE :insert an edge -σRE : remove an edge 因為作者是使用graph的方式用來表示一個malware 所以作者在這邊提出一個用來計算兩個graph之間的距離的方法 分成對點和對邊的operation

Graph-Similarity Metric -Graph Edit Distance edit path Pg,h:if Pg,h = (σ1, σ2, . . . , σn) then h =σn(σn-1(. . . σ1(g) . . . )) Cost :C(P)=sum of path cost edit distance:ed(g,h) =min c(Pg,h). 而兩個graph之間的距離就用下面這個function表示 假設g經過一連串的操做會跟h相等 那他們之間的一連串的操作就是他們之間的距離 這五種不同的operation在這邊計算沒有附加權重一律相等

Multi-Resolution Indexing 因為圖邊間彼此的比較cost很大而且病毒數量眾多不可能一一比對 所以作者提出一個indexing的方式分上下兩層 分別是上層的b+ tree以及下層的vpt

Multi-Resolution Indexing -B+-tree Index feature vector v = (Ni,Nf,Nx,Nm) Ni :total number of instructions Nf :total number of functions Nx :total number of control transfer instructions Nm :median number of instructions per function 上層的b+ tree是以上面四種feature當成key來查找 作者在這邊有一個假設說類似的malware 彼此之間instrnction數目不會有太大的差距 這四種feature是以ni權重最大然後慢慢遞減

Multi-Resolution Indexing -B+-tree Index 那這是統計過後得到的結果可以看的出來最大最小值相差極大 是一個很適合做indexing的feature 不過最小值為1 or 0是因為做脫殼的動作失敗 或是malware反分析的一些機制有發動

Multi-Resolution Indexing -Optimistic Vantage Point Tree query graph g, KNN search of a VPT with a root pivot p Prune:high[i] < d(p, q) − δnow or low[i] > d(p, q) + δnow 那講到下層 Ovpt是下層的結構 當graph search達到下層則會使用knn來做分類查找的動作 不過這樣cost還是過大 所以vpt他會切割成許多均等的片段 然後使用一個threhold now來去除不必要的片段

Evaluation 1 最後是效能上的分析 這邊的n的前面n的疊代的次數 因為有時候會發生片段過小沒辦法找到k個值所以就會增加threshold 來改善這種情礦 K則是knn設定的值 這邊可以看到他的成功機率可以到達到九成還蠻高的所以作者認為可以用此方式 做以後病毒分類的方法

Evaluation 1 雖然準確率很高 但是所花的時間也是一個重要的考量 基本上做搜尋的動作都在100S以下 雖然一定不可能比signature的方式快 不過可以把時間限制在100秒以下應該已經足夠 用來分類病毒

Conclusion Contributions -efficient graph-distance computation algorithm -multi-resolution indexing -performance 最後這篇paper的貢獻 他想出了一個新的方式做病毒分類 還有一個indexing的架構 在最後他有九成的機率分類 以及所需時間100S以下 那我今天就報告到這邊有什麼問題嗎