Attitude Detection of Public issues

1 Attitude Detection of Public issues
Rita Tsao R

2 Problem Revision Dick Morris《網路民主》── 認同網路是展現民意的最佳管道。網路意見形形色色,從單純到發洩情緒的意見、踢爆事件、交換情報、閒聊的意見到時事議論都有,間接反映民意觀點。 許多新聞都是由PPT上評論而來,也許可做為一個分析公眾議題立場的較佳資料來源。 害怕情緒在yahoo心情新聞排行中多是其本身就是”令人恐懼之事件”。 搜尋可以有立場傾向新聞文章資料作為語料來源,但新聞資料效果普遍不佳, 可能是新聞資料詞彙與資訊互通度較大的關係。

3 文章心情偵測 林揚書, 柯皓仁, & 林妙聰. (2008). 網際網路新聞文章心情偵測之研究 : 指當人寫作或閱讀一篇文章,大腦思考後產生對文字敘述的認知,進而產生心理的反應,譬如喜、怒、哀、樂;有些研究著重於寫作者的心情如何反映在文字上、有些則是著重於閱讀者從文字中感受到的心情。 立場 心情 言論 Thinking

4 Comment, Sentiment & Stance
就算沒有清楚表態,言論中的遣詞用字(Linguistic cue)也能夠推測出某些傾向。 Sentiment: 強烈的表達就易伴隨情緒產生的現象,找出鮮明的情緒詞,判斷P/N。 Stance: 若Sentiment偏向P,推測此族群或許較能接受談論此議題。

5 Method Issue Key word Searching PTT corpus Sentipol/ LOPE annotator
雙向立場社會議題 多元成家 同性婚姻 伴侶制度 婚姻平權 Boy-girl Mentalk Womentalk Issue Key word Searching PTT corpus Sentipol/ LOPE annotator Result 各版P/N頻率分佈 Phenomena observation Positive/Negative words

6 Method Issue Key-word Searching in 3 boards
男女性對於「同性婚姻」法案的討論與立場。 Key-word Searching in 3 boards >>>多元成家, 同性婚姻, 伴侶制度, 婚姻平權 Sentipol: 確認發文屬性。

7  Sample 只找發文者觀點 不算回文 怕回文亂七八糟反串 信度降低

8 Elimination of data 重複資料 內文相關性低 活動網宣 無法辨識

9  Elimination of data

10 Primary data analysis Mentalk Keyword Occurrences Frequency Positive
Negative Neutral Deleted 多元成家 26 0.0055 16 4 1 5 同性婚姻 10 none 6 2 伴侶制度 3 皆為重複資料 婚姻平權 看似比mentalk多,但也都是些重覆資料。 Womentalk Keyword Occurrences Frequency Positive Negative Neutral Deleted 多元成家 同性婚姻 69 0.0766 29 3 1 36 伴侶制度 22 0.0018 7 15 婚姻平權 17 0.0073 4 12

11 Primary observation Positive > Negative both in Mentalk & Womentalk. ‧Does it mean both of man & woman accept the issue well? A great number of data are delimitated especially in Womentalk. ‧Does it mean the issue isn’t popular with women while comparing with men? Myriads of data are overlapped. ‧Does it mean only a few specific people discuss the issue?

12 Criteria for observation
Gilad Mishne 提出以Blog文章為資料,考慮了字彙頻率、文章長度、詞彙語意特徵(Kim&Hovy及Turney&Littman先前所做的研究結果)、心情的 PMI-IR值、文章強調的詞彙、特別符號等特徵來進行分類預測。

13 Question─ Is it feasible?

