Download presentation
Presentation is loading. Please wait.
1
《Hit FM排行榜預測》 第八組 羅偉航 李蕙宇 王中玉 蘇瑜寧 洪晨碩 簡汝芸
2
AGENDA Q&A 研究方法 研究議題 上榜預測 結論與 建議 熱歌榜 語種 分析
3
agenda 研究議題
4
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 研究議題 音樂是人類生活中不可或缺的一部份 在語言分析及機器學習的角度 我們希望可以透過分析歌手、歌詞、網友評論等面向 分析大眾對歌曲的偏好 並進行熱門程度預測 進而運用在流行音樂行銷策略
5
agenda Q&A 研究方法 研究議題 上榜預測 結論與 建議 熱歌榜 語種 分析
6
研究方法 一、爬蟲 網站:網易雲音樂 http://music.163.com/# 歌單:網易雲 云音樂飆升榜(本周)92首
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 研究方法 一、爬蟲 網站:網易雲音樂 歌單:網易雲 云音樂飆升榜(本周)92首 台灣HitFM音樂電台 年度top 100排行500首 下載內容:排名、歌曲名、歌手、歌詞、評論數、評論內容 使用工具:(RSQLite )
7
研究方法 二、分析 網易雲 云音樂飆升榜(本周) 討論:不同語種的評論內容差異 工具:R
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 研究方法 二、分析 網易雲 云音樂飆升榜(本周) 討論:不同語種的評論內容差異 工具:R 套件:(jiebaR) (data.table) (devtools) (sentR) 操作方法: 將下載歌詞、評論做斷詞。 將已斷詞之歌詞建立成獨立詞庫,用(sentR)中的rank函數,計算評論中提到歌詞內容次數,計算歌詞相關評論佔討論串的比例。 針對評論,分別用(sentR)中的rank函數比對提到歌手名稱相對次數。 肉眼觀察評論詞頻表。
8
研究方法 二、分析 台灣HitFM音樂電台2010-2015 年度top 100排行 討論:評論數與排名相關性 排名與歌手相關性
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 研究方法 二、分析 台灣HitFM音樂電台 年度top 100排行 討論:評論數與排名相關性 排名與歌手相關性 排名與評論情緒相關性 工具:大连理工大学情感词汇本体库、R 套件:(jiebaR) (data.table) 操作方法: 將 年的500首歌曲,歌詞與評論做斷詞。 利用大连理工大学情感词汇本体库計算歌詞與評論之情緒。 把各年評論數當作依變數,排命、歌手名稱、評論情緒分數當作自變數,跑用GLR回歸。 將變數兩兩成對計算相關程度。 利用有相關性之變數預測2015年排名。
9
Q&A 研究方法 研究議題 上榜預測 結論與 建議 熱歌榜 語種 分析
10
火爆曲 語種x評論分析 推測韓文歌上榜關鍵:偶像劇、歐爸、帥 韓文歌曲評論特色 1. 吶喊歌手的名字
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 火爆曲 語種x評論分析 韓文歌曲評論特色 1. 吶喊歌手的名字 2. 吶喊歌曲對應偶像劇中,主要腳色的名字 3. 吶喊著「好聽」 4. 雖然大多有翻譯歌詞,但鮮少與歌詞共鳴 歌曲類別 範例歌曲資訊 最高詞頻(有意義) 韓文歌 本周第熱播排行67名 單曲:어땠을까 会怎么样呢 歌手:金娜英 評論數:81 伯贤 推荐 好听 边 安利 过来 推測韓文歌上榜關鍵:偶像劇、歐爸、帥 當然其實仔細聽了一下唱的也是不錯啦,雖然有些歌詞真的很洗腦或不知道在幹嘛
11
火爆曲 語種x評論分析 推測日文歌上榜關鍵:歌手本人、日劇 日文歌曲評論特色 吶喊歌手的名字
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 火爆曲 語種x評論分析 日文歌曲評論特色 吶喊歌手的名字 有一些莫名其妙的段子干擾詞頻計算(中國人的特色) 引起共鳴的歌詞會被節錄 粉絲與Anti粉別吵架 歌曲類別 範例歌曲資訊 最高詞頻(有意義) 中文歌 本周第熱播排行40名 單曲:心做し 歌手:鹿乃 評論數:391 鹿乃 听歌 评论 啊 好听 唱 我的 声音 推測日文歌上榜關鍵:歌手本人、日劇 比起韓文歌,推測日文的普及率應該比較高,評論還是偶爾會共鳴一些歌詞端的東西
12
火爆曲 語種x評論分析 推測英文歌上榜關鍵:iTunes熱播榜、唱功、歌詞 英文歌曲評論特色 表情符號
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 火爆曲 語種x評論分析 英文歌曲評論特色 表情符號 有一些莫名其妙的段子干擾詞頻計算(中國人的特色) 引起共鳴的歌詞會被節錄 很多諧音梗會影響詞頻計算,如这首歌越听越直男癌 歌曲類別 範例歌曲資訊 最高詞頻(有意義) 中文歌 本周第熱播排行9名 單曲:Locked Away 歌手:R. City / Adam Levine 評論數:2476 听歌 推荐 辣么 love 歌曲 评论 爱 男癌 好听 醉了 骚 [表情符號] you 如鱼得水 推測英文歌上榜關鍵:iTunes熱播榜、唱功、歌詞 另外我們發現,竟然能出現在榜上的幾乎只有POP MUSIC,鮮少看過小眾歌曲。但曲風不再這次的分析範圍啦
13
火爆曲 語種x評論分析 推測中文歌上榜關鍵:新發片、歌唱比賽、歌手本人、歌詞共鳴、 歌手外貌、時事、八卦、戰台獨、唱功;得議題者得榜單
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 火爆曲 語種x評論分析 中文歌曲評論特色 表情符號 有一些莫名其妙的段子干擾詞頻計算(中國人的特色) 引起共鳴的歌詞會被節錄 諧音梗擾頻! 歌曲類別 範例歌曲資訊 最高詞頻(有意義) 中文歌 本周第熱播排行1名 單曲:惊天动地 歌手:金玟岐 評論數:8897 听歌 金玟岐 惊天动地 歌曲 评论 好听 燕姿 爱情 岁月神偷 打卡 惊天动地的沉默 直到眼睛,捕捉到光的缝隙。 就算坠入无边的梦魇里。波澜不惊的生命,也可以惊天动地。 惊天动地的沉默 推測中文歌上榜關鍵:新發片、歌唱比賽、歌手本人、歌詞共鳴、 歌手外貌、時事、八卦、戰台獨、唱功;得議題者得榜單
14
熱歌榜 榜單分析 熱歌榜 榜單分析 推測:洗留言、或在評論區吵架,無助於幫偶像洗榜單唷。 評論x榜單名次 相關分析
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 熱歌榜 榜單分析 熱歌榜 榜單分析 評論x榜單名次 相關分析 Y變數 X變數 相關程度 評論數 榜單名次(1-100) 無相關 評論正向情緒 評論負向情緒 評論綜合情緒 推測:洗留言、或在評論區吵架,無助於幫偶像洗榜單唷。 當然只是推測,他們沒有告訴我們名次怎麼算的
15
推測:這些常勝軍今年只要發片,應該也就會上榜了啦。
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 熱歌榜 榜單分析 歌手x榜單名次 回歸分析 Y變數 X變數 顯著程度 歌手 榜單名次(1-100) 僅特定歌手有顯著值 周杰倫 蕭敬騰 蔡依琳 王力宏 林俊杰 推測:這些常勝軍今年只要發片,應該也就會上榜了啦。
16
安室奈美惠和Celine Dion則是因為時隔多年發片才引起話題。
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 熱歌榜 榜單分析 歌手x評論數 回歸分析 Y變數 X變數 顯著程度 評論數 歌手 榜單名次 僅特定歌手有顯著值 安室奈美惠 Celine Dion 周杰倫 蔡依琳 推測:周、蔡本來就是榜單常勝軍, 安室奈美惠和Celine Dion則是因為時隔多年發片才引起話題。
17
2015年 榜單預測 結果:超級不準。 歌手x評論數 回歸分析 Y變數 X變數 2015年榜單名次(已知) 2015年上榜歌曲 對應之歌手
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 2015年 榜單預測 歌手x評論數 回歸分析 Y變數 X變數 2015年榜單名次(已知) 2015年上榜歌曲 對應之歌手 累積評論 已知: 評論數x榜單名次(1-100)無相關 評論情緒x榜單名次(1-100)無相關 歌手x榜單名次(1-100)僅少數有顯著相關 結果:超級不準。
18
Q&A 研究方法 研究議題 上榜預測 結論與 建議 熱歌榜 語種 分析
19
結論與建議 研究限制 發現問題 研究限制 影響 資料會容易有負面傾向 正向與負向詞彙語料庫豐富程度不一樣
研究議題 研究方法 語種分析 熱歌榜 榜單預測 結論與建議 結論與建議 研究限制 發現問題 研究限制 影響 資料會容易有負面傾向 正向與負向詞彙語料庫豐富程度不一樣 比如NTUSD的情緒詞庫正、負面詞庫量 就有四倍之差 後續分析無效 一些常用的諧音字無法納入情緒判斷 情緒與料庫詞彙脫離日常用語 計算之情緒值無法反映真實情緒感受 轉折語氣無法被判斷 使用情緒詞計算總分會忽略原意 代表歌曲:張惠妹 我要快樂 組員們電腦根本跑不動資料 5000比以上資料要Intel I5以上規格 中文顯示還是Mac最穩定 電腦跑不動的組員只能做投影片
20
Q&A 研究方法 研究議題 上榜預測 結論與 建議 熱歌榜 語種 分析
Similar presentations