資料探勘應用於英雄聯盟(League of Legends)匹配系統可能性之研究 報告者:洪偉庭
Outline 1.研究動機 2. 運用資料探勘技術於職棒比賽勝負預測之研究-以美國職棒大聯盟為例 3. 回歸模型與分群演算法 4. 資料探勘如何應用於匹配系統
研究動機 遊戲概況: 總共有「3250萬玩家」登入LOL的帳號。 每個月共有1150萬玩家上線;每天有420萬玩家瘋狂練功; 同一時間最高紀錄,有130萬人在線上。 後面皆簡稱LOL 天梯系統
排位人數曲線 人數比例 銅牌:34.49% 銀牌:40.41% 金牌:16.61% 白金:6.56% 鑽石:1.92% 菁英:0.01%
Team1: 3菁英1鑽石 1沒牌(銀牌) vs. Team2: 1鑽石3銀牌 1沒牌(銀牌) 人數比例 銅牌:34.49% 銀牌:40.41% 金牌:16.61% 白金:6.56% 鑽石:1.92% 菁英:0.01%
運用資料探勘技術於職棒比賽勝負預測之研究-以美國職棒大聯盟為例 作者:馮瑞祥, 黃謙順 出處:2013年 文化大學資管系碩士論文
使用已知的數據,來尋找有價值的球員
回歸模型與分群 資料探勘 的『迴歸分析 (Regression Analysis)』技術,簡單的說是一種利用建立變數關係的數學方程式來處理問題的統計分析程序。而在方程式 中所建立的變數,實務應用上可區分為兩種: (1)、因變數 (Independent Variables):因變數是一種由數學方程式建立用來預測的變數。 (2)、自變數 (Dependent Variables):則是指在數學方程式中用來預測因變數之值的變數。 『迴歸分析』即是使用建立因變數為自變數之函數模型,其主要目的是用來解釋資料過去的現象及自由變數來預測因變數未來可能產生之數值。 回歸分析最常運用的有下列四種: 1.一元線性迴歸運算(Simple Regression) 2.多元線性迴歸運算(Multiple Regression) 3.卜瓦松迴歸(Poisson Regression) 4.邏輯斯迴歸(Logistic Regression)
相依變數是 1 月份的暖氣花費,用 Y 表示。此外,有三個獨立變數: 平均室外溫度,用 X1 表示。 屋頂天花板厚度,用 X2 表示。 暖爐使用年數,用 X3 表示。 用 來估計 Y。具有三個獨立變數之複迴歸方程式的一般式為:
複迴歸方程式的估計式為 假若知道平均室外溫度、屋頂天花板厚度、以及暖爐使用年數,則我們就可以預估暖氣花費。舉例說明,如果平均室外溫度是 30 度(X1),屋頂天花板厚度是 5 英吋(X2),暖爐使用年數是 10 年(X3),把這些值代入上式的獨立變數中而得到:
分群 (Clustering) 是將一組資料依據某種距離的量度將其分割成若干群。
K-Means algorithm Object X Y 1 22 60 2 40 25 3 30 4 64 66 5 80 6 82 55 利用曼哈頓距離公式分成兩群,初始群心為 1和3 Object X Y 1 22 60 2 40 25 3 30 4 64 66 5 80 6 82 55 D(1,2)=|22-40| /60+|60-25|/41=0.3+0.85=1.15 D(1,4)=|64-22| /60+|66-60|/41=0.7+0.15=0.85 D(1,5)=|80-22| /60+|30-60|/41=0.967+0.73=1.6984 D(1,6)=|82-22| /60+|55-60|/41=1+0.122=1.122 D(2,3)=|60-40| /60+|30-25|/41=0.33+0.122=0.453 D(3,4)=|64-60| /60+|66-30|/41=0.067+0.88=0.9447 D(3,5)=|80-60| /60+|30-30|/41=0.33+0=0.33 D(3,6)=|82-60| /60+|55-30|/41=0.367+0.61=0.9764
令新群中心為d=(43,63) ,d1=(65.5,35) D(d,1)=|43-22| /60+|63-60|/41=0.423 D(d,2)=|43-40| /60+|63-25|/41=0.977 D(d,3)=|43-60| /60+|63-30|/41=1.088 D(d,4)=|43-64| /60+|63-66|/41=0.423 D(d,5)=|43-80| /60+|63-30|/41=1.42 D(d,6)=|43-82| /60+|63-55|/41=0.845 D(d1,1)=|65.5-60| /60+|35-60|/41=1.335 D(d1,2)=|65.5-25| /60+|35-25|/41=0.669 D(d1,3)=|65.5-30| /60+|35-30|/41=0.2136 D(d1,4)=|65.5-66| /60+|35-66|/41=0.7811 D(d1,5)=|65.5-30| /60+|35-30|/41=0.3636 D(d1,6)=|65.5-55| /60+|35-55|/41=0.7628 因為中心點不變,所以分為的2群為: 群1:{1,4} 群2:{2,3,5,6}
資料探勘如何應用於匹配系統 配對系統 配對系統的主要原理就是,每個玩家都具有隱藏的「配對等級」,簡稱為MMR(Match-making Rating),這是決定配對系統所有事情的唯一因素。MMR會決定你的對手是誰,或者你將要升級還是降級。 在匹配系統中會將玩家自動配對到很強的隊伍,假如你的MMR很高,你會一直對戰很強的人,直到你的勝率降到50%。所以這樣MMR會一直掉到適合你的位置,當你的勝率接近50%時,MMR也就穩定下來了。 連勝或連敗會影響MMR:當系統確認你已經在一個穩定的MMR位置,連續輸不會使你的MMR狂降,而連勝還是會使你MMR上升較快
對於LOL配對系統玩家常有的疑問: 為什麼在遊戲中遇到的隊友和我相比技術都有很大差距? A:我們在之前對的玩家行為解讀中就已經說了。然而,當伺服器的玩家數量較少,比如在比較冷門的時間或是非常極端的MMR水準下,匹配系統將放棄一些精度來達成快速匹配。我們正在不斷地對匹配系統進行調整,來減少玩家遭遇不同水準隊友的情況發生。 我還是覺得奇怪,我這樣一個勝率平平的人,會在玩家高峰期經常性的在大亂鬥或是普通遊戲中遇到白銀/黃金/白金組的玩家,大概80%的幾率。太奇怪了? 普通遊戲的MMR值和排位賽的MMR之前有什麼聯繫麼?如果我在普通遊戲中連勝了20場,對我的排位賽MMR會產生什麼影響麼? A:關於上面的兩個問題,我將一併回答,不同佇列的MMR是獨立計算的。而你看到白銀/黃金/白金組的玩家是因為你在那個類型的遊戲中比他們做的更好。(也許這些玩家並不擅長某一類型的遊戲)
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? WTF?
LOL的一些基本欄位:勝場數, 敗場數, 殺人數, 被殺數, 助攻數, 吃兵數, 牌位 , 遊戲時間等… 實現可能性步驟: 1.利用分類演算法找出對於遊戲勝負影響較大的欄位。 2.利用回歸方程式概念合理計算玩家的MMR值 3.把實力差不多的玩家分群並標記,當多人匹配時不是以配對玩家的人數當優先條件,而是以分群和回歸結果當基準去匹配。 資料探勘應用於遊戲中的困難度: 資料運算量大,耗費時間長。
END