關於統計,就好像路燈之於醉漢一樣____支持的效果遠大於照明的效果。 機率、統計╴好用的數學工具 關於統計,就好像路燈之於醉漢一樣____支持的效果遠大於照明的效果。
基本知識 如果想要了解選擇權實際上的運作方式, 或者想要發展出有利可圖的策略, 那麼統計和機率可以說是一定要具備的基 本知識。
探索單一數量變數分布的策略 先把數據畫出來:通常是畫直方圖。 有時觀測值數量多時,整體型態會顯示出某種規律,即可以用平滑曲線來描述。
根據經驗各種實驗或測量的誤差、我們所生產的各種產品之特性(例如長度、重量)之變化、生物特性(例如:身高、體重)的分佈及特徵…等,常趨近於常態分布。
密 度 曲 線 我們利用曲線底下的面積來表示落在該區的觀測值的比例(proportion)。 為了做到這點,我們會選擇適當的尺度(scale),使得曲線底下的總面積恰恰是 1。 我們因此會得到一個密度曲線(density curve),又稱機率密度函數(probability density function) 。
一些數學代數符號 x1+x2+x3+x4= ∑ xi 平均(average)__一組資料的中心趨勢
算數平均數 所有觀察值的總和除以觀察值的個數即為算術平均數。 母體平均數 樣本平均數 其中N是個數,Xi是第i個分數, 是相加。 是母體平均數,讀作/mu/。 讀作/X bar/
算數平均數特性 資料的平衡點 優點 考慮到每一個觀察值 缺點 易受離群值(outlier)的影響
幾何平均數 是相乘的意思;某個數的次方,就是開N 次方
算數平均≧幾何平均 當在計算報酬率時,使用的數值是百分比,若一家公司的三年營收成長率分別是3%,5%以及7%時,若您用算數平均數(5%)來計算該公司的成長率,會高估了該公司在三年後的營收。 意即: 1 x 1.05 x 1.05 x 1.05 > 1 x 1.03 x 1.05 x 1.07 而使用幾何平均數時(約等於4.9873%)就不會有此問題: 1 x 1.049873 x 1.049873 x 1.049873 = 1 x 1.03 x 1.05 x 1.07 因此在計算報酬率時我們會使用幾何平均數。
中心趨勢的測量方式 算數平均 μ = ∑ xi / n 幾何平均 G = ( ∏ xi ) 中位數 不受離群值的影響 眾數 1/n
平均數=總合/總數 中位數=將數字由小排到大,若數列為偶數則取一 半及一半加一之和的一半≡ ,若數列為奇數就是中間那一個 眾數=出現最多的數字
例1 : 一數列 2. 3. 3. 4. 5. 5. 6. 9 則平均數、中位數及眾數是多少? 解答: 平均數為=(2+3+3+4+5+5+6+9)/8=4.625 中位數=8/2=4 ( 第四個數+第5個數)/2 (4+5)/2=4.5 眾數=3和5
例2 :投擲兩顆骰子30次, 出現的次數及點數和的分布如下: 點數和的眾數及中位數是多少? 點數 2 3 4 5 6 7 8 9 10 11 12 次數 1
平 均 數 密度曲線的平均數是平衡點
中位數 一個密度曲線的中位數就是等面積點,也就是曲線底下的一半面積在它的左邊,另一半在它右邊的那個點。
眾數 眾數是指觀察值中其出現次數最多的那一個數值
密度曲線的眾數是尖峰點,中位數是等面積點 中位數和眾數 密度曲線的眾數是尖峰點,中位數是等面積點
偏態(skewness)
正偏態-右偏 偏斜曲線的平均數會離開中位數,被拉向長尾方向。 眾數 中位數 平均數
The Long Tail Long Tail 長尾理論─打破80/20法則的新經濟學 Traditionally, they used to focus on the left side of the graph, e.g. they tried to sell high priced advertising deals to a few customers. Google and other companies started to focus on low priced high volume deals. That is, the sales action shifts to the long tail (the right side of the graph.)
負偏態-左偏
峰度(kurtosis)
峰度 K> 3: 高峽峰 K=3:常態 K<3:低闊峰
變異性(variability) 變異性可以用來了解當用平均值來描述一組分布是否恰當。 “如果一個人睡覺時把頭放在烤箱,把腳放進冰箱___那麼「平均」來說他應該是很舒服。” 均方根差σ, 即「標準差」 方差σ ,變異數(variance) 2
變異數(variance) 每個觀察值減去母體平均數(即離均差),加以平方,然後加總,最後除以個數
標準差(Standard Deviation) 全部資料與算術平均數的平均距離 變異數的平方根
經驗法則 若資料為鐘形分配,則有68%的觀察值落在一個標準差內,有95%的觀察值落在兩個標準差內,有99%的觀察值落在三個標準差內。 σ
機率 機率論之起源據說是由於投骰子,卡片,錢幣等之賭博遊戲之流行及保險之發生而產生。賭博的歷史源遠流長,幾乎自人類文明之始就有了。人類的天性是好賭的,由於相信一切機會、命運皆為上天所掌控,當有爭執或遇到難以決定的事,往往以抽籤決定。中國古代藉卜卦,西方藉投擲獸骨以對未來做一些預測。現今台灣廟裡擲筊杯,西方的藉樸克牌算命,皆仍有賭的意味....
骰子的發明和由來 相傳骰子為曹植所發明,曹植所造的骰子當時用玉製成,後改用骨制。變五木為兩骰,立方體,其六面刻點,點數從一到六。所以又叫“雙六”。 到了唐代(七世紀),骰子成為一種獨立的博具。並且由兩個骰子變為六個骰子。據《西墅記》所載,唐明皇與楊貴妃擲骰子戲娛,唐明皇的戰況不佳,只有讓六個骰子中的兩個骰子同時出現"四"才能轉敗為勝。於是唐明皇一面舉骰投擲,一面連呼"重四" 。骰子停定,正好重四。唐明皇大悅,命令高力士將骰子的四點塗為紅色,因此直到今天,骰子的么、四兩面為紅色,其餘四面都是黑色。
機率的理論 機率的理論誕生於十七世紀法國巴黎的賭場。Chevalier de Mere , 是一位法國貴族兼好賭成性的賭徒,當時他常在玩一種簡單機率的遊戲。遊戲是只要能用一個骰子,在四次擲骰過程中,至少丟出一次六點,就能贏得賭注。因為他相信他的勝算是 P(出現一次六) = 4×1/6=2/3=67%
他很快就厭倦了這個遊戲,他又換另一個遊戲-這次用兩個骰子,在24次擲骰過程中,至少有ㄧ次能丟出兩個六,就能贏得賭注。 P(出現一次兩個六) = 24×1/36=2/3=67% 當他開始在第二個遊戲失去穩定的勝利時,de Mere 便找上帕斯卡(Pascal),以及費馬(Fermat)一起合作解決這個問題。
機率學習館
機率的定義 通常以在多次重覆實驗後,一事件出現的頻率來表示機率。 例如給定一賽局(game)為投擲一骰子一次,則樣本空間S={1,2,3,4,5,6},而出現奇數的事件 A={1,3,5}。則我們定義A之機率為P = n(A) / n(S) ,其中n(A) 表示A中不同元素的個數,n(S) 表示S中不同元素的個數。 以丟骰子為例,會得到一奇數的機率為3/6=1/2
另一種定義 古典的模式不夠一般性,因為它無法用來描述一有無限可能性的結果的實驗。由於並非只考慮一次實驗的結果,而是關於一數列條件相同下之實驗結果。因此,若以頻率的角度來定義機率,可以下列方式定義之。 一實驗實行 n次,若出現 事件A之次數為n(A) ,當實驗次數 趨近於無限時,該事件A 發生的比例,即定義為事件A發生的機率。
機率之性質 由拉普拉斯(Laplace)定義的古典機率,我們可以直接得到下列的性質﹔ 1. P( ϕ ) = 0, P( S ) = 1 2. 若A ⊂ S, 0 ≤ P(A) ≤1 3. 餘事件機率,若A ⊂ S為一事件,則P(A )=1−P(A) 4. 機率的加法性:若A, B 為S中的二事件, 則 P(A∪B) =P(A) +P(B) -P(A∩B) 5. 機率的單調性 : 若A, B 為S 中的二事件,且A ⊂ B ,則 P(A) ≤P(B) c
de Mere 擲骰問題 先計算一個骰子在連續四次中都沒有丟出六點的機率,然後用1減去該機率: P(出現一次六) = 1- (5/6) = 51.8% 這個略超過對手的優勢讓他在第一個遊戲中獲得穩定勝利(50%的機率才是公平的遊戲),同樣地,第二個遊戲的機率如下: 4
這說明了為什麼 de Mere 在第二個遊戲會輸的原因。 P(出現一次兩個六) = 1- (35/36) = 49.1% 這說明了為什麼 de Mere 在第二個遊戲會輸的原因。 24
機率的規則 兩個事件如果被稱為獨立(independent),就表示其中一個事件的發生(或不發生)對另一個事件完全沒有影響。 乘法規則:若A和B是獨立的,則 P(A且B)=P(A) × P(B)
機率例題 例題1:[骰子問題] 取兩枚公正的骰子,連擲3次,則每次所出現點數總和均大於或等於8之機率為何? 解答: 例題1:[骰子問題] 取兩枚公正的骰子,連擲3次,則每次所出現點數總和均大於或等於8之機率為何? 解答: 先討論投擲1次的情形﹔ 點數和 =8 ,則骰子的點數為: (2,6)(3,5)(4,4)(5,3)(2,6)共5種情形。 點數和 =9 ,則骰子的點數為: (3,6)(4,5)(5,4)(6,3)共4種情形。 點數和 =10 ,則骰子的點數為: (4,6)(5,5)(6,4)共3種情形。 點數和 =11 ,則骰子的點數為: (5,6)(6,5)共2種情形。 點數和 =12 ,則骰子的點數為: (6,6)僅1種情形。 所以投擲1次而出現點數總和大於或等於8的機率為 所以投擲3次的機率為 。
例題2:[取物問題] 有一箱子裡面裝有6顆白球,5顆黑球。若從箱子內"隨機取出"兩顆球,則取到一白球及一黑球的機率為多少? 解答: 若取球的先後次序有關,則樣本空間共有 11 x 10 = 110 個點。 又第一次取到白球而第二次取到黑球的情形有 6 x 5 = 30 種,同樣的算法,第一次取到黑球而第二次取到白球的情形亦有 6 x 5 = 30 種。因此,若假設“隨機取出”的意思是指樣本空間110個點中每一點發生的機會均等,則可得所求 的機率為
機率習題 習題1. 某俱樂部發出二十張彩票,其中三張可中獎。甲搶先拿了十張,乙拿剩下的十張。下列何者是錯的: (A) 甲中獎的機會比乙大。 習題1. 某俱樂部發出二十張彩票,其中三張可中獎。甲搶先拿了十張,乙拿剩下的十張。下列何者是錯的: (A) 甲中獎的機會比乙大。 (B) 甲中獎的機會和乙一樣。 (C) 每張彩票中獎的機率是3/20 。 (D) 甲中獎的機率比 1/2 大。 解答
進階-排列組合 乘法原理 完全相異物直線排列 重複排列 相異物組合 重複組合 排容原理
乘法原理 在說明乘法原理之前,我們首先考慮下面的問題: 假設某餐廳備有肉 4 種,魚 3 種,蔬菜 5 種,有位客人預計各點一種肉、魚、和蔬菜,問他可有 幾種點菜的方法? 原理: 如果完成某件事可依序分成k個步驟,而第j(j=1,2, …k)個步驟有mj種方法可以完成它, 那麼完成這件事的方法共有 m1×m2。。。×mk 種。
完全相異物直線排列 甲、乙和丙三人排成一列,想知道有多少種可能的排法,我們可以將所有的排列一一列舉出來,共有 甲 乙 丙 甲 丙 乙 甲 乙 丙 甲 丙 乙 乙 甲 丙 乙 丙 甲 丙 甲 乙 丙 乙 甲
完全相異物直線排列 現考慮較一般的情況,假設有n個不同的事物,將它們排成一列,會有幾種不同的排法呢? 仿照上面的討論方式,我們將排列的位置予以編號分別為1,2,…,n,並按編號依序選擇放置的事物,則 1 從n個不同的事物中,選一個放入編號1的位置,共有n種選法。 2 從剩下的n-1個不同的事物中,選擇一個放入編號2的位置共有n-1種選法。 ……….
n-1 從剩下的 2 個不同事物中,選擇一個放入編號n-1的位置,共有 2 種選法。 因此由乘法原理可知排列數共有 n × (n-1) ×…. × 2 × 1 種。 因此為了使用上的方便我們將n的連乘積叫作n的階乘,並以符號 n!表示。
排列(Permutation) 將 n 個不同的物品排列有 n! 排法。(需考慮先後次序) 想法: n n-1 2 1 例如甲、乙和丙三人的排列方式有 3!=6 種排法。
最後,我們考慮更一般的情況,假設有n個不同的事物,從其中任取m個 (m < n) 排成一列,會有幾種不同的排法呢 最後,我們考慮更一般的情況,假設有n個不同的事物,從其中任取m個 (m < n) 排成一列,會有幾種不同的排法呢? 同樣地,我們將排列的位置編號,分別為1,2…,m , 並按編號依序選擇放置的事物,則 1 從n個不同的事物中,選一個放入編號1的位置,共有n種選法。 2 從剩下的n-1個不同的事物中,選擇一個放入編號2的位置共有n-1種選法。 ………. m 從剩下的n-(m-1)個不同事物中,選擇一個放入編號m的位置,共有n-(m-1)種選法。
由乘法原理可知排列數共有 n × (n-1) ×…. × (n-m+1)種。 我們以符號P(n,m)表示從n個不同事物中,任取m個排成一列的排列數,即 P(n,m) = n× (n-1) ×…. ×(n-m+1) 。 P(n,m) = n!/(n-m)!, 0!=1 稱為n中取m直線的排列
習題 習題1. 有 2 男生及 5 女生要排成一列,若 2 男生不相鄰,請問有幾種排法? 習題1. 有 2 男生及 5 女生要排成一列,若 2 男生不相鄰,請問有幾種排法? 習題2. 自 0, 1, 2, 3, 4, 5 中取三個數字排成三位數 (1) 數字不可重複,有多少不同的三位數? (2) 數字不可重複,有多少不同的三位數是奇數?
重複排列 由n個不同的事物中,可以重複選取地任選m個,排成一列, 稱為n中取m的重複排列。我們先看下面的問題: 問題1. 由 1,2,3,4,5,6,7,8,9 九個數字所構成的三位數有多少個? 其中數字可以重複出現。 由乘法原理可知,共有9 × 9 × 9 = 9 = 729種不同的三位數 3
重複排列 定理:由n個不同的事物中,可以重複選取地任選m個,排成一列之n中取m重複排列數為n 。 習題1. 有 5 件獎品要分給 7 個人,每人可拿超過一件,試問共有幾種方法? m
組合(Combination) P(n,r)/r!= n!/(n-r)!r!= C(n,r)
排列與組合的差別 C(n,r) = P(n,r)/r!
舉例說明_組合 在日常生活中我們時常會考慮,從不同的東西中要選出其中幾個到底有多少種選法,先看一個簡單的例子: 在日常生活中我們時常會考慮,從不同的東西中要選出其中幾個到底有多少種選法,先看一個簡單的例子: 例題:若要從 A,B,C,D,E 五個人之中不考慮次序選出三個人作為一組,參加三對三籃球賽, 將會有多少種選法?
例題:若要從 A,B,C,D,E 五個人之中不考慮次序選出三個人作為一組,參加三對三籃球賽, 將會有多少種選法? 分析:從此 5 個人當中選 3 個人出來排列,若考慮選擇的次序,則共有 P(5,3) = 5!/(5-3)! =5 × 4 × 3 = 60
由於固定的 3 個人,其直線排列數為3!=6。例如 A,B,C 三人的直線排列有 (A,B,C),(A,C,B),(B,A,C),(B,C,A),(C,A,B),(C,B,A) 6 種,而這 6 種排列皆為同一種選法,因此選法共有P(5,3) /3! = 60 / 6 =10種。 C(5,3) = P(5,3)/3!= 5!/(5-3)!3!
事實上,我們可以將所有可能的情形列出來,分別是 (A,B,C),(A,B,D),(A,B,E),(A,C,D),(A,C,E), (A,D,E),(B,C,D),(B,C,E),(B,D,E),(C,D,E) 等 10 種情形。
C(n,m) 現考慮一般的情形,從 n個不同物件中,不重複且不計其前後次序取 m個 物件為一組,稱作 n中取 m的組合。其中的每一種可能結果稱為一種組合。我們以符號C(n,m)表示所有組合的總數(簡稱組合數)。 由上面的例子可以知道,n個不同物件中取m個的組合數,可以分成兩個步驟來求: (i)先從n個中選取m個出來作直線排列,其排列數為P(n,m)。 (ii)由於對固定的m個物件,其直線排列數m!為所以P(n,m)排列中,每m!皆為同一種組合。
C(n,m) C(n,r) =P(n,m)/m!= n!/(n-m)!/m! (0 < m < n)
C(n,m) 例題:大樂透的中獎方式為由{1,2,..,49},此49個數字中以隨機方式取出六個數字(不投返),若某人的彩券號碼與此六個數字一樣則中獎。則某人中獎的機率約為 — 一千四百萬分之一 1/C(49,6)=1/13983816 ≈ 1.4x10 -7
所以所謂包牌(保證一定中) ,就是全餐... 大樂透全餐為 1400萬x 50元 = 7億元 就算獎金累積超過7億元,其實全餐還是有風險→因為當頭獎不只一人時,就恐怕會賠錢。
彩迷集資56萬包牌 搏威彩六億 選八個號碼包牌,共有廿八組合(即二十八注),一張二千八百元, C(8,6) x 50 = 28 x 50
七個號碼取六個號碼C(7,6) (7x6x5x4x3x2)/(6x5x4x3x2x1) = 7 <====7注$350 ……………………………….. 12個號碼取六個號碼C(12,6) (12x11x10x9x8x7)/(6x5x4x3x2x1) = 924<==924注$46200
7員工合資中樂透 樂昏不上班
習題 習題1. 同花色的 13 張撲克牌中,若把 J,Q,K,A 等四張表示的牌稱為大牌,試求自此13 張牌中任意抽出3張,其中恰含有二張大牌的組合數? 解答
重複組合 由n類相異物中,任取r個為一組,其中每類物品的個數均不小於r且可重複選取,則稱此種組合為n中取r之重複組合,其組合數以H(n,r) 表之。 問題1:假設紅、藍、白三種顏色的球均超過4個,從其中取4個球,試問其可能的取法數 為多少? 問題2:X1+X2+X3+X4 =4有幾組非負整數解?
H(n,r) 可將所有可能的解一一列舉出來,即為:(4,0,0), (0,4,0), …… (1,3,0),….. 共 15 種。 可將所有可能的解一一列舉出來,即為:(4,0,0), (0,4,0), …… (1,3,0),….. 共 15 種。 定理:H(n,r)=C(r+n-1,n-1) 例題2. 同時擲2個相同且公正的骰子,有幾種不同的花色(結果)? 解答:H(6,2)=C(7,5)=21
排容原理 問題一:試問 1 至 120 中,4 或 6 的倍數有幾個? 首先求出 1 至 120 中 4 的倍數之個數,易知其共120/4=30個。其次我們再求出6的倍數之個數,共有120/6=20個,但此時我們將同時是 4 及 6 的倍數之個數算了兩次,因此必須將他們減掉,而在 1 至 120 中,同時為 4 跟 6 的倍數的數即為 12 的倍數,故共有120/12=10個。因此,4 或 6 的倍數之個數為 30+20-10=40個。
若令A 為 1 至 120 中 4 的倍數之集合,B 為 1 至 120 中 6 的倍數之集合,則A∩B 是12 倍數之集合, A∪B為 4 或 6 的倍數之集合,從上面的問題討論中,我們可以得知 A∪B=A+B-A∩B 。 A B 例題1. 求 1~120 中,不為 4 或 6 的倍數有幾個?
樂透摃龜機率 樂透摃龜機率為97.0935%--醒醒吧!別做春秋大夢了 經試算每筆投注中獎機率如下: 猜中號碼數機率如下: 六組全中 0.000019%(仟萬分之一點九) 頭獎機率: C(6,6) /C(42,6) 猜中五組 加一特別號 貳獎機率: [C(1,1) * C(6,5)] / C(42,6) = 0.00011437% 猜中五組 0.0041%(佰萬分之四點一) 參獎機率: [C(36,1) *C(6,5)] / C(42,6) 猜中四組 0.1819% 肆獎機率: [C(36,2) * C(6,4)] / C(42,6) = 0.1801% 猜中三組 2.7222% 普獎機率: [C(36,3) * C(6,3)] / C(42,6) = 2.722185% 猜中二組16.8435% [C(36,4) * C(6,2)] / C(42,6) 猜中一組43.1194% [C(36,5) * C(6,1)] / C(42,6) 全部摃龜37.1306% C(36,6) / C(42,6) 猜中三組號碼以上才有獎金,猜中三組獎金200元