前陣子與內部講師討論到信賴區間(Confidence Interval)的意義是什麼?
這讓我想到, 我以前輔導的經驗. 若計算出的母體均值95%信賴區間(a 95% Confidence Interval for mean)
如果是 [3.45, 6.78], 會出現2種常見的說法:
1.)[3.45, 6.78]有95%的機會會覆蓋母體均值
2.)我們有95%信心,母體均值落在[3.45, 6.78]間
這兩種說法都是不正式的, 我們學英文除了背單子外, 就是要學文法
不懂文法, 你就說不出別人聽得懂的話
同樣的, 統計也有自己的統計語言, 你除了背統計專有名詞外
他還要會統計的語法, 不然別人還是聽不懂你想表達什麼?
上面寫的1.問題是
你都已經計算出來一個固定值的區間了, 不是覆蓋到母體均值, 就是沒覆蓋到母體均值
這是一翻兩瞪眼的事, 不是0, 就是1. 沒有什麼95%的機會會覆蓋.
至於2.的問題是
母體均值都跟你說是參數了,什麼是參數, 參數就是供您參考的數, 是個標準, 不能動的!
參數是恆定的值. 所以母體均值不可以"落"在區間裡面啦, 他又不是隨機的數值, 不可以用"落"
那要怎麼說才好?
我建議你可以這麼解讀
我們有95%的信心, 區間[3.45, 6.78]會包含母體均值.
這裡的"信心"請不要改成"機會"或"機率"
我們不是在算貝氏學派的Credible set啦
至於什麼是"信心"?
這就要先談 母體均值的95%信賴區間意思是:
每次都取n個樣本,使用這n個樣本計算一組95%信心區間. 每次固定相同的樣本數n,
重複取樣100次, 那麼我就會得到100組置信區間, 這時 95%信賴區間的意思就是
這100組信賴區間中, "約"有95次會覆蓋到真正的母體均值.
重點是在那個"約"字, 因為是機率概念, 所以是"約",而不是"剛好".
到這裡, 我們可以談甚麼是信心了!!
方才計算的95%信賴區間[3.45, 6.78], 我們可以解讀成
我們有95%的信心, 這個區間, [3.45, 6.78], 會是那95個中,覆蓋到母體均值的其中一條.
好喔~~同樣使用一張圖來做結尾吧!
使用下面我寫的R程式:
Con.Int<-function(sample.size=10,alpha=0.05,
c.v=qt(alpha/2,df=sample.size-1),average=100,SD=2,ST=10000,seed=66,PLOT=F)
{
CI<-matrix(ncol=2,nrow=ST)
i<-0
set.seed(seed)
while(1)
{
i<-i+1
Y<-rnorm(sample.size,mean=average,sd=SD)
Y.bar<-mean(Y)
SE<-sd(Y)/sqrt(sample.size)
CI[i,]<-Y.bar+c.v*SE*c(+1,-1)
if(i==ST) break
}
Result<-(CI[,1]<=average)*(average<=CI[,2])
OUTPUT<-mean(Result)
if(PLOT==T)
{
plot(c(average-5*SD/sqrt(sample.size),average+5*SD/sqrt(sample.size)),c(-5,ST+5),
type="n",ylab="95% Confidence Interval for mean",xlab="",main="")
box()
axis(1)
for(j in 1:ST)
{
if(Result[j]==1) segments(CI[j,1],j,CI[j,2],j,col=1)
if(Result[j]==0) segments(CI[j,1],j,CI[j,2],j,col=2)
}
abline(v=average,lwd=2,col=4)
title(xlab=paste("The fail rate is",round((1-OUTPUT)*100,digit=2),"%"))
title(main=paste("The Coverage Probability is",round(OUTPUT*100,digit=2),"%"))
}
OUTPUT
}
來探討95%信賴區間的意涵.
這程式是假設樣本來自服從均值與變異數分別是100與2的常態分配母體, 設定Level Alpha是5%,雙尾信賴區間
母體變異數未知, 模擬10000次的95%信賴區間, 看看是不是真的是95%
考慮的樣本數是3, 5, 10, 20, 30, 50, 100, 1000. 執行結果如下:
> Con.Int(sample.size=3)
[1] 0.9489
> Con.Int(sample.size=5)
[1] 0.9532
> Con.Int(sample.size=10)
[1] 0.9489
> Con.Int(sample.size=20)
[1] 0.9495
> Con.Int(sample.size=30)
[1] 0.9480
> Con.Int(sample.size=50)
[1] 0.9500
> Con.Int(sample.size=100)
[1] 0.9531
> Con.Int(sample.size=1000)
[1] 0.9477
看吧, 結果多漂亮. 只要用對公式, 就算是樣本只有3個,
我們還是可以很有信心說我們算出來的信賴區間可以包含母體均值的.
最後, 畫張圖來解釋信心
Con.Int(sample.size=3 ,ST=100,PLOT=T)
Y軸的數字表示共算了100組,圖中紅色憲表示沒有覆蓋到母體均值100, 結果覆蓋機率是94%, 果然是"約"吧!
所以得到數值後計算的信賴區間, 不過是這100條裡面的一條,裡面的每一條, 部是有覆蓋到(黑色線), 就是沒覆蓋到(紅色線)
而我們有95%的信心, 這次算的會是那眾多黑色線中的一條.
在看樣本數是30的圖形表現:
兩張圖有沒有發現某地方相當不同?
是的, 就是信賴區間的長度
因為30個樣本的訊息量比3個樣本的訊息量多太多了
所以相同的信心水準下, 樣本數多的敢估的較短!!
若你需要統計諮詢, 歡迎加入我們的Line ID: dougunzi2016
我們提供 輔導/家教/諮詢 服務
包含 高普考統計/研究所 統計學/論文統計諮詢...等服務
留言列表