【哲學S03E09】得天下者得民調,還是…? 「民調」背後的邏輯問題
上一集我們介紹了「最佳解釋推論」,解釋得最好的最有可能是真相!想知道名偵探如何用最佳解釋推論推理案情?錯過的聽眾朋友們記得回去收聽/閱讀喔!在先前的節目中,我們介紹理論比較多,今天我們要鎖定在一個很貼近生活的事件──民調(opinion poll)。
民調到底準不準?
總統大選剛結束,幾家歡樂幾家愁,你心目中的候選人有順利當選嗎?有不少媒體指出,這次選舉結果反映出大選前封關的民調大致上準確,而在選舉前各家媒體所做出的民調也成為選民關心的焦點,幾乎每隔一段時間網友就為了民調吵翻天。其實民調跟歸納推理息息相關,今天的節目就要來介紹民調背後的邏輯結構,也要告訴大家如何真正讀懂民調。
之前(https://www.mirrormedia.mg/story/20191211cul002/)我們曾介紹歸納推理中的「枚舉歸納法」,讓我們再簡單複習一次。所謂的枚舉歸納,指的是推論者從一個群體的部分成員觀察到某個特質,進而推論該群體可能也有同樣比例的成員具備那個特質。假設我遇過的基督徒有九成的人都心地善良,我可以據此歸納出:所有的基督徒可能有九成的人都是善良的人。所有的基督徒稱為「目標群體」,我所遇過的基督徒則稱為「樣本」。所謂的「民調」,便是一種枚舉歸納,從樣本推論到目標群體。例如,若有民調從1,000人的訪問結果統計出有6成的人支持蔡英文,我們便可以推出全台灣的選民應該有6成的人支持蔡英文。
歸納論證要成為可信論證需要滿足兩個條件:是「強歸納」並且有「真前提」。這兩個條件反映在民調上,便是以下兩點:從樣本得出的結果必須要能恰當支持結論,並且樣本反映出來的狀況要能呈現真實的狀況。底下一一說明。
需要足夠的樣本
首先,樣本要夠大;如果不夠大的話,前提便無法恰當的支持結論。如果台灣總統大選的民調樣本只有10人,而這10人中有6人說他支持蔡英文,那麼我們能說台灣的選民有6成的人支持蔡英文嗎?這樣的民調只會是笑話。不過,像總統大選這樣的民調,樣本不需要到非常巨大就能有一定的準確度,事實上,即使是在美國的民調,就算目標群體為全體美國成年人,樣本也只需要大約1,000到1,500人,就能推出大致準確的結果。在台灣也一樣。例如,去年自由時報在12月9號做的總統大選民調,樣本只有1,078人,結果顯示有53.12%的人支持蔡英文,而最後蔡英文勝選的得票率是57.1%,相差不算太大。當然,當時的民調受到韓國瑜的蓋牌效應影響,韓要他的支持者在接到民調電話時喊出「民調唯一支持蔡英文」,因此民調未必能如實的反映出真實狀況,雖然自由時報的民調也有提到,回答「唯一支持蔡」僅1.12%。這就可以連結到民調要滿足的第二個條件,就是必須要得出準確的資料。
有時候,民調的問法會產生誤導,因而無法反映出真實。例如,在關於墮胎的問卷,如果問題這樣問:「你認為女性應該擁有殺害未出生的小孩的權利嗎?」大概不會有太多人的回覆是正面的,因為「殺害小孩」這樣的措辭已經帶有強烈的負面意味。有時候這樣的問法可能是無意的,但有時候可能是有意的,反映出做民調者的立場,意圖將受訪者的看法導向特定結果。這樣的民調當然不會有太高的可信度。
原來問問題的順序也有技巧?
另外一個很重要的影響因素是問題的順序。假設有一份民調問卷在調查市長施政滿意度,第一個問題先是問了高雄的愛河有沒有蓋摩天輪,第二個問題才問對於韓國瑜的施政滿不滿意,這樣的問題安排順序其實頗有陷阱。第一個問題拋出帶來負面觀感的事實,受訪者很容易在第二個問題回答不滿意。姑且不論韓市長有無實際的施政成績,這種左右受訪者意見的問卷無法如實反映民意。這就好像先問你知不知道台灣最近發生什麼重大犯罪事件,然後才問你覺得台灣治安好不好。這樣的民調只會成為媒體帶風向的工具。
最後,問卷可能會有簡化選項的風險,因而無法反映出真實的民意。如果詢問韓國瑜市長施政滿意度的調查只有好與不好的選項,會忽略了一些其他市民可能會抱有的態度,例如覺得施政普通、沒感覺或是不太清楚。在只有兩個選項的狀況下,這些人可能會勉強選擇其中一個,這與提供兩個以上的選項所調查出來的結果,恐怕就會有顯著的差異。
設計民調的問題時要盡量避免上述三種陷阱,而我們在回答問題時也應該要認知到這樣的陷阱,進而對民調的結果抱持保留態度。
為什麼民調會準確?
早先有提到,即使民調的目標群體數量龐大,樣本卻可以相對的小,也能得出準確的結果,為什麼能夠如此呢?主要歸因於「隨機抽樣」(random sampling)的方式。在先前的節目有介紹過,枚舉歸納成為弱論證的兩個原因,一個是樣本太小,一個是樣本沒有代表性,隨機抽樣就是要避免後者發生。使用隨機抽樣才能確保目標群體中的每一個成員都有可能被選為樣本,才不會造成有偏差樣本(biased sample)的狀況。不過,要進行完全的隨機抽樣也不是那麼容易,當我們要從一長串的名單或號碼中隨機挑選時,往往還是會被一些主觀因素影響,例如我們可能潛意識偏好某些名字或數字。要避免這種情況,我們可以把目標群體的成員做編號,再用隨機的號碼生產程式來決定。
要注意的是,有一種很常見的民調方式其實無法真正確保隨機抽樣。例如,雜誌上可能會有讀者回函,請讀者回信來讓讀者投票;或是網站上會有問卷,請網友填寫來讓網友投票;或是廣播節目要聽眾call in來投票。不論是哪一種,都是屬於所謂的「自我選樣」(self-selecting sample)。在這些情況中,這些回應投票的人可能剛好只是那些比較勇於表達自己意見的人,或是特別喜歡填寫問卷或回答問題的人。也就是說,在這種狀況中,要不要成為樣本是他們自己決定的,因此才稱為自我選樣。既然自我選樣不是隨機抽樣,所得出來的結果自然不會準確。
抽樣(sampling)畢竟不是普查(census),針對同一個目標群體所做的隨機抽樣不會每一次都得到一樣的結果,這種差異性構成了所謂的誤差範圍(margin of error)。再舉剛剛自由時報的民調為例,蔡英文的支持率是53.12%,報導裡面有提到抽樣誤差在2.98個百分點以內,這代表蔡英文的支持率落在53.12加減2.98的範圍內。以總統大選來說,誤差範圍通常都在3個百分點以內。
在民調中,除了誤差範圍,還有一個很重要的概念叫做「信心水準」(confidence level)。在剛剛提到的總統民調的報導中,有註明信心水準是95%。這意思是說,有59%的機率,包含誤差範圍在內的民調結果會反映真實的情況。以蔡英文的民調結果來說,誤差在53.12%加減2.98%的範圍內,那麼有九成五的機會真實情況會是如此。
幾個有趣的事實
這裡順帶介紹三個有趣的事實,主要都是關於樣本、誤差以及信心水準三者之間的關係。
首先,樣本愈大,誤差範圍會愈小,這是因為隨機抽樣的樣本若愈大,當然就會愈有代表性。然而,在樣本數超過1,000之後,大幅提高樣本數並不會大幅縮減誤差範圍。例如,把樣本數從1,500提高到10,000只會降低1個百分點的誤差範圍。
第二,信心水準愈低,樣本數就可以愈小。例如,90%的信心水準意味著,有10%的機率民調結果會不準確。如果可以接受這麼低的信心水準,當然可以不用有太大的樣本。
最後,誤差範圍愈大,信心水準就愈高。這是因為範圍愈大,我們當然更有信心最後民調的結果會落在這麼大的範圍內。當我們把結論的準確度降低了,就更有信心預測不會出錯。
關於計算誤差範圍與信心水準的方式,聽眾朋友們若有興趣可以去找統計學的書來看,此處就不深入介紹。
最後要提的是,有時候針對民調,人們即使沒有特定的想法也會硬擠出想法。因為人們似乎有一種傾向,認為提供假的意見比起承認自己沒有意見要好。在這樣的狀況之中,民調並沒有真正收集到人民真正的想法。想想我們自己在回答民調的時候,可能不一定有真正的想法,或者對問題根本不了解。這裡提供一個很極端的例子供各位參考。英國的一間數據分析公司曾做過一個民調,調查英國人對1975年的公共事務法案的看法。有18%的受訪者針對這份民調給了意見。問題是,這個法案是虛構的,根本不存在,人們卻仍然願意提供看法。該民調其實是重現了辛辛那提大學曾經做過的實驗,用來說明有很大一部分的人仍會回應針對虛構議題的民調。
透過今天的介紹,希望聽眾朋友們對民調有進一步的了解。在這個資訊發達的時代,做民調是一件很方便的事情,我們對於許多人事物的看法也都仰賴民調的結果。也就因為這樣,我們對於民調必須更加小心,不論是在設計、回應或評估等面向,都應該用更審慎的態度來面對。
在下一集的節目中,我們要談談訴諸權威的謬誤。活在這個世界上,我們必須仰賴許多權威,課本就是一種權威,醫生也是一種權威,這些權威指引著我們過生活,訴諸權威為什麼是謬誤呢?想了解更多內容,歡迎繼續收聽,我們下次再見。
參考書目:Vaughn, L. 2013. The Power of Critical Thinking. New York: Oxford University Press.
🕺想聽更多聲音節目?
2019年10月鏡週刊推出全新聲音平台《鏡好聽》,每天都節目上線,聽記者聊採訪幕後,聽作家談談創作,還有聽名人朗讀好書。讓我們的聲音,陪你度過各個你通勤、跑步、洗碗的零碎時間。
最多獨家更新內容只在《鏡好聽》:https://mirrormediafb.pros.is/LY67K