【哲學S03E06】民調都是假的啦!? 談歸納論證幾個需注意的推論
上一集我們介紹了邏輯中非常著名的推論形式「三段論」,想學習基本邏輯嗎?錯過記得回去收聽或閱讀喔!今天我們要來談談「歸納法」。歸納法在日常生活中常常用到,與我們形影不離。你怎麼知道今天「哲學好好玩」新的一集會上線呢?其實你就是用到了歸納論證(inductive argument)!那究竟什麼是歸納論證?又要怎麼評價歸納論證呢?
從過去推斷被當的機率!?
我們先前提過,判斷一個論證是不是演繹論證的關鍵在於:該論證的前提給予結論的支持是何種支持。如果我們察覺提出論證的人是意圖讓論證的前提給予結論必然的支持,那麼該論證就是「演繹論證」;如果提出論證的人是想要讓前提給予結論或然的支持,那麼該論證就是「歸納論證」。也就是說,如果我們察覺提出論證的人是想要說,如果前提都為真,結論很有可能也會為真,那這個時候我們面對的這個論證就是歸納論證。例如底下這個論證:
過去十年來,文化大學的通識邏輯課每學期大約有百分之十的學生會被當因此,文大通識邏輯課每學期應該會有百分之十的學生被當
上述這個論證的確是「歸納論證」,因為很明顯此處涉及的是可能性而非必然性。提出論證者是在表達,如果前提成立的話,結論可能也會成立,而非必然會成立。在這個例子中,假設我們接受了前提為真,那麼結論為真的機率高嗎?如果過去十年來,文化大學的通識邏輯課的確存在百分之十的當率,那之後每學期的當率是否也很有可能會是百分之十?似乎如此。當一個歸納論證的前提給予結論很強的支持時,我們把這個論證稱為強(strong)歸納。這個「強」的意思是,前提真這件事在很高程度上擔保了結論也會為真。反之,若前提為真,結論卻不太可能為真,那麼這個論證就是弱(weak)歸納。例如,如果我們把前提中提到的十年改成去年,這個論證就會變成弱歸納。畢竟,只拿去年的資料就要預測今年甚至往後,似乎太勉強了。
當一個強歸納的所有前提都是真的,這個論證就是可信的(cogent)。以剛剛提到的論證而言,若過去十年文化大學通識邏輯課的當率真的就是百分之十,這個前提就是真的。由於這個論證具備真的前提,這個強歸納就成為可信論證,可信論證才是好論證,才是我們理想中應該追求的歸納論證。具體來說,一個可信論證必須同時滿足兩個條件,首先必須要是強歸納,再來就是所有前提在實際上都要是真的。只要缺了一個條件就是不可信的論證,也就成為壞論證。這裡的評價方式跟討論演繹論證時用到的方式是相似的,只是術語不同。
上述關於通識邏輯課的論證結構在歸納推理中稱為「枚舉歸納」(enumerative induction)。所謂枚舉就是列舉的意思。前述論證的前提也可以看成是列舉了過去十年文大通識邏輯課的當率,然後透過所列舉的證據去預測往後的當率。我們可以說,一個典型的枚舉歸納是從一個群體的部分成員推論到整個群體。我們把那整個群體稱為目標群體(target group),觀察到的成員稱為樣本(sample),要從樣本推到目標群體的性質稱為相關性質(relevant property)。
以邏輯課的論證為例,目標群體代表的就是所有上文大通識邏輯課的學生,觀察到的成員則是過去十年文大上過通識邏輯課的學生,相關性質則是代表這門課被當。
小心輕率概化!民調要特別注意樣本數!
這樣的推論並不總是能成功。枚舉歸納可能成為弱歸納的原因有兩個。首先是樣本太小。前面提過,如果邏輯課論證的樣本只有去年上過邏輯課的學生,那就算前提是真的,結論很有可能也不會是真的。樣本太小很容易會掉入所謂「輕率概化」(hasty generalization)的謬誤。僅僅從去年邏輯課的當率就推論到所有邏輯課的當率,這樣的概化過於輕率了。我們可以看看另一個例子。像現在總統大選到了,假設你的朋友跟你說:「蔡英文這次民調很高,可能會當選!」結果後來你發現這個民調只調查了十戶人家,這時候你還會相信朋友的話嗎?在樣本這麼小的情況下,想要從十戶人家的民調結果推到蔡英文可能會當選的結論,未免太過牽強。如果這麼推的話,就犯了輕率概化,亦即輕率地相信大部分人都會投給蔡英文。
當然,這個例子說民調只訪問十戶人家是誇張了點,但這也告訴我們在看民調時要稍微注意一下樣本大小。民調報導一般都會附上樣本數的資料,建議大家多看一眼。
輕率概化的概念很容易理解,但我們卻很常犯。很多時候,我們會犯下這種錯誤是因為樣本給我們的印象太深了。一位紐西蘭的朋友曾經跟我分享過一個例子。他有一位朋友經營民宿,有一次來了一位俄國遊客。幾天之後這位俄國人退房,民宿主人進去清理房間,發現房間髒亂得不得了。事後他向我的朋友抱怨,他說俄國人的衛生習慣實在太差了。但我們仔細檢視這個例子可以發現,民宿老闆的樣本數事實上只有一個,在樣本這麼小的狀況下要做出「俄國人的衛生習慣都很差」這樣的結論,實在太勉強了。但為什麼民宿老闆很自然而然會做出這樣的推論?因為這個例子給他的印象太深刻。想像一下,如果你今天跟朋友到某個你們沒去過的外縣市遊玩,隨便找了一間小吃攤,結果驚為天人,你可能會跟朋友說:「沒想到這個地方的吃食還不錯!下次要再來玩!」這些例子說明了,當樣本給我們的印象太深刻時,我們很容易會忘記樣本數太小這件事。
樣本有沒有代表性 可能形成「倖存者偏差」
枚舉歸納成為弱論證的第二個原因是樣本不夠有代表性。事實上,前述關於邏輯課的論證就有這個危險。假設文大每學期通識邏輯課都同時由三名老師來授課,這樣對學生來說,有三門同樣的課可以選,但授課教師不同,只要修一門就可以滿足學分要求。如果過去十年的當率資料都是取自同一位老師的課堂,那這樣的樣本就不夠有代表性,因為這位老師的當率可能跟其他兩位老師的當率不同。樣本要夠有代表性,就必須要平均從三位老師的課堂取樣。
我們可以再次用選舉的例子來說明。假設朋友對你說:「蔡英文民調很高,可見大部分人都支持他。」你查證之後發現,這民調的樣本數的確很大。然而,光是這樣就能說明這是個強歸納嗎?答案是否定的。如果你事後發現這民調只訪問民進黨的鐵票倉,例如嘉義縣或台南市,你恐怕就不會相信了。這同樣犯了樣本不夠有代表性的毛病。民調樣本必須均勻分布在各選區,否則民調結果就會被選區間的差異所影響。
樣本不夠有代表性也容易產生所謂的「倖存者偏差」(survivorship bias)。例如,有人可能會主張國外的推理小說比台灣的推理小說要好。然而,做出這種主張的人所根據的往往是有在台灣翻譯出版的國外推理小說;也就是說,他的樣本是來自台灣看得到的國外小說。問題是,這樣的樣本並不夠有代表性,因為會被引進台灣翻譯出版的國外小說基本上大多是「倖存者」,也就是從競爭激烈的商業市場中倖存下來的,這些作品本身就具備一定的品質。拿這些某種程度算是菁英的作品來跟所有的本土作品比較當然不公平,因為那些在外國市場沒有倖存下來的作品我們全都沒見到。
又例如,我們可能會常看見許多直銷公司拿成功人士的案例來宣傳,告訴我們這些人因為做直銷而致富。就算這些案例都是真的,說服力也不夠,因為這些人都是倖存者。有更多失敗者的案例都沒有被拿出來檢視。
當然,一個枚舉歸納論證成為弱論證可以是因為同時具備了上述提到的兩個缺陷,也就是樣本不夠大同時也不夠有代表性。例如,如果總統大選的民調結果偏向蔡英文,但事實證明這民調只訪問了少數人,也只在某個特定的選區進行,那想要從民調結果推出蔡英文可能會當選,或是大部分的人都會投給他,這樣的推論幾乎沒有可信度。
永遠要記得容許反例
最後,我們要指出歸納論證一個很重要的特性,就是容許反例。由於歸納論證涉及的是可能性而非必然性,所以即使今年文大通識邏輯課的當率不是百分之十,這也不會推翻原本的論證。畢竟「歸納論證」本來就沒有把話說死。但「演繹論證」就不同了,只要有一個反例,整個論證就無法成立,變成無效論證。事實上,歸納論證與演繹論證一個很大的不同點就在於,前者總是在做超出證據之外的推論。以枚舉歸納而言,前提僅涉及觀察到的成員,但結論卻涉及整體成員,如此一來當然可能出現反例。例如,過去十年的當率無法必然的告訴我們今年的當率,後者已經超出前者所提供的證據範圍了。換句話說,一個歸納論證等於是試圖在告訴我們新的東西。但演繹法不同,對有效論證來說,結論本來就包含在前提中,因此結論其實沒有告訴我們任何新東西,只是把原本不明顯的事物說出來罷了。如果我們知道「人必有一死」且「蘇格拉底是人」,那麼「蘇格拉底會死」這件事已經隱含在前提之中,而非超出前提的範圍。
在下一集的節目中,我們要談談另外兩種歸納論證:類比論證與因果論證。聊天機器人跟人一樣可以聊天,人有情緒,所以聊天機器人也有情緒嗎?每當我站在便利商店門口念咒語時,門就會打開,所以念咒語是導致開門的原因嗎?想了解這些有趣的內容,歡迎繼續收聽下一集。這是《哲學好好玩》,我是主持人林斯諺,我們下次再見。歡迎隨時來鏡文化粉絲專頁與我們互動哦,也別忘了訂閱「知識好好玩」專屬頻道!
參考書目
Vaughn, L. 2013. The Power of Critical Thinking. New York: Oxford University Press.
🕺想聽更多聲音節目?
2019年十月鏡週刊推出全新語音網站《鏡好聽》,內有更多新頻道「記者手札」、「新聞幕後,記者說」、「知識好好玩」、「鏡文學」、「鏡文化為你朗讀」,讓我們的聲音,陪你度過各個你通勤、跑步、洗碗的零碎時間。最多獨家更新內容只在:https://voice.mirrormedia.mg。