【洪永泰專欄】2020民進黨總統初選,民調數據千萬不能當真!

【洪永泰專欄】2020民進黨總統初選,民調數據千萬不能當真!

by
gvsrc

2019年6月13日民進黨中央黨部寫下了台灣民調史上最黑暗的一天。

在明知母體之中住宅電話和手機的結構比例並非相等的情況下,民進黨中央黨部強行以一對一的比例合併雙底冊電話調查資料,目的只為了讓某一個候選人在總統提名初選中獲勝。

台灣地區民眾的電話使用行為有三種類型,第一是只用住宅電話不用手機(簡稱P1),第二是住宅電話和手機都用(簡稱P2),第三是只用手機不用住宅電話(簡稱P3)。根據過去的研究,這三種類型的比例大概是:P1(5~15%)、P2(50~70%)、P3(25~35%)。如果要用簡單的白話文來說,就約略是10%、60%、30%。

全世界各地的雙底冊電話調查(dual frame telephone survey)都為了如何併檔對母體進行估計投入資源進行研究,方法論和實證研究文獻很多,台灣自然也不例外。大致說來,如果是要簡單地以總體指標展示結果,只需要將住宅電話調查資料的P1和P2,以及手機調查資料的P2和P3,這四個部分資料取得的數據,依照估計的母體結構比例加權計算,就可以得到最後的結果。

從常識判斷,大家都知道民眾的電話使用行為會因為每一個人的居住地區(城鄉別)、性別、年齡、教育程度、職業而有所不同。譬如說,彰化縣大城鄉的70歲以上女性家庭主婦,和台北市35歲以下男性電腦工程師的電話使用行為,兩者之間的P1(只用住宅電話)P2(兩者都用)P3(只用手機)結構比例就會有非常大的差異。所以如果需要對調查資料進行更精確的推論,就必須把雙底冊調查的資料根據樣本的人口屬性分層,然後各層之內再將住宅電話調查資料的P1和P2,以及手機調查資料的P2和P3,這四個部分的數據,依照各該層估計的母體結構比例加權計算,最後再合併成為總估計。這些步驟對一個民意調查機構而言並不難,甚至可以事先寫好程式,只要資料一進來,代入統計軟體,一下子就可以得到最後結果。

扭曲雙底冊人口結構的資料勢必做出偏離真相的推論,這個初選調查真的不能當真。

民意調查教科書裡最著名的兩個大烏龍,一個是1936年美國總統選舉「文學文摘(The Literary Digest)」以郵寄問卷調查預測羅斯福將以43%落敗,其實他卻是以61%狂勝。另一個是1948年總統選舉,蓋洛普(Gallup)預測杜魯門以44%敗選,實際上卻是以50%獲勝。幾乎所有的民調教科書都會拿杜魯門拿著報紙頭版「杜威擊敗杜魯門」的大笑照片做樣版。

教科書裡舉的美國烏龍例子畢竟還只是選舉預測而已,無傷大雅。民進黨的2019年初選民調可是貨真價實的總統選舉提名,實質影響非同小可。這個烏龍絕對會寫入台灣民調教科書,永垂不朽!