生活

全民查假會社》看懂民調：總統大選民調賴清德第一？學者：假帳號恐影響結果

2023-06-20 17:42

2095
列印

-A +

【愛傳媒全民查假會社專欄】《菱傳媒》於6月14日發佈總統民調系列1-6，結果顯示，賴清德以37.76%的支持度大幅領先，柯文哲31.29%居次，侯友宜21.87%墊後。而詢問台灣民眾對兩岸發生戰爭的感受，43.74%的民眾擔心兩岸3年內一定會或可能會發生戰爭，另有57.61%民眾認為美國一定會或可能會出兵協防台灣。
學者指出，民調詢問3年內存在的兩岸戰爭風險擔憂有多高，「3年」為主觀設定，本題如果改為問「在2024蔡英文總統卸任前」、「若某總統候選人當選，在其任期內」等客觀「時間階段」，則其答案應有更多可觀察、比較、分析之處。
此外，調查使用 DMP (Data Management Platform) 數據管理平台操作，DMP為廣告投放與追蹤系統，會將來自同一網站、同一ID(名稱) 的帳號合併，但對多重帳號並不處理，因此，愈喜歡在網路上帶風向、回應問卷、擁有愈多假帳號的人，愈容易被抽中，故存在「假帳號」的問題與隱憂。

本次解讀民調報告如下：
解讀日期：2023年6月20日
民調日期：2023年6月6日至10日
民調主題：2024總統大選網路民調
報導機構：風傳媒、公視新聞網、中時新聞網、三立新聞
執行機構：《菱傳媒》委託皮爾森數據負責執行，並由台大政治系張佑宗教授協助問卷設計與調查顧問。
調查地區：全台各縣市
樣本/誤差：針對全台灣年滿20歲以上之網路人口，有效樣本為1萬2030份，在95%信心水準下，抽樣誤差為正負0.89%以內。
民調摘要：《菱傳媒》委託皮爾森數據進行「2024總統大選」網路民意調查，於6月14日發佈總統民調系列1-6，結果顯示，賴清德以37.76%的支持度大幅領先，柯文哲31.29%居次，侯友宜21.87%墊後。相較於上月《菱傳媒》針對這三位候選人所做的民調，三人排名一樣，賴的支持度略降，但柯的支持度則從21.74%暴衝到31.29%，首度站上3成。而詢問台灣民眾對兩岸發生戰爭的感受，43.74%的民眾擔心兩岸3年內一定會或可能會發生戰爭，另有57.61%民眾認為美國一定會或可能會出兵協防台灣。

爭點解讀：
一、民調詢問3年內存在的兩岸戰爭風險擔憂有多高。設定為「3年」的背景與原因未清楚說明，此處將風險與擔憂一併詢問，是否不夠周延？
二、民調詢問受訪者，如果台灣跟中國發生戰爭，美國會出兵協防的機會有多高。此處並未清楚說明美國「出兵協防」的具體作為，是登島作戰還是保衛台灣海峽不被封鎖等，受訪者的想像影響答題準確程度？
三、民調使用網路調查方法與結果解讀之爭議處？
四、有關 DMP 中假帳戶的隱憂。

專家分析：

世新大學資訊管理系前主任吳統雄解讀：

本案特色為使用 DMP (Data Management Platform) 數據管理平台操作。
DMP 為廣告投放與追蹤系統，可以投放廣告，當然也可以投放問卷。使用階層可分為3級：國內外系統開發營運商、數位行銷商、與代客操作商。
DMP 不具備民調基本功能，國內外主要系統開發商，均未建議作為民調使用。

爭點一解讀
本爭點的關鍵在測量理論中的「時間階段設計」。
坊間民調幾都採用主觀設定，如本案之「3年」。或經常將受訪者的年齡以10年、20年畫分。這種主觀設定，經常使得變項之間沒有區別力、也沒有觀察意義，統計術語稱為「關聯性」；甚至可能掩蓋了原始有區別力的變項。
本研究者發現「時間階段設計」若與關聯變項配合，便可反映出區別力。
譬如在公共事務調查上，早期發現：以「臺灣光復」分期，後來以「戒嚴解除」、或「李登輝總統直選當選」分期，就出現區別與意義。在生活型態調查上，以「就業前後」、「結婚前後」、「子女誕生」分期，都會產生觀察意義。但以上若採用主觀的10年、20年畫分，經常沒有區別力。

故本題如果改為問：
「在2024蔡英文總統卸任前」、「若某總統候選人當選，在其任期內」等客觀「時間階段」，則其答案應有更多可觀察、比較、分析之處。

爭點二解讀
本爭點就是2個民調基本觀念的混淆，第一、「形象測量」或「深度測量」（請參見2022.12.19/ 2023.05.02《看懂民調》對的解說），與第二、「假設性條件句與真實條件句」（請參見2023.05.31/ 2023.01.05《看懂民調》對的解說）。
本案正如本問題所描述，沒有謹慎處理這2大工作，結局就是出現「形象數字」，欠缺可分析的深度。

爭點三解讀
本案可稱經過網路的便利調查，若嚴格定義，並非「網路民調」。

DMP 為廣告投放與追蹤系統，擁有非常龐大的名單，來源為「三方匯集」，俗語就是大雜燴。
第一方是自己客戶的名單，第二方是協力廠商的客戶名單，除非自己是非常龐大的公司，以上兩者相加都相對有限。
DMP 主要就是第三方、尤其來自社媒、與各會員網站的名單，譬如臉書使用者名單，便是各主要 DMP 的共同子集合。

使用臉書的人都知道，臉書上充斥假帳號，與重複帳號，個人可能有數十個分身，而職業網軍不乏有數千個帳號者。
DMP 會將來自同一網站、同一ID(名稱) 的帳號合併，（本案用了「網路行為分析帶入使用者輪廓標籤」對一般人難懂的名詞。）但對多重帳號並不處理，因為DMP 的目標是投放廣告，很多活躍消費者喜歡用不同帳號買不同商品，DMP 更希望擁有這樣消費者的所有帳號。
DMP 會依據預算抽出投放對象（即樣本），而預設不是平均抽出，而是活躍者、過去消費（即回答、點閱）愈多者愈優先，亦即 DMP 目標就是要抽出「偏頗樣本」。
因此，愈喜歡在網路上帶風向、回應問卷、擁有愈多假帳號的人，愈容易被抽中。
當然，這個預設是可以重設與修改的，唯本案並未說明是否處理，以及如何處理。

本案宣稱：「全台灣年滿20歲以上之網路人口…有效樣本為1萬2030份，在95%信心水準下，抽樣誤差為正負0.89%以內。」
DMP 非常龐大，更由於多重帳號關係，有的甚至超過總人口數。但不使用社媒、不登錄為網站會員的人口也不少，就不會在 DMP 中。故「全台灣年滿20歲以上之網路人口」一句並非事實。
其報告之「抽樣誤差」數字是由「二項分配」而來，如果問題只有2個答案，倒是沒錯；但本題有5個答案，是為「五項分配」，其誤差數字就是錯的。更重要的是，DMP 是個非隨機/非等機率資料庫，以上誤差的估計根本是無意義的（請參見2022.08.08《看懂民調》對「抽樣誤差」的解說）。本案另採用沒有因果關係的「加權法」,只是美化數字，可能反而擴大誤差（請參見2022.10.06《看懂民調》對「加權法」的解說）。

一般坊間民調均不能夠推論為代表全臺灣民眾的意見。但只要其樣本仍具分散性，只要沒有作假，可以代表所訪問到的樣本。故可以作為「統合分析 meta-analysis」的來源資料之一，再加上更多方位的知識與歷史經驗整合，仍然有可能觀察出一些真實趨勢。

唯本案目前的呈現，可知不具備隨機/等機率，可能具備偏頗性、無法得知其是否具備分散性，故暫時不宜列入可參考名單。其對三位總統參選人支持度變化的解讀…等，就以一句俗話視之：看看就好，毋需評論。

爭點四解讀
DMP 中包括臉書「假帳號」的問題，為彭百顯（國展基金會董事長，前立委、南投縣長）、鍾琴（「數位言論自由論壇」總召集人、前新聞局長）與本人（臉書「全彩論壇」管理員）長期關注，並在2020年與時為政務委員、管理數位產業的唐鳳對談，在會中由唐委員提出了「臉書演算法不透明」的事實共識。
由於臉書總部的宣示就是「透明」，所以我們經由唐委員多次與臉書中央與地方連絡，表達願意溝通合作、並以民間力量免費為臉書提供解決「假帳號」的技術。臉書中央有一次回應、但無行動，地方則完全置之不理。

本專欄為全民查假會社「看懂民調專案」之報告，全民查假會社官網網址為：https://tstm.tw/

●專欄文章，不代表i-Media 愛傳媒立場

關鍵字