【明報】當開放數據遇上區議會

2019-11-30
Logo of Ming Pao, a Hong Kong based newspaper

(本文2019年11月30日刊登于《明報》D05版)

剛剛結束的區議會選舉似是海嘯來襲,顛覆地區政治版圖之餘,亦為各區捲來大批沒有從政經驗的政壇年輕新血。綜觀今次選舉,青年人的參與政治方式不單止是直接參選,有人亦從資訊科技入手,用網站整合互聯網的開放數據,用專業技能讓選舉過程更透明,方便選民及候選人作清晰判斷。長遠而言,善用開放數據,可幫助市民深入了解議會,監察代議士言行及政府施政,促成基於事實的公民參與生態,對各方皆有利。

用「眾包」蒐集投票數據 一目了然

據筆者了解,今次區議會選舉有兩個民間自發的網站令人耳目一新,包括「Vote4.hk」及「選區事實處」(hkfactcheck.io),據了解皆為資訊科技從業人員利用公餘時間籌備,設計簡潔卻資料豐富。兩者的共通之處乃用「眾包」(crowdsource)方式,實時蒐集並顯示各票站投票率。區別是前者主力呈現各區選民特徵,後者集中匯聚候選人資料。

「Vote4.hk」首頁只有選舉結果圖表,風格極簡。直接點開某一區,可見每小時投票率折線圖、選民年齡性別等人口柱狀圖、選區劃分地圖及主要屋苑等,亦為人口特徵貼上標籤,顯然是幫助候選人熟悉選區,尤其是欠缺政黨資源的素人。以筆者熟悉的中西區為例,石塘咀選區就標註為「偏多新移民」、「偏高齡」、「家庭月入偏低」等;位處西半山的大學選區就有「家庭月入甚高」、「甚多大專畢業生」等標籤,基本符合筆者日常觀察。

「選區事實處」則蒐集候選人過往言論、投票紀錄、議會發言及利益申報等,聲稱作為「文宣以外另一個深入了解社區服務人士的途徑」,顯然是為選民服務,提供可為投票作參考的資料。平台資料採集自傳媒網頁和各區區議會網站,網民亦可以透過「回報問題」或「提交事件」補充。

不過,上述平台亦未盡完善。譬如「Vote4.hk」為大學選區貼上「甚多新移民」標籤,相信是因為數據來自人口普查,所謂「新移民」極有可能是無投票權的外籍專業人士。中西區包括半山東、衛城、山頂等選區均有此標籤,但其實對選舉並無太大參考價值,大數據算法及標籤的準確度有待改進。「選區事實處」則未有交代清楚事實核查的程序。

各區文件格式不一 礙大數據分析

作為公民社會自發搭建的平台,短時間內有如此效果已經值得讚賞。若然要形成基於事實的健康選舉和議會文化,其實當局與從政者的責任更加重大,做好開放數據是較容易踏出的一步。

例如,其中一個公認可靠的事實來源是各個區議會網站公布的投票紀錄及會議紀要。問題在於18 個區議會網站發布的文件格式不一,中西區用Word 刊載會議紀要,而灣仔區則用PDF,內文排列更千差萬別,不符合開放數據的「互通性」(interoperability)準則,增加用大數據方法作批量分析的難度。解決方式並不複雜,由協調機構對會議文件格式作更清晰指引即可。其實各區網站若共用同一套模板,設計、排列、分類等,統一文件格式應不會太困難。

換血後的各區議會勢將有一番新氣象,透過更廣泛的社區參與,打造開放透明的議會,完全符合多數新議員的理念,例如可更妥善處理以往廣受詬病的地區工程撥款等問題,開放數據可發揮正面作用。

文: 周穗斌(香港互聯網協會研究員)

【明報】當開放數據遇上區議會

2019-11-30
Logo of Ming Pao, a Hong Kong based newspaper

(本文2019年11月30日刊登于《明報》D05版)

剛剛結束的區議會選舉似是海嘯來襲,顛覆地區政治版圖之餘,亦為各區捲來大批沒有從政經驗的政壇年輕新血。綜觀今次選舉,青年人的參與政治方式不單止是直接參選,有人亦從資訊科技入手,用網站整合互聯網的開放數據,用專業技能讓選舉過程更透明,方便選民及候選人作清晰判斷。長遠而言,善用開放數據,可幫助市民深入了解議會,監察代議士言行及政府施政,促成基於事實的公民參與生態,對各方皆有利。

用「眾包」蒐集投票數據 一目了然

據筆者了解,今次區議會選舉有兩個民間自發的網站令人耳目一新,包括「Vote4.hk」及「選區事實處」(hkfactcheck.io),據了解皆為資訊科技從業人員利用公餘時間籌備,設計簡潔卻資料豐富。兩者的共通之處乃用「眾包」(crowdsource)方式,實時蒐集並顯示各票站投票率。區別是前者主力呈現各區選民特徵,後者集中匯聚候選人資料。

「Vote4.hk」首頁只有選舉結果圖表,風格極簡。直接點開某一區,可見每小時投票率折線圖、選民年齡性別等人口柱狀圖、選區劃分地圖及主要屋苑等,亦為人口特徵貼上標籤,顯然是幫助候選人熟悉選區,尤其是欠缺政黨資源的素人。以筆者熟悉的中西區為例,石塘咀選區就標註為「偏多新移民」、「偏高齡」、「家庭月入偏低」等;位處西半山的大學選區就有「家庭月入甚高」、「甚多大專畢業生」等標籤,基本符合筆者日常觀察。

「選區事實處」則蒐集候選人過往言論、投票紀錄、議會發言及利益申報等,聲稱作為「文宣以外另一個深入了解社區服務人士的途徑」,顯然是為選民服務,提供可為投票作參考的資料。平台資料採集自傳媒網頁和各區區議會網站,網民亦可以透過「回報問題」或「提交事件」補充。

不過,上述平台亦未盡完善。譬如「Vote4.hk」為大學選區貼上「甚多新移民」標籤,相信是因為數據來自人口普查,所謂「新移民」極有可能是無投票權的外籍專業人士。中西區包括半山東、衛城、山頂等選區均有此標籤,但其實對選舉並無太大參考價值,大數據算法及標籤的準確度有待改進。「選區事實處」則未有交代清楚事實核查的程序。

各區文件格式不一 礙大數據分析

作為公民社會自發搭建的平台,短時間內有如此效果已經值得讚賞。若然要形成基於事實的健康選舉和議會文化,其實當局與從政者的責任更加重大,做好開放數據是較容易踏出的一步。

例如,其中一個公認可靠的事實來源是各個區議會網站公布的投票紀錄及會議紀要。問題在於18 個區議會網站發布的文件格式不一,中西區用Word 刊載會議紀要,而灣仔區則用PDF,內文排列更千差萬別,不符合開放數據的「互通性」(interoperability)準則,增加用大數據方法作批量分析的難度。解決方式並不複雜,由協調機構對會議文件格式作更清晰指引即可。其實各區網站若共用同一套模板,設計、排列、分類等,統一文件格式應不會太困難。

換血後的各區議會勢將有一番新氣象,透過更廣泛的社區參與,打造開放透明的議會,完全符合多數新議員的理念,例如可更妥善處理以往廣受詬病的地區工程撥款等問題,開放數據可發揮正面作用。

文: 周穗斌(香港互聯網協會研究員)

Read more

Asia, home to nearly a quarter of the global population, is responsible for only 2 percent of Covid-19 cases, according to the World Health Organisation.
Read more
撇除區議員薪金等行政開支,「地區小型工程」及「社區參與計劃」的撥款基本是現今區議會的「家底」。
Read more
View Open Data Index
View Index