【明報】大數據防疫 開放數據更要尊重私隱

周穗斌
2020-03-07
Logo of Ming Pao, a Hong Kong based newspaper

(本文2020年3月7日刊登於《明報》C08版)

疫情陰霾籠罩之下,公衆對相關資訊需求大增。政府發布會、新聞稿、部門網站公告等傳統官方資訊渠道,雖然最具權威性,但卻十分零碎。要令市民更易掌握現况,唯有將不同來源的已核實數據,整合為更為清晰的動態全景圖,「一文睇清」,方能令市民充分知情而採取有效防範措施。其實,新型冠狀病毒爆發後,無論海內外、官方及民間,都先後推出各類有簡明互動圖像的網上資訊平台。但除展示方式以外,數據如何開放,開放多少仍存在深層次問題,而開放公共衛生數據的一項難題是如何處理病人私隱。

數據視覺化(Data visualization)在近年「大數據」熱潮下,於傳媒、公民社會及商業項目中廣泛應用,更成為近來大型事件發生時,資訊呈現的常態。「武漢肺炎民間資訊」(wars.vote4.hk)是香港最早出現的疫情資訊平台,網站製作人花了兩天便搭建完畢,於1 月26日開始實時呈現疫情及出入境數字等資料,亦綜合政府消息及媒體報道等整理出高危地區的互動地圖,包括確診人士曾經逗留的地方、隔離檢疫地點等,全部都有註明出處。

與以往社會事件不同,今次政府亦有「動作」,2 月3 日推出「本地情况互動地圖儀表板」(Interactive MapDashboard)。據政府新聞公報指,由「發展局、地政總署及一群智慧城市聯盟的義工合力開發和管理」,並在地圖中標示出高危地點,亦有急診室輪候時間等,資料來源當然僅限政府。事有巧合,新加坡亦有類似的儀表板「Official Update of COVID -19 Situation in Singapore」, 連網頁載入過程中的「Loading」圖標都與港版的一模一樣。追查之下,星港兩地都似乎是「參考」美國的約翰霍普金斯大學(Johns Hopkins University)系統科學和工程中心早於1 月22日推出的儀表板,但卻未予聲明。後者數據和部分網頁代碼早已透過網絡平台Github 共享,理論上人人皆可套用,但他人使用時應說明來源。

聚焦公衆利益免專注單一個案

視覺化終究只是呈現方式,開放數據更為核心,而病人私隱是開放公共衛生數據中的一個長期爭議點。香港衛生防護中心已經用開放數據形式每日公布個案,其中一份清單有確診者的性別和年齡,姓名則以個案編號代替,但無住址,顯然是要保護當事人私隱,其他地方諸如新加坡、日本(只提供出生年代而無具體年齡)的做法亦大致如是。不過,如上文所述,公布確診人士逗留過的地點屬必要,有助公眾提高警覺,於是政府另行公布一份確診者居住及到訪過的大廈名單,並註明相應個案編號。

如果細心對比兩個數據,不難發現兩張清單都有個案編號,即可關聯起來,術語稱為「開放數據連結」(Linked Open Data)。再結合其他公開資料,不難還原確診者真實身分,例如第85 宗個案是一名馬主,傳媒在報道時直稱其姓名。私隱與公眾利益的矛盾是難題,統統訴諸法律手段亦不現實,一種較好的方式是呈現上避免專注個案,而採用更關乎公眾利益的空間分佈方式(例如地理圖),上述各數據視覺化平台即是如此。

在未有完美解決方案時,須抱以誠實、誠懇的態度處理,甚至能化危為機,反之亦然。

文:周穗斌(香港互聯網協會研究員)

【明報】大數據防疫 開放數據更要尊重私隱

2020-03-07
Logo of Ming Pao, a Hong Kong based newspaper

(本文2020年3月7日刊登於《明報》C08版)

疫情陰霾籠罩之下,公衆對相關資訊需求大增。政府發布會、新聞稿、部門網站公告等傳統官方資訊渠道,雖然最具權威性,但卻十分零碎。要令市民更易掌握現况,唯有將不同來源的已核實數據,整合為更為清晰的動態全景圖,「一文睇清」,方能令市民充分知情而採取有效防範措施。其實,新型冠狀病毒爆發後,無論海內外、官方及民間,都先後推出各類有簡明互動圖像的網上資訊平台。但除展示方式以外,數據如何開放,開放多少仍存在深層次問題,而開放公共衛生數據的一項難題是如何處理病人私隱。

數據視覺化(Data visualization)在近年「大數據」熱潮下,於傳媒、公民社會及商業項目中廣泛應用,更成為近來大型事件發生時,資訊呈現的常態。「武漢肺炎民間資訊」(wars.vote4.hk)是香港最早出現的疫情資訊平台,網站製作人花了兩天便搭建完畢,於1 月26日開始實時呈現疫情及出入境數字等資料,亦綜合政府消息及媒體報道等整理出高危地區的互動地圖,包括確診人士曾經逗留的地方、隔離檢疫地點等,全部都有註明出處。

與以往社會事件不同,今次政府亦有「動作」,2 月3 日推出「本地情况互動地圖儀表板」(Interactive MapDashboard)。據政府新聞公報指,由「發展局、地政總署及一群智慧城市聯盟的義工合力開發和管理」,並在地圖中標示出高危地點,亦有急診室輪候時間等,資料來源當然僅限政府。事有巧合,新加坡亦有類似的儀表板「Official Update of COVID -19 Situation in Singapore」, 連網頁載入過程中的「Loading」圖標都與港版的一模一樣。追查之下,星港兩地都似乎是「參考」美國的約翰霍普金斯大學(Johns Hopkins University)系統科學和工程中心早於1 月22日推出的儀表板,但卻未予聲明。後者數據和部分網頁代碼早已透過網絡平台Github 共享,理論上人人皆可套用,但他人使用時應說明來源。

聚焦公衆利益免專注單一個案

視覺化終究只是呈現方式,開放數據更為核心,而病人私隱是開放公共衛生數據中的一個長期爭議點。香港衛生防護中心已經用開放數據形式每日公布個案,其中一份清單有確診者的性別和年齡,姓名則以個案編號代替,但無住址,顯然是要保護當事人私隱,其他地方諸如新加坡、日本(只提供出生年代而無具體年齡)的做法亦大致如是。不過,如上文所述,公布確診人士逗留過的地點屬必要,有助公眾提高警覺,於是政府另行公布一份確診者居住及到訪過的大廈名單,並註明相應個案編號。

如果細心對比兩個數據,不難發現兩張清單都有個案編號,即可關聯起來,術語稱為「開放數據連結」(Linked Open Data)。再結合其他公開資料,不難還原確診者真實身分,例如第85 宗個案是一名馬主,傳媒在報道時直稱其姓名。私隱與公眾利益的矛盾是難題,統統訴諸法律手段亦不現實,一種較好的方式是呈現上避免專注個案,而採用更關乎公眾利益的空間分佈方式(例如地理圖),上述各數據視覺化平台即是如此。

在未有完美解決方案時,須抱以誠實、誠懇的態度處理,甚至能化危為機,反之亦然。

文:周穗斌(香港互聯網協會研究員)

Read more

An image of the timeline of the Hong Kong Open Data Index
“Hong Kong Open Data Index” has been prepared since late 2018– it can finally go public now!
Read more
香港完整的數據政策是沒有的,官員不提,研究欠奉,但已浮現的問題和爭議比世界其他地方一樣都不少。
Read more
View Open Data Index
View Index