【明報】大數據防疫 開放數據更要尊重私隱
(本文2020年3月7日刊登於《明報》C08版)
疫情陰霾籠罩之下,公衆對相關資訊需求大增。政府發布會、新聞稿、部門網站公告等傳統官方資訊渠道,雖然最具權威性,但卻十分零碎。要令市民更易掌握現况,唯有將不同來源的已核實數據,整合為更為清晰的動態全景圖,「一文睇清」,方能令市民充分知情而採取有效防範措施。其實,新型冠狀病毒爆發後,無論海內外、官方及民間,都先後推出各類有簡明互動圖像的網上資訊平台。但除展示方式以外,數據如何開放,開放多少仍存在深層次問題,而開放公共衛生數據的一項難題是如何處理病人私隱。
數據視覺化(Data visualization)在近年「大數據」熱潮下,於傳媒、公民社會及商業項目中廣泛應用,更成為近來大型事件發生時,資訊呈現的常態。「武漢肺炎民間資訊」(wars.vote4.hk)是香港最早出現的疫情資訊平台,網站製作人花了兩天便搭建完畢,於1 月26日開始實時呈現疫情及出入境數字等資料,亦綜合政府消息及媒體報道等整理出高危地區的互動地圖,包括確診人士曾經逗留的地方、隔離檢疫地點等,全部都有註明出處。
與以往社會事件不同,今次政府亦有「動作」,2 月3 日推出「本地情况互動地圖儀表板」(Interactive MapDashboard)。據政府新聞公報指,由「發展局、地政總署及一群智慧城市聯盟的義工合力開發和管理」,並在地圖中標示出高危地點,亦有急診室輪候時間等,資料來源當然僅限政府。事有巧合,新加坡亦有類似的儀表板「Official Update of COVID -19 Situation in Singapore」, 連網頁載入過程中的「Loading」圖標都與港版的一模一樣。追查之下,星港兩地都似乎是「參考」美國的約翰霍普金斯大學(Johns Hopkins University)系統科學和工程中心早於1 月22日推出的儀表板,但卻未予聲明。後者數據和部分網頁代碼早已透過網絡平台Github 共享,理論上人人皆可套用,但他人使用時應說明來源。
聚焦公衆利益免專注單一個案
視覺化終究只是呈現方式,開放數據更為核心,而病人私隱是開放公共衛生數據中的一個長期爭議點。香港衛生防護中心已經用開放數據形式每日公布個案,其中一份清單有確診者的性別和年齡,姓名則以個案編號代替,但無住址,顯然是要保護當事人私隱,其他地方諸如新加坡、日本(只提供出生年代而無具體年齡)的做法亦大致如是。不過,如上文所述,公布確診人士逗留過的地點屬必要,有助公眾提高警覺,於是政府另行公布一份確診者居住及到訪過的大廈名單,並註明相應個案編號。
如果細心對比兩個數據,不難發現兩張清單都有個案編號,即可關聯起來,術語稱為「開放數據連結」(Linked Open Data)。再結合其他公開資料,不難還原確診者真實身分,例如第85 宗個案是一名馬主,傳媒在報道時直稱其姓名。私隱與公眾利益的矛盾是難題,統統訴諸法律手段亦不現實,一種較好的方式是呈現上避免專注個案,而採用更關乎公眾利益的空間分佈方式(例如地理圖),上述各數據視覺化平台即是如此。
在未有完美解決方案時,須抱以誠實、誠懇的態度處理,甚至能化危為機,反之亦然。
文:周穗斌(香港互聯網協會研究員)
【明報】大數據防疫 開放數據更要尊重私隱
(本文2020年3月7日刊登於《明報》C08版)
疫情陰霾籠罩之下,公衆對相關資訊需求大增。政府發布會、新聞稿、部門網站公告等傳統官方資訊渠道,雖然最具權威性,但卻十分零碎。要令市民更易掌握現况,唯有將不同來源的已核實數據,整合為更為清晰的動態全景圖,「一文睇清」,方能令市民充分知情而採取有效防範措施。其實,新型冠狀病毒爆發後,無論海內外、官方及民間,都先後推出各類有簡明互動圖像的網上資訊平台。但除展示方式以外,數據如何開放,開放多少仍存在深層次問題,而開放公共衛生數據的一項難題是如何處理病人私隱。
數據視覺化(Data visualization)在近年「大數據」熱潮下,於傳媒、公民社會及商業項目中廣泛應用,更成為近來大型事件發生時,資訊呈現的常態。「武漢肺炎民間資訊」(wars.vote4.hk)是香港最早出現的疫情資訊平台,網站製作人花了兩天便搭建完畢,於1 月26日開始實時呈現疫情及出入境數字等資料,亦綜合政府消息及媒體報道等整理出高危地區的互動地圖,包括確診人士曾經逗留的地方、隔離檢疫地點等,全部都有註明出處。
與以往社會事件不同,今次政府亦有「動作」,2 月3 日推出「本地情况互動地圖儀表板」(Interactive MapDashboard)。據政府新聞公報指,由「發展局、地政總署及一群智慧城市聯盟的義工合力開發和管理」,並在地圖中標示出高危地點,亦有急診室輪候時間等,資料來源當然僅限政府。事有巧合,新加坡亦有類似的儀表板「Official Update of COVID -19 Situation in Singapore」, 連網頁載入過程中的「Loading」圖標都與港版的一模一樣。追查之下,星港兩地都似乎是「參考」美國的約翰霍普金斯大學(Johns Hopkins University)系統科學和工程中心早於1 月22日推出的儀表板,但卻未予聲明。後者數據和部分網頁代碼早已透過網絡平台Github 共享,理論上人人皆可套用,但他人使用時應說明來源。
聚焦公衆利益免專注單一個案
視覺化終究只是呈現方式,開放數據更為核心,而病人私隱是開放公共衛生數據中的一個長期爭議點。香港衛生防護中心已經用開放數據形式每日公布個案,其中一份清單有確診者的性別和年齡,姓名則以個案編號代替,但無住址,顯然是要保護當事人私隱,其他地方諸如新加坡、日本(只提供出生年代而無具體年齡)的做法亦大致如是。不過,如上文所述,公布確診人士逗留過的地點屬必要,有助公眾提高警覺,於是政府另行公布一份確診者居住及到訪過的大廈名單,並註明相應個案編號。
如果細心對比兩個數據,不難發現兩張清單都有個案編號,即可關聯起來,術語稱為「開放數據連結」(Linked Open Data)。再結合其他公開資料,不難還原確診者真實身分,例如第85 宗個案是一名馬主,傳媒在報道時直稱其姓名。私隱與公眾利益的矛盾是難題,統統訴諸法律手段亦不現實,一種較好的方式是呈現上避免專注個案,而採用更關乎公眾利益的空間分佈方式(例如地理圖),上述各數據視覺化平台即是如此。
在未有完美解決方案時,須抱以誠實、誠懇的態度處理,甚至能化危為機,反之亦然。
文:周穗斌(香港互聯網協會研究員)