【衆新聞】數據政策須面向全民,不應限於創科界

by 周穗斌

文- 周穗斌

2021/05/08

Blog

文章

繪圖:何倩彤

(本文2021年5月8日刊登於衆新聞,點擊此處瀏覽原文)

數據對現代社會之重要,已無須多言,「大數據」一詞今日可謂老少皆知,開放數據和保護個人資料(personal data)均為時下熱話。不過,政府在推動數據的開放共享、應用和保護時,應將相關政策視作什麽性質卻是值得探討的問題。定性不同就會手法迥異,效果也就不同。

以香港爲例,儘管沒有完整的數據政策,但是若牽涉到大數據,有關措施可見於《智慧城市藍圖》,第一版在2017年12月發佈,2020年12月則推出了2.0版本,最新内容包括開發交通數據分析系統,開發電子資料系統處理建築圖則等等。負責《藍圖》的部門是創新及科技局,以及資訊科技總監辦公室。不難看出,香港政府大體上將協調、推動數據應用作為創新及科技政策的一個組成部分來對待。

數據專家未必來自創科領域

毋庸置疑,科技發展,尤其是電腦和互聯網的出現令大規模數據應用變得普遍,於是才有「大數據」一説。從這一角度看,將數據納入創科框架並無不妥,也是推動政府乃至全社會實現數碼轉型(digital transformation)的必然舉措。

然而,長遠而言,單一的創科視角可能會令數據管治(data governance)變得片面,因為人類大量利用數據的行為遠在電腦發明之前已經出現,例如百餘年前的西方國家在企業和財務管理、人口和經濟統計、圖書和檔案管理上已大量使用數字表格,只是當時之人腦算得不及今日之電腦快罷了。看過2017年奧斯卡獲獎影片《NASA無名英雌》(Hidden Figures)的人可能記得,美國太空總署在1960年代仍要靠大量人手計算太空飛船的軌道,當局渴求數學人才的背景下三位非裔女主角獲得機會一展才能,一邊對抗種族隔離一邊貢獻太空事業。

其實,很多處理數據的電腦程式,例如Excel,其圖表形式都是源自人手繪製圖表的經驗;一些互聯網數據管理的方法,例如元數據(metadata),是源自圖書館的卡片目錄。這些都是各行業人士應用數據過程中,日積月累而成的智慧結晶,傳承至今,並非創新,卻行之有效地服務社會生產和市民生活。

一個有趣的發現是,近十年開放數據受推崇,做得最好的往往不是新成立手握高科技的機構,而是歷史悠久的傳統部門。《香港開放數據指數2019/20》中得分最高的兩個機構是政府統計處(90分,100分為滿分)和立法會(88分)。政府統計處成立於1947年,專門跟數據打交道;香港立法會成立於1843年,因法案兹事體大,對文件及檔案須妥善分類保存,兩個機構日積月累形成了完善的數據處理機制和人才儲備,擁有既懂管理又懂應用的數據專家。

政府統計處(上)及立法會(下)的開放數據表現在香港處於領先地位。

其實,這並非香港獨有現象,兩項全球開放數據排名Global Open Data IndexOpen Data Barometer 的評估結果均顯示,各國的統計和立法領域開放數據水準普遍領先於其他。(順帶一提,全球開放數據墊底的領域是土地和公司註冊數據,因為許多國家地區不開放或半開放這類數據,香港亦然。)

數據需求來自各行各業

今日社會離不開數據,需求遍佈各行各業,不僅源自機構内部的數據管理和分析,更指向外部數據的開放共享。

無論你是學校的老師、學生或研究人員,還是企業家或管理人員,抑或從事市場營銷、新聞報道、產品開發、設計、項目管理、法律及其他專業服務等工作,恐怕都有搜尋各類公開數據的經歷,也都會對現有數據的開放程度、質素、應用水準有自己的判斷,更對如何改善上述各方面有若干看法。

概括而言,從數據人才到數據需求,是分佈在全社會各領域的。故此,政府在製定數據相關政策的時候就不應該只著眼於創科,而是要面向全民。創新和科技固然可已改善數據管理水準,藉助新技術實現在保障個人私隱和安全的前提下更大範圍之數據共享,服務經濟社會發展,但最終的著眼點還是人的需求。有一句多年前流行的話叫「科技以人為本」,數據又何嘗不應當如是呢?

【撰文:香港互聯網協會「香港開放數據指數」研究員周穗斌】