Connect with us

港聞

網上資源北上受限 黃錦輝倡放寬使用Google YouTube等

發佈於

【明報專訊】專長中文自然語言處理(NLP)研究的中文大學工程學院副院長(外務)、立法會選委會界別議員黃錦輝表示,其研究範疇需運用系統分析大量文本,現時從內地獲取素材在香港作機器學習(machine learning)並沒太大障礙,但他關注在內地未可使用Google、YouTube等平台,致北上研究時可運用的網上資料受限。他期望內地政府在平衡國安等風險下作適度放寬,促進大灣區內數據良性流通。

黃錦輝專長領域在網絡數據研究,他接受本報專訪時表示,其研究範疇所需的數據屬民間通用資料,例如新聞報道等,現時要從內地獲取並不困難,而用於訓練人工智能模型的標準訓練集包,亦可從內地科企網頁下載。然而在數據「北上」則遇障礙,他解釋,在內地未能使用Google、YouTube,使身在內地從事研究者,未能運用所需網絡資源。

如電視節目敏感內容可屏蔽

他建議內地當局可在平衡國安風險下,放寬網絡限制。他舉例,在內地收看本港電視台節目時,會屏蔽部分內容,建議可採取類似處理方法用於Google、Youtube,而非一刀切禁制相關平台,只限制敏感內容,「現時連TVB這樣情况也做不到、(境外網絡資訊)直頭過不到去(內地),對外國企業而言,可能會覺得不太方便」。

倡港科企可申內地醫療數據

國務院上月底公布的《河套深港科技創新合作深圳園區發展規劃》,便提出了在國家數據跨境傳輸安全管理制度框架下,研究建設固網接入國際互聯網的綠色通道。

另外,黃錦輝認為其他領域如醫療數據等應用場景一定愈多愈好,但在港或受地理局限,病例樣本只涵蓋本地,若可爭取內地數據南下,醫療研究學者便可分析更廣泛地域情况。他指本地院校已有既定渠道申請內地生物樣本南下,建議日後擴至科企亦可受惠,並以落馬洲河套區作緩衝區,由港深創新及科技園代辦申請手續,限科企人員只可在園區內運用數據;他認為政府有責任將從事創科工作的門檻拉低及理順。

(數據過河系列四)