港聞
看圖說景物 文科生創AI導盲伙伴 初遭漠視現獲日美青睞 體會首要理解用家所需

【明報專訊】「你面前是一間會議室,裏面有桌子、椅子、投影機,還有一瓶水。」將半隻手掌大小的鏡頭裝置夾在衣領,連接手機應用程式,按鍵後等候數秒,系統以人工智能(AI)分析照片後轉換成文字,再用語音告知視障者眼前景物。在港土生土長、孟加拉裔的Lamia Sreya Rahman本身是文科背景,卻踏上創科之路,研發出輔助視障者識別環境的裝置。她接受本報專訪談到途中跌宕,其研發成果由最初被當學生功課而不獲重視,到現在遠至美國和日本都有機構採用,體會到理解用家需要至為重要。她說:「對視障人士而言,裝置不是任何醫療輔助工具,而是他們的伙伴。」
4辨識模式 助讀書閱包裝
Lamia與拍檔Turzo Bose於2021年成立初創企業Vidi Labs,她目前是公司營運總監,Turzo任行政總裁,其團隊研發的Seekr裝置現時已是第四版本,具4個辨識模式,包括「文字」、「場景」、「距離」和「市場」,切合視障者需要,例如「文字」模式可用於閱讀書本、餐牌;「市場」則可識別產品包裝上的文字,以語音告知用家手上是「一包薯片」及產品到期日和營養資訊等。該裝置獲香港、美國和日本等地醫院、學校及非政府機構(NGO)採用,Lamia更列入福布斯2025年度「亞洲30位30歲以下菁英榜」社會影響領域名單。
疫下當義工結識視障者
決心填補白杖導盲犬缺口
「第一個版本是在2019年,當時裝置只會說『你有一罐可樂』。」6年後,Lamia手上裝置的功能及設計與當年已不能同日而語。她說以往從沒想過從事創科,直至在新冠疫情期間到元朗和天水圍做義工派發關愛包,結識一名視障者,對方告訴她雖有白杖和導盲犬輔助,但一些基本生活需要,例如到商店購物,仍難獨自完成。她因此決心開發AI裝置,助視障者解難。
被質疑學生功課沒用 游說一年
Lamia當時除在課餘學習編程,亦透過在媒體撰文,結識到祖父是視障者的Turzo,兩人其後合作創業及研發Seekr。她說,最初對方提出的意念是將白杖與鏡頭結合,但她認為若裝置不能將所見變成聲音,難為用家帶來幫助,在磨合後研發了現時產品的原型。不過,他們未幾便遇到首個難題,嘗試與視障者、NGO接觸時,被質疑「只是學生功課、沒用」,結果花了約一年游說,才找到用家試用及給予意見,產品始有發展基礎。
重視回饋 蒐雪糕筒茶記相訓練
她留意到不少從事創科的人多將注意力放在技術是否先進,卻忘了產品本身是否能與用家生活相融,因此她們尤其重視用家回饋,亦了解到視障者有一些他們以往沒想像過的需要。她提到有行山的視障者回饋,以往要靠雙腳感受前方是否有石塊阻擋,希望裝置能告知用家有否石塊;亦曾有視障跑者說希望裝置告訴他前面有否「雪糕筒」,她與團隊隨即到街上收集照片訓練系統。
大學一般會為視障學生提供凸字書、錄音等輔助學習,Lamia說,在與用家接觸時了解到學生的需要不止於此,而是冀知道教授在課堂上的動態,裝置現時能告知用家教授正指向什麼東西、現時要回答的問題等。她說,為令系統能照顧港人生活習慣,團隊曾登上小巴、巴士和的士等場景,甚至到餐廳收集照片做訓練,「(現在)走進茶餐廳,裝置可告訴用家哪杯是凍奶茶、哪杯是凍檸茶」。
仍有缺陷 測試者供數據改良
Lamia說,目前團隊恆常獲約100名來自香港、美國及日本的測試者自願提供數據助改善系統,但她稱現時版本仍有缺陷,有用家以往曾在尖沙嘴街頭因人流聚集,裝置在影片模式下不斷讀出「有一個人、有一個人」,令用家決定關閉裝置,故現時版本不設影片功能,只能拍照。她說會在下一版本改良,系統會實時歸納人數,並優先描述與用家距離較近的事物,為視障者提供最重要資訊,預計6個月後推出。
現時版本的Seekr裝置售價約6000元,並以每月約80元使用手機應用程式服務,兩者配合使用。
明報記者 鄭律銘
日報新聞-相關報道:
文科出身助易地而處 法律背景善應對抄襲 (2025-07-23)
