Connect with us

即時熱點

AI智慧應用|長片字幕生成免費工具 Good Tape可逐句回播 離線版Whisper Transcription夠快 (11:09)

發佈於

為半小時的影片貼上字幕,相信是不少人的噩夢,但現今透過人工智能(AI),影片字幕毋須再靠人手。明報電子平台組實測兩款建基於OpenAI Whisper技術的語音生成字幕工具「Good Tape」及「Whisper Transcription」,以免費版測試將一段約半小時廣東話影片變成書面語、繁體中文字幕的所需時間及準確度。

Good Tape簡介

Good Tape是丹麥網媒Zetland ApS創立的網頁版工具【網站連結】,免費版可為最長30分鐘的語音生成字幕,每月最多生成3段語音;付費版(每月9歐元起,約76港元)不限影片及錄音長度,生成速度亦會加快。Good Tape表示,所有錄音均加密傳輸,私隱度高,用戶可自行選擇是否在網頁中保留錄音。

測試結果:

.生成文字後,用戶可逐句回播錄音

.可選擇導出檔案格式,如TXT和SRT等

.生成需時約1小時

.部分內容變成簡體中文

.大部分內容未有以標點分隔

.有錯字,如「哈密瓜」變「蝦蜜瓜」、「熊本」變「紅本」等

Whisper Transcription簡介

Whisper Transcription是蘋果Mac機應用程式【下載連結】,提供離線使用,生成內容直接儲存在電腦內。免費版未有限制語音長度,官方稱付費版(每周38元起)可生成更高質素內容,並享用AI整合、校對、點列的功能。Whisper Transcription提供錄音功能,讓用戶在開會時錄音,會議後可將內容轉換文字,生成會議紀錄。【Whisper Transcription使用教學】

測試結果:

.生成需時僅約一分半鐘

.可選擇導出檔案格式,如TXT和SRT等

.可拉動時間軸到特定句子,再播放錄音

.有錯字,如將「哈密瓜」變成「蝦密瓜」、「欖球」變「籃球」等

.有時可分辨不同講者身分,惟大部分都未有標示