Connect with us

經濟

許健生:Sora成視頻製作殺手

發佈於

【明報專訊】記得去年差不多在這個時候,OpenAI推出了令全球使用者振奮的生成式人工智能(Generative Artificial Intelligence),ChatGPT不到兩個月便達上億用戶,GenAI更成為2023年最火的新興科技,而OpenAI一舉一動成為了全球創科界關注熱話。一年多後的2月15日,OpenAI發布了另一個令人目不暇給的文字生成人工智能視頻,簡稱「文生視頻」的Sora。

Sora團隊目前共15人,由博士學位同樣畢業於Berkeley AI Research Lab的Tim Brooks及Bill Peebles帶領,Tim是Dall-E 3作者之一,加入OpenAI前曾於Google參與開發Pixel手機,以及在Nvidia研究過視頻生成模型。而Bill則在Nvidia參與研究電腦視覺及分別曾在Adobe及Meta工作。Sora隊中還有3名華人,其中一名為北大畢業生Li Jing,更有一名00後的天才軟件工程師Will DePu等。

可將文字提示轉為高清視頻

人工智能於文字轉換成視頻──文生視頻的技術,其潛力足以顛覆廣告界、電影預告及短片產業,專家指OpenAI的Sora AI模型,必成為全球創科界矚目的焦點所在。這一多模式的大型語言模型,具有將文字提示轉化為高清視頻片段的強大功能,被視為生成式人工智慧發展的未來趨勢,必將為產業的再次進步提供強勁的助力。

行業觀察家認為,中國的科技企業應加大資源投入,積累更多訓練數據,增強計算力,並在人工智慧視頻生成領域培養專業人才。在A股市場,與AI相關股票持續走高。但國內在發展生成人工智能及今日討論的文生視頻目前最大的障礙便是缺乏高算力芯片。

自從美國去年禁止企業對中國輸出高算能的芯片後,如Nvidia的A100、H100、A800、H800等後,不少內地企業千方百計在公開巿場以高幾倍價錢購入這些GPU芯片,令開發時間及資金成本上升,嚴重影響開發進度。若中國不能解決算力增長的需求,將拉大與美國在發展人工智能賽道的距離。

能創建多角色特定動作等精細場景

據OpenAI在Sora網上發了的樣本視頻來看,Sora能夠在維持視覺質量的同時並生成長達一分鐘的視頻,比現在最好的Runway Gen 2、Pika等AI視頻工具的幾秒視頻强了幾倍。該模型能創建包含多角色、特定動作和主題背景的精細場景。它不僅能理解用戶提示中的需求,也對這些元素在現實世界中的呈現方式有深刻的理解。

北京中國互聯網數據中心主任劉興亮表示,Sora毫無疑問是人工智慧領域的一大突破及這展示了人工智慧在理解和創建複雜視覺內容上的先進能力,同時也為內容創作、娛樂業,尤其是電影和電視製作業帶來了前所未有的機遇與挑戰。視頻生成模型將幫助創作者以更快速度、更低成本將創意化為現實,為觀眾帶來更豐富多彩的視覺體驗。在未來,人工智慧預計將在人類生活的各個領域扮演更加重要的角色。

傳統視頻業需融合AI智慧 探索新藝術形式

隨着人工智慧技術的不斷進步,傳統的電影及電視製作流程和商業模式將可能面臨重塑,但這不意味着傳統行業將會消失,而是需要通過融合人工智慧技術,探索新的藝術形式和表達方式。

中國的人工智慧公司也在加強佈局人工智慧視頻生成領域。雲從科技宣布,他們已在文字轉換視頻的人工智慧技術上取得進展,且已經推出了數字人物生成平台;而數美視新也表示,該公司已大力投入視頻內容製作領域的資源,並將持續深耕於人工智慧生成內容的技術。

需要制定法規 確保內容真實性透明度

浙江大學國際商學院數字經濟與金融創新研究中心的聯席主任潘和林認為,作為具有顛覆性的技術和人工智慧發展的里程碑,Sora將極大提升視頻創作效率,對短視頻編輯和廣告產業造成深遠影響。人工智慧視頻生成模型需要大量人才、數據和計算力。開發這樣的模型需要對計算能力、算法和高質量數據有更嚴格的要求,並且需要進一步來促進數據流通。

中國網路安全公司360數字安全集團創始人周鴻禕表示,Sora或許對廣告界、電影預告片和短片行業造成巨大衝擊,但不見得能迅速超越TikTok,更可能成為TikTok的一種創意工具。

然而,筆者認為文生視頻的人工智慧模型也引發了倫理、版權保護、個人隱私和數據安全的擔憂。業內專家表示,確保內容的真實性和透明度已成為重要問題,需要制定相應的法規來確保技術的健康發展。

香港電腦商會前主席及WebX產業聯盟召集人

(本網發表的文章若提出批評,旨在指出相關制度、政策或措施存在錯誤或缺點,目的是促使矯正或消除這些錯誤或缺點,循合法途徑予以改善,絕無意圖煽動他人對政府或其他社群產生憎恨、不滿或敵意。)

[許健生 前沿科技]

繼續閱讀
贊助商