By accepting you will be accessing a service provided by a third-party external to https://www.incgmedia.com/
編輯實測!影像工作者高關注的影片生成 AI 工具
AI 生成影片的工具如雨後春筍般出現,引發了業界廣泛的討論和正反評價。為此,編輯整理了近期討論度較高的影片生成 AI 工具,並綜合了過去採訪業界常用的工具,概覽近年 AI 工具的演變及進步空間,編輯嘗試輸入文字來生成影片,讓讀者一起看看相同的文字會生成出怎樣不同的影片。
Sora
OpenAI 以開發 ChatGPT 聞名,在 2024年 2 月 15 日 社群平台 X 公布全新的模型 Sora,該模型可根據文字提示生成長達 60 秒影片, 在 X 平台有許多生成式 AI 使用者已開始使用 Sora,並將該影片餵食給市面上的 3D 模型生成演算法,創造驚人的 3D 場景。5 月 2 日,首部以 Sora 製作的 MV 亮相,美國創作歌手 Washed Out 發行了新單曲〈The Hardest Part〉的 MV,這進一步展示了 Sora 的強大功能。
Veo
Google 年度開發者大會 I/O 於 2024年 5 月 14 日 晚間登場 (美國時間),發表了多項 AI 新工具,其中推出影像 AI 技術「Veo」可透過文字描述生成高達 1080p 的高畫質影片,目前影片長度最長可超過一分鐘。目標要跟 OpanAI 的 Sora 打對台,看誰能在影音生成領域稱霸,然而 Sora 已搶下眾人目光,Google 該如何擄獲使用者的心?因此,它不僅主打 YouTube Shorts 提供一條龍服務,官方積極與《蜘蛛人:返校日》演員 Donald Glover 合作影片 Demo,試圖在宣告公司的財力與公關宣傳力。
Lumiere
Google 內部的技術研究部門 Google Research,2024年 1 月底推出了一款全新的 AI 模型「Lumiere」,使用者可以純粹只用圖片與文字提示,就可以生成各式風格影片。另外,它改善市面生成式 AI 影片生成抖動的瑕疵,因此成品擁有更高的流暢度,但由於部分原因目前仍未開放使用,待未來釋出後,相信將成為最具指標性之一的 AI 工具。
Pika Labs
Pika Labs 目前已經被 AI 使用者廣泛的使用,它主要的功能有文字轉影片、圖片轉影片、影片轉影片,並且還可以轉化不同風格如:3D動畫、動漫感、電影風格的影片。目前只要用 Discord、Google 帳號即可登入使用,免費方案可以生成 3 秒,付費方案最多可生成到 15 秒。編輯這邊輸入一段《進擊的鼓手》文字描述(如下),看看 Pika Labs 會生成出怎樣的畫面。
A cavernous space. Sound-proofed walls. And in the center, a DRUM SET. Seated at it, in a sweat-marked white T, eyes zeroed on his single-stroke roll, is ANDREW NEIMAN. He's 19, slight, honors-student-skinny -- except for his arms, which have been built from years and years of drumming.
Runway
Runway 估計是目前生成影片 AI 工具中知名度最高之一。是由 Google 投資的一家線上影音剪輯製作公司,成立於 2018 年。該公司專注於提供各種 AI 影像編輯工具,包括背景移除、動態追踪、自動字幕等自動化工具,主要致力於降低影片創作的門檻,幫助使用者輕鬆製作出內容強大且富有創意的影音內容。2024 年 Runway 技術大躍進 7 月推出 Gen-3 短時間生成粒子、流體高難度特效目前免費方案可以生成 4 秒,付費方案可生成到 16 秒。編輯也輸入一段《進擊的鼓手》故事描述,看看Runway 會如何詮釋鼓手畫面。
Stable Video Diffusion
Stable Video Diffusion 是基於 Stable Diffusion 模型開發的,為 Stability AI 的一款新型AI 生成影片模型,可以根據文字描述或輸入的圖像轉換成 14 到 25 幀的影片,幀率可以自由調整,以及選擇你想要的運鏡形式、風格,可以免費生成 4 秒的影片,但是每天有使用限制,10 美元可以生成 50 支影片,50 美元可以生成 300 支影片。編輯也輸入一段《進擊的鼓手》故事描述,看看 Stable Diffusion Video 如何呈現鼓手畫面。
Luma AI
Luma AI 成立於 2021 年、一家專門研發 3D 內容生成的科技公司,在 2024 年 1 月初完成 B 輪融資,也就代表該公司的技術逐漸獲得市場認可。 2024 年 6 月 Luma AI 推出 Dream Machine,可以透果文字描述與圖片可以免費生成影片 5 秒,編輯也嘗試輸入《進擊的鼓手》故事描述,發現 Luma AI 較能掌握打鼓的姿態。Luma AI 是個基於 NeRF 神經輻射場技術的 AI 生成技術,不僅能藉由關鍵字生成 3D 物件,還可以上傳影片或是數張壓縮過的照片,重建逼真的 3D 場景。重點是,Luma AI 有推出手機 APP,只要一支手機,就能生成 3D 模型,並用於動畫、遊戲、建築設計、XR 展出、產品設計等領域,預計造成新一波的 AI 生成革命。
Genmo
Genmo 可以透過文字與圖片的搭配描述,免費生成長達 6 秒的影片,若升級 10 美元可以增加每天使用的點數。目前林宥嘉 MV〈一家人相親相愛〉也有應用到該 AI 工具,整體介面非常的好用直覺。也讓我們看看 Genmo 生成出來的《進擊的鼓手》。
Haiper ai
Haiper ai 主要功用有根據文字與圖片升成影片,目前免費使用可以生成 4 秒。另外,它還有重新繪製影片以及延長影片的功能。目前只要用 Discord、Google 帳號即可登入使用。也是製作林宥嘉 MV〈一家人相親相愛〉時有使用到的 AI 工具。
Krea AI
Krea AI 一大特色是讓創作者有更多自定義作品的空間,而非全權交由 AI 生成,好比說生成圖片可以讓創作者去設計構圖,甚至生成影片可以讓使用者設定關鍵幀。免費方案有生成次數限制以及生成 2k 畫質影片,付費方案可生成高達 4k 的畫質。
Kaiber
先前編輯撰寫「零預算」AI 電影《Our T2 Remake》該團隊運用了 Kaiber 來生成影片。 Kaiber 可以透過圖片與聲音轉化影片,編輯餵食了一張自己繪製的油畫,並點選自己想要的風格與角度,Kaiber 可以試用期 7 天可免費生成 6 秒影片,付費則可以生成長達 16 秒。
Vidu
來自中國的生數科技,上公布全新的生成模型 Vidu,主打中文使用者,僅要輸入文字描述,分別可以生成圖像、3D 模型以及影片。生成長度可長達 16 秒,畫質高達 1080P 。 Vidu 在架構上結合了目前很流行的兩種技術,包含 Diffusion 與 Transformer 模型,設計出原創的 U-ViT 架構。比起歐美的 AI 公司,從官方公布的影片中可看到 Vidu 對中國元素(熊貓、龍)的理解與生成,掌握度非常高。
Dreamina
字節跳動公司旗下的剪映軟體 2024 年 2 月 27 日,推出了一款 Dreamina 的 AI 工具。它可以文字生成圖片以及影片,可以在線上生圖片,但是影片生成需要登入抖音才可已使用。製作林宥嘉 MV〈一家人相親相愛〉時有也有使用到 Dreamina。
文章授權聲明
-
映CG 編輯整理
-
文章為映CG所有,如需轉載請標明出處