Google 發表影像 AI 技術「Veo」，詠唱文字即生成高品質影片，整合 YouTube Shorts 平台提供一條龍服務！

軟硬體新訊

葉致廷

2024-05-15, 週三

Google 年度開發者大會 I/O 於 5/14 晚間登場 (美國時間)，發表了多項 AI 新工具，其中推出影像 AI 技術「Veo」是要跟 OpanAI 的 Sora 打對台，看誰能在影音生成領域稱霸，然而 Sora 已搶下眾人目光，Google 該如何擄獲使用者的心，官方計出與《蜘蛛人：返校日》演員 Donald Glover 合作影片 Demo，試圖在宣告公司的財力與公關宣傳力。就跟著映CG編輯一起來看影像 AI 技術「Veo」有什麼特點？

結合旗下 YouTube Shorts 等影音平台，「Veo」將成為網路影音工具霸主？

「Veo」能透過文字與參考圖像輸入生成超過一分鐘的 1080p 高畫質影音，並生成各種電影視覺風格與鏡頭移動。官方表示，「Veo」對視覺語言有著深層的了解，可以精準捕捉文字中的細微差別，在影像呈現錯綜複雜的細節。使用者也可同時上傳影片與輸入文字，將文字生成影像加入原有的影片，創造新的影片。另外，它還支援遮罩編輯，使用者可以在影片和文字中添加遮罩，即可改變影片的特定區域。

對編輯來說最棒的一點是，過往影像 AI 技術因為生成不一致常有幀與幀之間意外閃爍、跳躍或變形問題，使視覺不連貫，破壞觀影體驗。但「Veo」的尖端潛在擴散變壓器將會減少這些問題的發生，使角色、物件、場景與風格都保持原位，宛如拍攝真實世界一般。

官方也提到「Veo」會先在 VideoFX 工具中向部分創作者開放，之後會整合到 YouTube Shorts 和其他產品中，這點可說是 Google 最大的武器，假設「Veo」成為 YouTube Shorts 的內建功能，將能廣納更多創作者使用。

該影片的文字提示：

在熙熙攘攘的反烏托邦蔓延中快速拍攝，明亮的霓虹燈招牌、飛行的汽車和薄霧、夜晚、鏡頭光暈、體積照明。

一個快速追蹤鏡頭，穿過一個未來主義的反烏托邦蔓延，有明亮的霓虹燈標誌、天空中的星際飛船、夜晚、體積照明。

以最高速度行駛的汽車的霓虹燈全息圖，光速，電影，令人難以置信的細節，體積照明。

汽車離開隧道，回到現實世界的城市香港。

AI、現實傻傻分不清楚，新增浮水印辨識創作本質

「Veo」的訓練是多年影像生成工作的結合，包括生成查詢網路（GQN）、DVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet 和 Lumiere，以及 Google 的 Transformer 架構和 Gemini。為了讓「Veo」更準確理解文字，官方為每個餵食的影片增加更多細節描述。也使用高品質的壓縮影片，提升模型性能，增加整體生成的品質，並減少生成影片的等待時間。

另外，Veo 生成的影片會使用 SynthID 進行浮水印，所有影片都會經過安全篩檢程式和記憶檢查流程，有助於降低隱私、版權風險。

延伸閱讀：OpenAI 推出影片生成式模型 Sora，輸入關鍵字可生成高達 60 秒的影片與動畫

invalid quix collection shortcode!

文章授權聲明

文章類型
映CG 編輯整理
資料來源
Google
版權聲明
文章為映CG所有，如需轉載請標明出處

標籤：

Google Veo

最新活動

Google 發表影像 AI 技術「Veo」，詠唱文字即生成高品質影片，整合 YouTube Shorts 平台提供一條龍服務！

文章授權聲明

相關文章

TOP HITS

視效素材下載

© 映CG / InCG Media All rights reserved.

最新活動

Google 發表影像 AI 技術「Veo」，詠唱文字即生成高品質影片，整合 YouTube Shorts 平台提供一條龍服務！

文章授權聲明

相關文章

疫情當道，跨國合作正夯！與台灣藝術家暢談 Google 動態廣告的創作歷程

動態設計界的台灣之光！Bito 打敗 YouTube，榮獲美國動畫獎 The Motion Awards 的首獎肯定

AI 新巨星誕生！Google 推出自家首款生成式 AI「Lumiere」，透過 4 大功能與全新開發架構，賦予文字與圖片無限可能性

TRENDING

TOP HITS

視效素材下載

訂閱電子報

© 映CG / InCG Media All rights reserved.

登入您的帳號