谷歌 DeepMind 公布为无声视频配音 AI 模型
卡饭网 6 月 21 日消息,据DeepMind新闻稿透露,DeepMind最新研发出一项“video-to-audio”AI模型技术,可为无声视频量身打造背景音乐。
目前该AI模型仍存局限,需开发者以提示词预先“描绘”视频可能的声响,尚不能直接依据视频画面添加具体音效。
据悉,模型会先将用户输入的视频进行拆解,再结合用户提供的文字提示,通过扩散模型反复运算,最终生成与视频画面相协调的背景声音。
例如,输入一段“黑暗中行走”的无声视频,并添加“电影、恐怖片、紧张氛围、脚步声”等提示词,模型便能生成符合恐怖风格的背景音效。
DeepMind 同时表示,该“video-to-audio”模型可以为任何视频生成无限数量的音轨,还能够通过提示词内容判断生成的音频“正向性”或“反向性”,从而令生成的声音更贴近某些特定场景。
猜你喜欢
更多-
谷歌安卓原生 Linux Terminal 终端应用上线
科技 2025-03-07
-
首销打五折!小米15 Ultra第二年碎屏保服务上线:仅249元
科技 2025-03-07
-
微信官宣瘦身!批量清理原图新功能来了 安卓、iOS均可使用
科技 2025-03-07
-
小米SU7 Ultra租车单日价格高达万元:一月内已约满 预计一年回本
科技 2025-03-07
-
日本 2 月进口纯电动汽车销量 1871 辆增长 9%,比亚迪增 21%
科技 2025-03-07