字节OmniHuman一张图配上音频，就能直接生成会说话的数字分身

2025-02-11 10:28

元宇宙阅读实验室

近日，字节跳动数字人团队推出了新的多模态数字人方案OmniHuman，其可以对任意尺寸和人物占比的单张图片结合一段输入的音频进行视频生成，生成的人物视频效果生动，具有非常高的自然度。

即梦 AI 相关负责人透露，该模型未来会进行小范围内测，官方也会对这一功能设置严格的安全审核机制，并对输出的视频标注水印以作提醒。

业内人士表示，OmniHuman通过引入多模态条件驱动和全条件训练策略，成功解决了人类动画生成领域长期存在的数据扩展和泛化能力问题。

这一发展出现在AI视频生成技术竞争日益激烈的背景下，谷歌、Meta和微软等公司也在积极追逐类似技术。

个人用户、MCN 机构等都能利用它快速生成虚拟主播、虚拟偶像、虚拟客服、虚拟教育等各种形式的数字人内容，为商业化变现提供更多可能。

字节跳动表示，和一些只能生成面部或上半身动画的深度伪造技术不同，OmniHuman-1 能够生成逼真的全身动画，且能将手势和面部表情与语音或音乐精准同步。

传统 AI 数字人模型多基于姿势驱动或音频驱动，OmniHuman 则可以基于单个人体图像和运动信号，如仅音频、仅视频或音频和视频的组合生成人体视频，极大地降低内容创作的门槛。

声明：凡注明为其它来源的由光网号的作者撰写，观点仅代表作者本人，不代表平台立场。

数字人 AI大模型人工智能

收藏

举报

喜欢就给个赏吧

0人已打赏

images

相关推荐

利亚德、洲明等LED企业宣布接入DeepSeek

LEDinside

6小时前

洲明科技利亚德 AI

两则“车路云一体化”试点城市最新进展消息

灯杆智慧说

6小时前

车路云一体化

又一个百亿级LED项目开工

行家说Display

7小时前

亿级 LED项目

“国潮+夜游”，年轻人驱动下的“中式夜游”沉浸营造差异化文旅

沉浸城市

7小时前

文旅行业沉浸式夜游中式夜游

森林+光影，文旅融合与绿色发展新赛道

青蓝文旅

10小时前

文旅行业文旅融合森林夜游

冰雪、科技、艺术的梦幻联动，这场开幕式震撼全场

阿拉丁照明网

10小时前

数字科技亚冬会舞台设计

单项破5亿！河南郑州、福州福清等地多个文旅项目进度更新

城市光网

10小时前

文旅行业文旅项目

字节OmniHuman一张图配上音频，就能直接生成会说话的数字分身

元宇宙阅读实验室

11小时前

数字人 AI大模型人工智能

国产AI眼镜再掀风云，“顶流”雷军或携新品来袭

新浪VR

11小时前

AI眼镜人工智能小米

DeepSeek火爆全网！阳光照明多次涨停！它们居然还有这层关系？！

大照明

11小时前

人工智能阳光照明 AI大模型

{{Spin?"加载中...":"没有更多内容"}}

元宇宙阅读实验室

+关注

已关注

TA的热门作品

福布斯预测：2025年AI产业链十大剧变

北京市教育领域人工智能应用工作方案发布

杭州上城区发布关于加快元宇宙产业创新发展措施

资讯｜北京首个AIGC视听产业创新中心启动建设

《教育新语》：AI将如何重塑教育的未来?

查看更多

头条热榜

1 2025年旅游新趋势：100余座城市旅游市场全景解析 2 中国，电影！春节档折射的行业启示！ 3 热辣开年！云台山非遗中国年燃爆新春！ 4 2024年各省及百家城市旅游“成绩单” 5 总投资超800亿元，BOE、维信诺、惠科、TCL、视源等28个MLED等显示项目1月最新进展 6 数字化技术如何引领文旅消费新趋势？ 7 “年味游”撞上“蛇年春节”，春节申遗成功后引发文旅新热潮 8 沙特首都点亮“中国红”欢庆春节！

精彩视频

2025 Joy Awards沉浸式舞台，一起穿越光影之境！

揭秘拜尔斯道夫“魔法时刻”！档案馆新体验：旋转、滚动，遇见历史

「NAKED OCEAN深海幻旅」沉浸式数字体验空间

当体育赛事进入“未来”，看2024未来运动会开幕式如何打破界限！

互动投影演绎北汉山形成过程和四季的变化

沉浸式空间《滤镜之下》

举报

广告

重复、旧闻

格式问题

低俗

标题夸张

与事实不符

疑似抄袭

意见反馈

城市光网微信平台

城市光网小程序

返回顶部