照片秒变舞者,阿里大模型火了

首页 热门新闻 最新资讯

照片秒变舞者,阿里大模型火了

热搜大全 2024-01-11

只要一张照片就能生成一段舞蹈视频,又一个大模型应用出圈!

2024 年第一个工作日开始,兵马俑、马斯克以及各地网友跳科目三和网红舞的视频就陆续在国内社交媒体和朋友圈刷屏。这些大约 10 秒左右的视频都不是真人出镜,均由大模型生成,这种低门槛的「跳舞」方式引发了网友的广泛体验,掀起了一波斗舞潮。各路网友金句频出:AI 治愈了我的四肢不协调、科目三的风吹到了考古界、再也不用担心跳科目三崴脚 ……

照片秒变舞者,阿里大模型火了

这是阿里云通义千问 APP 上线的免费功能,在通义千问 APP 内输入 " 通义舞王 "、" 全民舞王 " 等口令后,即可进入体验页面。用户按照提示要求上传照片后,十几分钟即可生成神形兼备的舞蹈视频,生成的视频能较好地保留原形象的面部表情、身材比例、服装以及背景等特征。目前,通义千问首批为用户提供了科目三、蒙古舞、划桨步、鬼步舞等 12 种热门舞蹈模板。

照片秒变舞者,阿里大模型火了

据悉,该功能背后的算法为阿里通义实验室自研视频生成模型 Animate Anyone。早在 11 月底,该研究便在推特、Youtube 等海外社交媒体平台爆火,相关视频播放量超 1 亿,项目在 Github 上的 Star 短短数日就超过 1 万,是近期大模型领域最受欢迎的大模型算法之一,国外开发者和网友集体称赞该算法效果,并发出 " 开放体验入口 " 的呼声。照片秒变舞者,阿里大模型火了

除了惊艳的生成效果之外,该算法的技术路线也被广泛关注。视频生成是大模型领域最热门的研究方向之一,谷歌、Meta、Runway 等国外科技公司都在积极布局,但一直以来,人物形象的视频生成面临诸多技术挑战,例如人物形象一致、动作流畅可控、时序无瑕疵的人物动作视频。

根据公开论文显示,Animate Anyone 集成了多项创新技术,引入了 ReferenceNet,用于捕捉和保留原图像信息,可高度还原人物、表情及服装细节;此外,该算法使用了高效的 Pose Guider 姿态引导器 ,保证了动作的精准可控;另外,通过时序生成模块,有效保证视频帧间的连贯流畅性。在相同数据集的测试下,Animate Anyone 的性能表现显著优于国内外同类模型。

今年 9 月,通义千问成国内首批通过备案的大模型,通义千问 APP 上线后功能持续升级,目前可提供文本对话、语音对话、翻译、PPT 大纲助手、小红书文案、视频生成等几十项功能。

最受喜欢

科目 舞蹈 通义千问 ai 热点 本地 社区 美图 视频 直播 资讯 新闻

曾被卖出19万美元高价!这台初代iPhone太猛了

曾被卖出19万美元高价!这台初代iPhone太猛了

科技热搜 iphone 智能手机 乔布斯 本初 谷歌 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

科技热搜 微软 机器人 小米 马斯克 欧盟 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

科技热搜 战神 steam 自杀小队 安德森 ceo 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

科技热搜 it之家 macbook 专利 传感器 苹果公司 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

科技热搜 台积电 三星 芯片 高通 半导体 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13