从AI写真到AI扩图,图像应用更易出圈?

首页 热门新闻 最新资讯

从AI写真到AI扩图,图像应用更易出圈?

热搜大全 2023-10-20

从AI写真到AI扩图,图像应用更易出圈?

不久前人们还忙着在妙鸭相机排队生成写真,转眼间又开始到美图秀秀使用 AI 扩图了。

早在 7 月,美图秀秀官方微博就曾发文,称 "AI 扩图 " 功能现已上线,美图秀秀 App 和 Wink App 均可以立刻体验 AI 扩图功能。而最近,妙鸭逐渐淡出互联网,AI 扩图却接替了讨论热度。

而近日,快手自研文生图大模型 " 可图 "(Kolors) 也开启内测。

事实上,从 ChatGPT 火爆全网后,国内的 AI 相关应用也相继出现在大众视野,但从此前的妙鸭,再到如今的美图秀秀,在 C 端出圈的多以图片生成类应用为主。

美图秀秀 " 截胡 " 妙鸭,快手在后?

"AI 扩图也太牛了,直接拯救旅游废片 "

" 我真的要报警了,AI 扩图出来的效果又搞笑又离谱 "

"AI 扩图扩得不错,下次不扩了 "

……

最近在各大社交媒体平台,不难见到类似的美图秀秀 AI 扩图分享。

据官方介绍,该功能基于 AI 算法智能识别,可根据图像的上下文和纹理,预测、生成缺失的部分,能够为原始图片带来更大画幅、更广视角。

目前在美图秀秀 App 首页可找到入口,每人每天有 5 次免费体验机会,可对图像进行 150%、200%、250%、300% 四种不同比例的扩图,系统预设比例为 125%。

锌刻度留意到,在微博、小红书等社交媒体平台,已有不少网友发布自己的 AI 扩图图片。小红书上 #AI 扩图 # 话题已有高达 2128.4 万的浏览量,而抖音上同样的话题则有超两百万次播放量。其中在小红书上,最热的一篇相关笔记 " 被 AI 扩图吓晕,AI 你的审美别太好 " 点赞量达 3.3 万。

不过,AI 扩图出圈也呈现出两极评论,大部分需求为 " 调整构图,完善背景 " 的图片之所以出圈是因为效果不错,但也有不少令人直呼 " 离谱 " 的图片催化了 AI 扩图出圈,其中包括扩图时被补充了奇怪的衣服、增加了奇怪的肢体、出现了陌生的脸庞、悬浮在水中的头颅等等。

从AI写真到AI扩图,图像应用更易出圈?

部分出圈的 AI 扩图照片

事实上,AI 扩图并不算新鲜事物。早在今年五月底,Adobe Photoshop 测试版上线了一个名为 "Generative Fill" 的 AI 图像合成工具;今年七月份,Midjourney 则更新了 " 平移扩图 " 功能,可以将图片自由前后平移,相较于之前推出的 "Zoom Out" 功能里只能固定的 " 扩图 1.5 倍 " 或 " 扩图 2 倍 ",显得更加人性化。

但对于国内的大部分人而言,对 AI 扩图的应用还是从美图秀秀开始的。目前对 AI 扩图的讨论也主要聚焦于美图秀秀。

值得一提的是,上一次引发对 AI 图片应用讨论热潮的,还是可以生成个人写真的妙鸭相机和生成芭比写真的 "45AI"。然而,几个月过去,在社交媒体上,这两款小程序的讨论度已然下跌,取而代之的是或离谱、或吓人或 " 真香 " 的 AI 扩图。

如果说目前美图秀秀凭借 AI 扩图顺利 " 截胡 " 妙鸭,那不得不提醒一句,还有快手在后。

9 月,快手在短视频评论开始内测 " 快手 AI 玩评 ",而据官方介绍,快手 "AI 玩评 " 依托于快手自研文生图大模型 " 可图 "(Kolors)强大的图像生成能力,用户可以通过输入各种创意文字,一键生成海量风格图片,可以更轻松、便捷地在评论区进行趣味互动。

不过,目前在各大社交媒体平台关于 " 可图 " 的讨论还较少。

为何图片生成类应用更易出圈?

回溯近几年来,国内 AIGC 真正意义上破圈的现象级产品似乎大多都诞生在图片这条赛道。

"AI 对话类的也玩过,但总觉得对话很傻,也并不如想象中有趣。但是像妙鸭、AI 扩图我都用过,确实会经常收到意料之外的图片啊,不管是离谱的还是效果不错的,在社交平台发出来的讨论度都还不错。"20 岁的桃子常年刷社交平台,对一切新鲜事物都很好奇,但相较于 ChatGPT 这一类的对话式 AI,她更乐于尝试图片类应用。

" 图像相关的应用软件确实更容易被用户接受和使用,因为在应用层面,人们对图像 ai 功能的要求偏工具化,用户对 ai 的预期是很明确的。" 祁隋是国内一科技企业的算法工程师,他告诉锌刻度,图片类应用更容易出圈还有技术方面的原因," 从全球来看,近 10 年的 AI 浪潮是从 2012 年的一场名为 ImageNet 的图像识别比赛中萌芽,所以 AI 模型结构也更适合在图像上应用,效果和效率都比文字更好,而在文字上的应用一直到 2018 年 Transformer 结构被发明出来后,才算勉强势均力敌,应用领域离 C 端也相对较远,直到最近找到了生成式 AI 这个突破口,被大众所熟知。"

而在中国,文字内容生成比图像内容生成的难度也更大," 因为文本训练需要大量高质量的数据,中文数据从质和量上肯定都比英文数据更有挑战性。尤其是对话式 AI 是开放式的,任务也更为多元,对于数据质量和数量的需求更是跃升了一个量级。" 祁隋称。

不过,在祁隋看来,未来 AI 的发展方向是图像 文本的多模态大模型。"36 氪 " 此前也曾提到,想要更接近通用人工智能,提高 AI 对图像、语音、视频等多模态内容的理解不可或缺。相较于注重文本交互的单模态语言模型,多模态模型能将 AI 领域拓展至识别、检测等更广泛的领域。

那么,下一个引发现象级关注的 AI 应用又会是什么呢?

最受喜欢

妙鸭相机 美图秀秀 快手 ai 热点 本地 社区 美图 视频 直播 资讯 新闻

曾被卖出19万美元高价!这台初代iPhone太猛了

曾被卖出19万美元高价!这台初代iPhone太猛了

科技热搜 iphone 智能手机 乔布斯 本初 谷歌 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

科技热搜 微软 机器人 小米 马斯克 欧盟 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

科技热搜 战神 steam 自杀小队 安德森 ceo 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

科技热搜 it之家 macbook 专利 传感器 苹果公司 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

科技热搜 台积电 三星 芯片 高通 半导体 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13