从AI写真到AI扩图，图像应用更易出圈？

热搜大全 2023-10-20

不久前人们还忙着在妙鸭相机排队生成写真，转眼间又开始到美图秀秀使用 AI 扩图了。

早在 7 月，美图秀秀官方微博就曾发文，称 "AI 扩图 " 功能现已上线，美图秀秀 App 和 Wink App 均可以立刻体验 AI 扩图功能。而最近，妙鸭逐渐淡出互联网，AI 扩图却接替了讨论热度。

而近日，快手自研文生图大模型 " 可图 "（Kolors）也开启内测。

事实上，从 ChatGPT 火爆全网后，国内的 AI 相关应用也相继出现在大众视野，但从此前的妙鸭，再到如今的美图秀秀，在 C 端出圈的多以图片生成类应用为主。

美图秀秀 " 截胡 " 妙鸭，快手在后？

"AI 扩图也太牛了，直接拯救旅游废片 "

" 我真的要报警了，AI 扩图出来的效果又搞笑又离谱 "

"AI 扩图扩得不错，下次不扩了 "

……

最近在各大社交媒体平台，不难见到类似的美图秀秀 AI 扩图分享。

据官方介绍，该功能基于 AI 算法智能识别，可根据图像的上下文和纹理，预测、生成缺失的部分，能够为原始图片带来更大画幅、更广视角。

目前在美图秀秀 App 首页可找到入口，每人每天有 5 次免费体验机会，可对图像进行 150%、200%、250%、300% 四种不同比例的扩图，系统预设比例为 125%。

锌刻度留意到，在微博、小红书等社交媒体平台，已有不少网友发布自己的 AI 扩图图片。小红书上 #AI 扩图 # 话题已有高达 2128.4 万的浏览量，而抖音上同样的话题则有超两百万次播放量。其中在小红书上，最热的一篇相关笔记 " 被 AI 扩图吓晕，AI 你的审美别太好 " 点赞量达 3.3 万。

不过，AI 扩图出圈也呈现出两极评论，大部分需求为 " 调整构图，完善背景 " 的图片之所以出圈是因为效果不错，但也有不少令人直呼 " 离谱 " 的图片催化了 AI 扩图出圈，其中包括扩图时被补充了奇怪的衣服、增加了奇怪的肢体、出现了陌生的脸庞、悬浮在水中的头颅等等。

从AI写真到AI扩图，图像应用更易出圈？

部分出圈的 AI 扩图照片

事实上，AI 扩图并不算新鲜事物。早在今年五月底，Adobe Photoshop 测试版上线了一个名为 "Generative Fill" 的 AI 图像合成工具；今年七月份，Midjourney 则更新了 " 平移扩图 " 功能，可以将图片自由前后平移，相较于之前推出的 "Zoom Out" 功能里只能固定的 " 扩图 1.5 倍 " 或 " 扩图 2 倍 "，显得更加人性化。

但对于国内的大部分人而言，对 AI 扩图的应用还是从美图秀秀开始的。目前对 AI 扩图的讨论也主要聚焦于美图秀秀。

值得一提的是，上一次引发对 AI 图片应用讨论热潮的，还是可以生成个人写真的妙鸭相机和生成芭比写真的 "45AI"。然而，几个月过去，在社交媒体上，这两款小程序的讨论度已然下跌，取而代之的是或离谱、或吓人或 " 真香 " 的 AI 扩图。

如果说目前美图秀秀凭借 AI 扩图顺利 " 截胡 " 妙鸭，那不得不提醒一句，还有快手在后。

9 月，快手在短视频评论开始内测 " 快手 AI 玩评 "，而据官方介绍，快手 "AI 玩评 " 依托于快手自研文生图大模型 " 可图 "（Kolors）强大的图像生成能力，用户可以通过输入各种创意文字，一键生成海量风格图片，可以更轻松、便捷地在评论区进行趣味互动。

不过，目前在各大社交媒体平台关于 " 可图 " 的讨论还较少。

为何图片生成类应用更易出圈？

回溯近几年来，国内 AIGC 真正意义上破圈的现象级产品似乎大多都诞生在图片这条赛道。

"AI 对话类的也玩过，但总觉得对话很傻，也并不如想象中有趣。但是像妙鸭、AI 扩图我都用过，确实会经常收到意料之外的图片啊，不管是离谱的还是效果不错的，在社交平台发出来的讨论度都还不错。"20 岁的桃子常年刷社交平台，对一切新鲜事物都很好奇，但相较于 ChatGPT 这一类的对话式 AI，她更乐于尝试图片类应用。

" 图像相关的应用软件确实更容易被用户接受和使用，因为在应用层面，人们对图像 ai 功能的要求偏工具化，用户对 ai 的预期是很明确的。" 祁隋是国内一科技企业的算法工程师，他告诉锌刻度，图片类应用更容易出圈还有技术方面的原因，" 从全球来看，近 10 年的 AI 浪潮是从 2012 年的一场名为 ImageNet 的图像识别比赛中萌芽，所以 AI 模型结构也更适合在图像上应用，效果和效率都比文字更好，而在文字上的应用一直到 2018 年 Transformer 结构被发明出来后，才算勉强势均力敌，应用领域离 C 端也相对较远，直到最近找到了生成式 AI 这个突破口，被大众所熟知。"

而在中国，文字内容生成比图像内容生成的难度也更大，" 因为文本训练需要大量高质量的数据，中文数据从质和量上肯定都比英文数据更有挑战性。尤其是对话式 AI 是开放式的，任务也更为多元，对于数据质量和数量的需求更是跃升了一个量级。" 祁隋称。

不过，在祁隋看来，未来 AI 的发展方向是图像文本的多模态大模型。"36 氪 " 此前也曾提到，想要更接近通用人工智能，提高 AI 对图像、语音、视频等多模态内容的理解不可或缺。相较于注重文本交互的单模态语言模型，多模态模型能将 AI 领域拓展至识别、检测等更广泛的领域。

那么，下一个引发现象级关注的 AI 应用又会是什么呢？

从AI写真到AI扩图，图像应用更易出圈？

从AI写真到AI扩图，图像应用更易出圈？

最受喜欢

曾被卖出19万美元高价！这台初代iPhone太猛了

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

在游戏里搞政治正确的幕后黑手，快被外国网友冲烂了。

苹果 MacBook 新专利获批：可录制3D 图像/视频、追踪空中手势

芯片代工营收排行榜公布：台积电独占六成，狂揽近200亿美元