字节豆包SeedEdit上线,AI修图成大厂AI应用新焦点?
创始人
2024-11-14 17:55:22

首先,小雷是对设计一窍不通的,毕竟我不是干设计这一行的。

但是嘛,这只要浸淫在互联网上的人,多少应该都会对传说中设计行业里那几道百年难得一遇的亘古难题,还有各种奇葩甲方才会提出的变态要求有所耳闻。

有道是,你的图片做得很好,那让画面里的大象转个身应该没有什么困难吧。

有道是,你的黑色有些单调,我希望能够看到一种五彩斑斓的黑色呢。

就不说设计师们看到这些会不会气血上涌了,我一个负责文字工作的人,看到这种批注都有点难顶。

重点是你也不能说些什么,要知道画面另一头就是金主爸爸,而且他们对这些是真的不懂

到头来,工作就是工作,不管甲方要求有多离谱都得去做,哪怕客户要你把他照片里的拉链给拉上,你能做到的也只有截个图发到社交媒体上给大伙乐一乐,然后为了生活想尽办法去解决问题。

(图源:新浪微博)

不过,凡是问题,终究是会有解决办法的,只是这次的解决办法可能有点特殊。

昨天,字节跳动的豆包大模型团队,在公众号上秀出了最新的通用图像编辑模型SeedEdit。

官方表示,这款模型主打的就是「让一句话轻松P图成为现实」,用户只需输入简单的自然语言,便可对图像进行多样化编辑操作,包括修图、换装、美化、风格转化以及在指定区域添加或删除元素等。

听起来很不可思议?其实我也是这么觉得的。

让大象转个身

想体验这个功能的话,其实还蛮简单的就是了。

根据官方的说法,目前该模型已经在豆包PC端即梦网页端开启测试,豆包手机端暂时还用不了这个功能。

接下来,只要点击侧边栏的「图片生成」,应该就能看到上传参考图的选项了,这里就是SeedEdit模型的入口。

要做的事情很简单,上传图片,然后输入我们想要改变的内容。

比方说,像画面里面这种大象背对我们喝水的照片,如果我想让它转身的话,那应该怎么做呢?

答案是,输入「让大象面对我」。

(图源:雷科技)

对比一下两张图片。

可以看到,SeedEdit生成的大象正面是非常合乎逻辑的,耳朵的形状、脚部的位置、身体的颜色都做得相当不错,周围的环境也保持了高度的一致,当然部分石头形状存在差异这点,细心点还是能看出来的。

(图源:雷科技)

生成后的图片还可以再次编辑,这点真的很棒。

(图源:雷科技)

不过进一步的操作,似乎就无法实现了。

我在豆包修改过的图片基础上,继续提出图片编辑的要求,但不论是「让大象跑起来」、「让大象用鼻子喷水」或者是「让大象侧过身子」,基本上很难得到令人满意的结果。

叫它喷水,结果这水确实是喷出来了,但却不是从鼻子里喷出来的,而是从象牙的部分喷出来的。

想让大模型理解啥叫作常识,确实不是件容易的事情。

(图源:雷科技)

再换个人像,或者说模型的照片试试。

因为我家里环境有限嘛,所以一般来说,拍手办的背景就比较凑合,没有时间也没有啥精力去造景拍摄。

不过现在嘛,我让它「把背景换成城市」

(图源:雷科技)

效果有点平?那就改成「夕阳西下的光照质感」。

你还真别说,这感觉马上就到位了,整个过程中,我只对豆包说了简单的两句要求,体验起来真的很丝滑。

对贫困的胶佬来说,布景和打光的繁琐步骤或许真的能省略掉了。

(图源:雷科技)

当然,这些都是在原图上的小打小闹,如果我想直接更换画面主体呢?

比如「指鹿为马」

(图源:雷科技)

实际生成的效果确实很不错,不仅草地背景保留得挺完整,连马身上的纹理之类的都进行了替换。

如果不看原图,基本很难察觉比例上的问题。

换衣服也没啥问题,连光影和褶皱都改得挺到位的。

(图源:雷科技)

试了一下汽车,目前SeedEdit是不认识小米SU7的。

不过我随便传了一张五菱宏光Mini EV的照片上去,然后输入了一个异常复杂的编辑指令。

(图源:雷科技)

最后生成的车子,虽然不像玛莎拉蒂,但起码也有个跑车形状了。

AI修图,爆发在即

事实上,如今AI在绘画这块儿,已经能让我们眼前一亮了。

但是在图像编辑领域,AI技术其实是相对落后的,无法进行精准编辑,一直是行业的老大难问题。

在今年以前,这类需求一般通过Stable Diffusion的ControlNet插件来实现。

它可以获取额外的输入图像,通过不同的预处理器转换为控制图,进而作为Stable Diffusion扩散的额外条件,只需使用文本提示词,就可以在保持图像主体特征的前提下任意修改图像细节。

(图源:新浪微博,识别特征并进行重新绘制)

本地部署AI应用这事,和大部分小白是基本无缘的。

所以在进入今年后,包括ChatGPT/DALLE3、Midjourney、百度超能画布都推出了局部重绘应用,试图充当在线编辑图片的功能。

不过这类应用,大多数时候还得咱们手动涂抹,选定你要修改的对象,然后输入各种提示词来做修改。

(图源:雷科技)

需要掌握正确的AI话术,才能获得理想的修图质量,门槛还是有点高了。

如果,我是说如果,我们只需要给定输入图像和告诉模型要做什么的文本描述,然后模型就能遵循描述指令来编辑图像,那得多省事儿啊。

字节端出的SeedEdit,确实是朝着这个方向努力的。

不过图修多了,问题也就出来了,目前这款模型在生成图片时还是有一些问题存在的。

首先,缺乏人像前后的一致性。

只要涉及到人物面部的修图,那么最终出来的图像和原图的差异会很夸张,基本上看不出来原来的样子。

(图源:雷科技)

其次,缺乏图片内容的方向性。

对于元素较多的图像,目前SeedEdit很难判断你要修改的是图片里的哪个元素,即便偶然识别对了,出来的图片效果也会异常扭曲。

(图源:雷科技)

最后,文字处理能力依然不行。

就像早期AI绘画那样,目前SeedEdit会编造文字内容,下面这三行小字看似有点逻辑,我看了半天,愣是没认出来写的是个啥。

(图源:雷科技)

在我看来,SeedEdit的出现,算是弥补了国产大模型在语义AI修图应用这块的空白。

可以预见的是,随着AI图像编辑技术的不断发展,未来手机、电脑都可能会集成这项功能,就像AI消除、AI扩图那样走进寻常百姓家。无论是小白还是大咖,每个人都有机会轻松上手使用,让自己对美的理解可以更直观地展现出来。

修图有手就行?或许真的不是梦。

相关内容

热门资讯

股市必读:长电科技(60058... 截至2025年5月28日收盘,长电科技(600584)报收于32.06元,下跌0.9%,换手率0.6...
最新披露!同德化工在融资租赁公... 民爆上市公司 同德化工(002360.SZ)同时面临债务及业绩压力。 5月26日盘后,同德化工披露债...
原创 5... 写在文章前的声明:在本文之前的说明:本文中所列的投资信息,只是一个对基金资产净值进行排行的客观描述,...
苹果2015年卫星互联网计划揭... IT之家 5 月 28 日消息,科技媒体 The Information 昨日(5 月 27 日)发...
扭亏为盈后,大润发调整运营架构... 近日,大润发被传将对营运区进行调整,将裁撤华中大区和东北大区。 5月28日,大润发方面对外透露,即日...
和讯投顾何兵:双节来临,要不要... 今天市场终于出现了跳水行情,但我要明确表示,这里说的跳水并不是指大盘,而是指短线市场。大盘依然延续了...
公告速递:华安证券睿赢一年持有... 证券之星消息,5月28日华安证券资产管理有限公司发布《华安证券睿赢一年持有期债券型集合资产管理计划暂...
金明精机:自主研发再结硕果 取... 中证智能财讯 金明精机(300281)5月27日晚间公告,公司近期取得四项国家专利,并取得了国家知识...
中上协:截至4月30日,境内股... 扬子晚报网5月28日讯(记者 马燕)5月28日,据中国上市公司协会微信公众号消息,中上协发布4月统计...
短债锁利 权益突围 理财公司应... “就目前来看,本轮降准降息落地后,理财产品资产端利率在短期内未出现明显下降,反而有所回升。实际上,今...
快手可灵AI一季度营收1.5亿... 近日,快手科技发布2025年第一季度业绩。在AI大模型与平台生态深度融合的背景下,本季度,快手业绩表...
GTCFX:创新技术引领外汇交... 摘要: 发现GTCFX如何通过创新技术彻底改变外汇交易,带您领略未来金融新趋势!了解更多,开启您的交...
原创 美... 据大河报报道,当地时间5月19日,美国白宫官员表示,美国总统特朗普与俄罗斯总统普京进行电话会谈。稍早...
促进海外业务发展 牧原股份拟港... 5月27日,牧原股份向港交所提交H股发行上市的申请,联席保荐人为摩根士丹利、中信证券、高盛。 牧原...
江苏银行宁波分行获批开业,分行... 5月26日,宁波金融监管局发布批复,同意解散宁波江北富民村镇银行,全部资产、负债、业务、网点、员工及...
金荣中国:黄金震荡调整待走强 黄金开盘延续隔夜尾盘止跌回升之力,先行表现走强,但需进一步走强,仍需突破回落趋势线压力,否则将仍有再...
【投融资动态】大化国瑞B轮融资... 证券之星消息,根据天眼查APP于5月26日公布的信息整理,辽宁国瑞新材料有限公司B轮融资,融资额数亿...
比亚迪回应网传“一经销商集团暴... 针对近期“比亚迪山东经销商济南乾城汽车贸易有限公司‘资金链断裂’”传闻,比亚迪集团品牌及公关处相关人...
以色列防长:已摧毁胡塞武装最后... 以色列国防部长卡茨5月28日说,以军空袭也门萨那机场。 卡茨表示,此次袭击摧毁了胡塞武装仍在使用的最...
午报三大指数窄幅震荡涨跌不一,... 一、【早盘盘面回顾】 财联社5月28日讯,市场早盘窄幅震荡,三大指数涨跌不一。沪深两市半日成交额65...
16个区全覆盖!蔚来能源实现天... 2025年5月28日,蔚来换电站|天津和平安泊城市港湾正式启用,蔚来能源实现天津换电县县通,全市16...
机构席位买入968.59万 北... 每经讯,2025年5月28日,北交所上市公司胜业电气(920128,收盘价:39.52元)登上龙虎榜...
小红书虚拟赛道,保姆级流程拆解... 今天给大家带来小红书虚拟赛道,轻松10W+的详细流程拆解。 先上案例,这是在小红书卖简历模板套装,一...
北方华创大跌2.76%!华泰柏... 5月28日,北方华创股票收盘大跌2.76%,天眼查工商信息显示,北方华创科技集团股份有限公司成立于2...
股民诉讼潮下的“护身符”,今年... 本报(chinatimes.net.cn)记者吴敏 北京报道 当监管重锤与诉讼浪潮共振,董事会的座椅...
【财经早晚报】字节将禁用第三方... 今天值得关注的国内外新闻有: 1. 外交部:中国对沙特、阿曼、科威特、巴林4国试行免签 2. 工信部...
GTCFX:多元化产品组合满足... 摘要: 探索GTCFX多元化产品组合,满足您的交易需求,实现投资目标的最佳选择。立即点击了解更多,开...
上汽大众成立动力系统新公司 含... 每经AI快讯,天眼查App显示,近日,上海峰梅动力系统有限公司成立,法定代表人为李文辉,注册资本10...
惠民消费券叠加世界美酒!宁夏·... 6月9日-11日,第五届中国(宁夏)国际葡萄酒文化旅游博览会-国际葡萄酒名庄名酒展将在银川国际会展中...
基金分红:华夏合肥高新产园RE... 证券之星消息,5月28日发布《华夏基金管理有限公司关于华夏合肥高新创新产业园封闭式基础设施证券投资基...