嘻疯 发自 凹非寺
量子位 | 公众号 QbitAI
豆包升级上新,火山引擎带着图像创作模型Doubao-Seedream-4.5来了。

新模型有三个主打点。
一是强化了原图保持能力,最大化保持原图的人脸、光影与色调、画面细节,可以用来P图。
例如“只保留绿线中的人物,将其他角色都删掉”:

再复杂一些,将白天变为黑夜:

把图片中的英文转成手写体中文:

二是重点强化了多图组合生成能力。
在官方展示中,输入8张参考图,并指定画面布局后,让它生成图画故事书封面:
童话故事书封面:小女孩与小狐狸站在发光森林小屋前,月亮巨大而梦幻,星尘在他们周围飘浮;萤火虫的光点点亮草地;小白花细致点缀;雾气营造柔和深度;古铜色童话边框华丽包围整个场景;色调是蓝紫与暖金对撞;角色面部特征保持原图一致;整体梦幻、温柔、魔法感强烈,适合作为儿童绘本封面。


同样地,让多个角色“拍”一张大合照:

模型也能生成无违和感的群像画面:

反过来,根据一张参考图,一次性生成6张海报,比例分别改成1:1、2:3、4:3、16:9、1:2、9:16:

它能保持风格和元素不变,又能灵活调整构图与元素排布:

在创意变体方面,模型也展现很强的风格迁移与材质重建能力。
比如根据一张篮球创意图,分别生成足球、排球、高尔夫、网球对应的创意图:

不仅球体材质真实,球内生成的“比赛场地”也结构精细:

三是优化了海报排版与Logo设计能力。
设计高级香薰的产品详情页:

极简风艺术展宣传海报:

婚礼邀请函:

在内部多维度基准测试MagicBench上,Seedream 4.5与上一代Seedream 4.0相比,在指令遵循、一致性、美学表现等多个维度表现全面提升。

目前,Seedream 4.5已面向企业全量开放API使用,并向用户开启公测,量子位立马上手体验了一番。
一手实测来了
在火山引擎AI体验中心即可试用最新模型,注册登录后可免费生成200张。

Seedream 4.5支持文生图、图片编辑、参考图生图、组图生成。
用户可在输入框中选择开启生成组图,有自动模式/故事书/连环画三种模式可选。生图分辨率支持2K、4K。图片比例、尺寸、最大生成张数(单次最多生成15张)等参数也能调整。

我们先拿它来修几张图:
先上传一张模糊的蒜鸟表情包,让它参照生成一个新的蒜鸟,要穿蓬蓬公主裙泳衣的那种:

在保持其它元素不变的前提下,成功换衣,且糊糊表情包一下子就清楚了不少。
这就存好,够用,够用~

输入一张包含多个人物角色的剪影:

让它将其细化并绘制为全彩角色形象,添加服饰细节、材质质感与光影。
随后就一键变成了酱紫:


文字生成也是OK的(上为原图,下为转换成英文):

接下来一次性输出多张图,让它:
将几张图中元素融合到一张图中生成一张圣诞海报,画面主体是一颗大圣诞树,圣诞树下面摆放着礼物,海报上方写着“Merry Christmas”,字上要挂上小星星、气球装饰。

最后效果针不戳~

再换一种排版布局:

接下来我们试了一段超长的纯文本提示,来看看它的指令遵循能力。
帮我生成图片:壁画、水彩、北欧森林小镇风格。画面中心是一条蜿蜒的木栈道,延伸至雾气笼罩的松林深处。清晨的微光穿过树林洒落其上,行人、骑行者与遛狗的居民沿栈道悠然前行,呈现出一幅静谧而富有生命力的画面。
栈道两侧是一间间典型的北欧木屋,温暖的橡木墙面与暗蓝屋顶相互映衬。窗台摆放着盛开的野花,空气中仿佛能嗅到青草与木质的清香。林间点缀着苔藓、浆果灌木与精致的雕花路灯,营造出北欧小镇特有的质朴与浪漫。
画面上方,一轮淡金色的晨曦从云层背后升起,柔光照亮雾气,使光线在树林间散射出梦幻般的光晕。天空色彩从灰蓝渐变到暖橘,温柔而富有层次,仿佛象征着新一天的希望与宁静。
整体场景以木色、雾白与森林绿为主色调,辅以细腻的光影纹理,打造清新又富空间感的氛围。画面既现代又充满自然诗意,宛如北欧传说中温暖而安宁的小镇。
确实有两把刷子,各种细节都照顾到了:

最后在连环画模式下,每张图都是可以完整打开的:

官方食用指南请查收
新模型上线后网友也纷纷开始实测。
有网友反馈Seedream 4.5的光影与环境调整能力表现十分出色:
也有人为画面中的人物添加了手持手机、佩戴耳机的动作设定,模型依然能将相关元素自然融入场景:

我们在实测中也感受到,Seedream 4.5在多元素融合方面确实表现突出,能够准确捕捉参考图中的细节元素;画质提升、主体元素的一致性保持能力同样感人。
不过Seedream 4.5虽然提示词理解力强,但也更依赖清晰而具体的描述——表达越明确,生成越精准。
官方也给到了一些生图tips:
用简洁连贯的自然语言写明主体+行为+环境,若对画面美学有要求,可用短语补充风格、色彩、光影、构图等。
当有明确的应用场景时,推荐在文本提示中写明图像用途和类型。
如果有明确的风格需求,使用精准的风格词或提供参考图像,能获得更理想的效果。
建议将要生成的文字内容放在双引号中。
使用简洁明确的指令,说明需要修改或参考的对象及具体操作,避免使用指代模糊的代词;如果希望除了修改的内容都保持不变,则可以在prompt中强调。

当然生图过程中避免不了翻车时刻,最重要的秘诀是:多尝试。
感兴趣的友友赶快亲自上手试试吧~
官方介绍:https://seed.bytedance.com/zh/seedream4_5