在科技飞速发展的当下,AI 图像创作领域正不断掀起新的浪潮。近日,字节跳动 Seed 团队推出的豆包图像创作模型 Seedream 4.0,一经上线便迅速引发热议,尤其是其强大的豆包 P 图功能,被网友们玩出了无数新奇花样,堪称开启了万物皆可 “邪修” 的奇妙体验。

以往,图像创作与编辑对于普通用户而言,往往存在一定门槛,专业软件操作复杂,想要实现天马行空的创意并非易事。但随着 Seedream 4.0 的到来,这一局面被彻底打破。它首次支持多模态生图,同一模型集文生图、图像编辑、组图生成等功能于一身,让用户创作更加随心所欲。
就拿一键编辑与重绘功能来说,堪称 “神奇魔法棒”。无论是图片编辑、局部替换,还是风格迁移、影像合成等需求,只需简单操作就能实现。想让马斯克开上小米 SU7?在豆包对话页面点击 “豆包 P 图”,选择 “豆包 Seedream 4.0”,上传马斯克的图片并输入文字描述,短短 30 秒左右,豆包便能生成相应图片。虽说首次生成的图片在细节上或许还有瑕疵,比如马斯克的头可能会出现在前挡风玻璃外,但整体意思已十分贴近。
网友们的创造力在 Seedream 4.0 的助力下被无限激发。其中 “一键换衣” 功能就备受青睐。当用户上传一张模特照和一套心仪衣服的图片,并输入 “让图 1 女生穿上图 2 的衣服” 的指令后,模型便能将参考穿搭替换到模特身上,整体效果较为自然,轮廓与参考图基本一致。不过,服饰替换后的细节部分仍有待提升,要达到理想效果,还需多次尝试调整。
多图输入功能同样令人惊喜。有人上传一猫一狗两张宠物照片,并输入 “将图 1 狗狗和图 2 猫咪合进一张画面” 的提示词,模型能理解指令并进行融合,背景协调,只是偶尔会 “自作主张”,比如改变狗狗原本的颜色。
在分镜设计方面,Seedream 4.0 的多图输出能力大放异彩。上传一张双人电影剧照,输入 “根据图片,生成一组爱情片分镜,比如散步、看电影等” 的提示词,模型能在严格遵循人物外观一致性的基础上,设计出海边漫步、看电影、咖啡馆约会等浪漫场景,生成的故事化图像可用性颇高。
深度意图理解方面,其场景重建能力更是令人赞叹。上传一张室内设计线稿图,输入 “将线稿图改造成真实场景”,模型能够高度还原细节,从大型家具到小型装饰,都能精准复刻,空间构建合理完整,生成结果与专业设计渲染效果极为接近。
精准指令编辑功能也有显著进步。上传背景杂乱的旅行照,给出 “删除背景中的路人” 指令,模型能将路人删除得干干净净,并自然填充背景,P 图痕迹几乎不可见。若要更换人物发型,它也能在保证面部特征和气质一致的前提下,流畅转换发型,效果自然。
此外,多图生成时,Seedream 4.0 最多可支持十余张参考图,能抽取人物特征、场景风格和物体结构并有机融合,对构图的思考能力出色,能较好理解用户意图,保持尺度合理与物理结构连贯性。文字生成图片功能也表现不俗,输入详细文字描述,如 “一个亚洲少数民族男孩,坐在草地上看书,身边放着马鞭,草地上有一匹马在吃草,天空是清透的蓝天白云,构图为 3:2 横图,风格为写实摄影”,模型便能生成美观的实拍风格图片。就连修复老照片,它也能胜任,将破损严重的旧照修复并上色,使照片恢复清晰完整。
Seedream 4.0 的出现,让豆包在图像创作领域从单一文生图迈入多模态交互新阶段。尽管在某些方面仍有提升空间,但已为普通用户打开了便捷创作的大门,无论是电商图片处理、广告设计,还是满足甲方简单需求,都能轻松应对。未来,随着该模型的不断进化,或许真能彻底颠覆我们对图像创作与编辑的认知,值得期待!