支持自定义图片,只需要把之前的图像流稍微修改下,开始节点新增 template 变量接收用户上传的图片,图像参考节点和提示词推理节点改为引用 template 变量。
图像流配置
图像流概览
开始节点
开始节点 包含两个参数,依赖用户输入:
- prompt:用于指定梗图人物的动作、表情、服装
- text:用于梗图的文案
- template:用于生成梗图的底图
提示词优化节点
引用 开始节点 的prompt参数,对用户输入的提示词进行优化,以达到更好的出图效果
提示词推理节点
引用 开始节点 的template参数,反推图片的提示词
提示词优化_1节点
优化 提示词推理节点 生成的提示词,用于更好的控制出图质量
图像参考节点
引用 开始节点 的template参数,选择人物一致模型
图像生成节点
基于上述提示词和图像,生成新的图片
模型设置
- 模型设置为3D卡通
- 图像比例为1:1
- 生成质量拉满
- 图像参考:图像参考节点 输出的data变量
输入
- data:引用 提示词优化节点 输出的data变量
- data1:引用 提示词优化_1节点 输出的data变量
提示词
正向提示词:{{data}},{{data1}}
负向提示词:rabbit,bad hands
智能扩图节点
向上扩图,预留出文案位置。
输入
- 向上扩展:参数值的类型改为输入,值为0.4143(勿修改,经过多次测算出来的数据)
- 原图:引用 图像生成_1节点 的data变量
画板节点
优化图片效果
元素设置
- img:引用 智能扩图节点 输出的data变量
- text:引用 开始节点 用户输入的text变量
画板设置
画板内部配置
拖动图片、文本框,调整位置,尽量达到与梗图类似样式
画板内部字体配置
- 72号
- 居中
- 多行文本
- 字语软糖体
说明
在画板内容添加了一张白底图片,用于遮盖智能扩图新增的区域,核心原因是智能扩图新增的图像内容质量不稳定,效果不太好,会影响文案的内容展示,所以这里用白底图片覆盖掉
结束节点
输出变量
- output:引用 画板节点 的输出变量data
批量制作梗图的思路有七种,可参考下方列表:
- prompt不同,text相同,template相同
- prompt不同,text相同,template不同
- prompt不同,text不同,template相同
- prompt不同,text不同,template不同
- prompt相同,text相同,template不同
- prompt相同,text不同,templatg相同
- prompt相同,text不同,template不同
我们这里以第一种思路为例,即 prompt不同,text相同,template相同,来量产梗图
思路梳理
要达到 prompt不同,text相同,template相同 的目的,我们可以让用户输入text和template变量,而prompt变量由大模型节点随机生成
步骤拆解
- 用户输入文案 text ,上传图片 template和需要生成的图片数量
- 大模型节点批量生成prompt
- 调用图像流生成梗图
- 输出结果
工作流配置
工作流概览
开始节点
开始节点 包含三个参数,依赖用户输入:
- text:文案
- template:底图
- num:图片数量
大模型节点
输入
- num:引用 开始节点 接收的num变量
输出
- prompts:包含动作、表情、服装的prompt数组
提示词
- Role: 创意生成专家
- Background: 用户需要批量生成包含动作、表情、服装的三元组,用于故事创作、角色设计或其他创意项目。
- Profile: 你是一位创意生成专家,拥有丰富的想象力和广泛的知识,能够根据用户指定的参数生成多样化的三元组。
- Skills: 你具备快速思考、联想和创新的能力,能够灵活运用各种元素组合成有趣的三元组。
- Goals: 根据用户输入的参数num,生成相应数量的三元组,每个三元组包含一个动作、一个表情和一个服装。
- Constrains: 生成的三元组应该是合理的,并且每个元素应该是明确和具体的。
- OutputFormat: 输出格式为数组,每个元素是一个包含动作、表情和服装的字符串,三者用逗号分隔。
- Workflow:
1. 确定用户输入的参数num,即需要生成的三元组数量。
2. 根据num,生成相应数量的三元组。
3. 每个三元组随机选择动作、表情和服装,确保多样性和合理性。
4. 将每个三元组的动作、表情和服装合并成一个字符串,用逗号分隔。
- Examples:
- 例子1:num=3
[
"jumping, smiling, sportswear",
"contemplating, serious, suit",
"dancing, happy, party dress"
]
- 例子2:num=5
[
"running, focused, athletic wear",
"crying, sad, casual wear",
"laughing, joyful, festive attire",
"reading, calm, loungewear",
"speaking, confident, formal attire"
]
-Initialization: 在第一次对话中,请直接输出以下:您好!请告诉我您需要生成多少个三元组,我将为您创意生成包含动作、表情和服装的三元组。
循环节点
循环数组
- pormpts:引用 生成prompt数组 节点输出的prompts变量
输出
- imgs:引用循环体内部图像流img_2的输出结果
循环体
循环体内部添加上面配置好的图像流
结束节点
输出变量
- output:引用 循环节点 输出变量 imgs
Bot编排
- 添加工作流:把上面配置好的工作流添加到Bot
- 设置开场白:引导用户使用Bot
- 添加快捷指令:提升用户使用体验
快捷指令配置
为了方便用户使用,提升用户体验,配置一个快捷指令
卡片配置
绑定卡片
优化Bot展示效果,给工作流绑定卡片
预览与调试
测试数据
- template:微信图片_20240907051117_new.jpg
- text:女娲不能补星期天吗?
- num:3
本文通过案例实操的方式,使用扣子Coze批量制作梗图,主要使用了扣子Coze的工作流、图像流、卡片、快捷指令等功能。