一、前言

通过前面的学习已经掌握了一个基础的工作流搭建,并且对comfyui与ai生成图像有了一点基础了解。文生图(Text to Image )简称t2i,是 AI 绘图的基础,通过输入文本描述来生成对应的图片,是 AI 绘图最常用的功能之一,你可以理解成你把你的绘图要求(提示词)告诉一个画家(绘图模型),画家会根据你的要求,画出你想要的内容。

文本需求通常称为提示词/咒语(Prompt),提示词分为正向提示词(positive prompt)、负向提示词(negative prompt),正向表示你需要的内容,负向则反之,表示你不需要的内容。在没有额外控制条件时,提示词就是非常关键的控制条件。

 

二、提示词书写形式

提示词(Prompt)主要有两种书写形式,一种为tag(标签)可以理解为简单的词语;例如:dog, yellow,run(狗,黄色,奔跑)。

另一种则是自然语言,可以理解为一段完整的句子描述;例如:A yellow dog is running.(一只黄色的狗在奔跑)。

需要值得注意的是常见的提示词仅支持英文,这包括符号均需使用英文语音。部分CLIP可以支持中文语言,在后续用到时会特别说明。

 

三、提示词构成

提示词通常由以下几大板块构成(并非全部需要,但是越精准的描述生成的结果也越可控):

质量描述

描述图像以何种质量呈现,例:ultra、best quality、4k、8k、ultra- detailed、masterpiece(超凡、品质卓越、4K、8K、超清晰、杰作)

主体描述

描述画面主体内容,描述人物应该详细的包括人物性别、典型特征比如种族(国籍)、动作姿态等。例:一位穿着汉服的东方少女

对于风景/物体的描述应该具体描述场景以何种方式呈现。例:一个发光的水晶球、未来主义城市夜景

视角构图

对于视角和构图也是生成图像的一关键因素,通常对于有要求的人物或景物都需要描写视角或构图。例:cowboy shot、pov、close-up、wide shot、panorama(七分身镜头、主观视角、特写镜头、广角镜头、全景)等

细节特征

如果对图像中的细节有要求,还应加入细节描述,比如一个人的着装细节,这包括服装类型、材质、头发颜色、发型、鞋子款式等等。例:蓝色长发,翡翠色眼睛;丝绸材质,绣有金色凤凰图案。

艺术风格

艺术风格也是一张图像中的重要元素,常见的风格有:写实、3D动漫风格、动漫风格、吉卜力动画风格、赛博朋克风格、赛博朋克风格(realistic、3D animation style、anime style、Ghibli animation style、Cyberpunk style)等。

环境描述

环境描述通常指主体置于什么样的环境中,比如夜晚、白天、公园、湖边、室内、卧室、街上等等;例:飘落的樱花,远处有富士山轮廓。

技术参数

除此之外还可以加入一些较为专业的技术参数,比如光照信息、相机拍摄信息等,例:柔和的黄昏光线、飞思XT相机RAW格式,光圈f/8.0, 85mm镜头。

 

四、提示词格式与语法

前面提到提示词通常需要使用英文进行描述,在使用英文提示词时,符号同样需要使用英文符合。而对于部分支持中文提示词的模型,则可以使用中文符合。

多余的空格通常会被丢弃,避免连接词或复杂的语法,避免出现拼写错误。

 

五、额外的说明

隐藏内容
此内容需权限查看
包含约497个字符
  • 普通用户: 不可赞助
  • VIP: 免费
  • SVIP: 免费
已有146人赞助

六、提示词参考

这里有一些别人整理的tag大家可以视情况参考。

标签超市:https://tags.novelai.dev

tag大全下载:https://pan.quark.cn/s/af1513ffde8e

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。