> 技术文档 > Midjourney/Stable Diffusion 教程:从零开始,教你如何精准写出“咒语“_midjourneystable diffusion

Midjourney/Stable Diffusion 教程:从零开始,教你如何精准写出“咒语“_midjourneystable diffusion


坚持用 清晰易懂的图解 + 代码语言,让每个知识点变得简单!
🚀呆头个人主页详情
🌱 呆头个人Gitee代码仓库
📌 呆头详细专栏系列
座右铭: “不患无位,患所以立。”
在这里插入图片描述


Midjourney/Stable Diffusion 教程:从零开始,教你如何精准写出\"咒语\"

  • 摘要:人人都是艺术家
  • 第一部分:基础入门——认识你的魔法工具
    • 什么是AI绘画?
      • Midjourney vs. Stable Diffusion:我该如何选?
        • Midjourney
        • Stable Diffusion
      • \"咒语\"(Prompt)的本质
  • 第二部分: 公式拆解:主体 + 环境 + 风格 + 构图
      • 1. 主体(Subject)
      • 2. 环境(Environment)
      • 3. 风格(Style)
      • 4. 构图(Composition)
  • 第三部分:实战演练——从\"火柴人\"到\"大师之作\"
    • 第一步:简单咒语
    • 第二步:加入主体细节和环境
    • 第三步:注入艺术风格
    • 第四步:优化构图和光影
  • 第四部分:进阶技巧——让你的咒语更上一层楼
    • 魔法词缀:提升画面质感的关键词
    • 负向提示词(Negative Prompt):排除不想要的元素
    • 参数的力量:掌控生成过程的细节
      • Midjourney参数
      • Stable Diffusion参数
      • 工具对比:选择适合你的AI绘画平台
      • 实用技巧:提升成功率的小窍门
    • 结语:开始你的创作之旅
    • 参考链接与关键词标签
      • 参考链接
      • 关键词标签

摘要:人人都是艺术家

最近我沉迷上了AI绘画,从一个连火柴人都画不直的码农,摇身一变成了能生成惊艳壁纸的\"数字艺术家\"。说实话,第一次看到自己用文字描述就能生成一幅精美图像的时候,那种感觉简直像是发现了新大陆!

你可能会问:\"呆头,你不是写代码的吗?怎么突然对画画感兴趣了?\"嘿嘿,作为一个对所有新技术都充满好奇心的开发者,我发现AI绘画不仅仅是一种创作工具,更是一种新的编程范式——只不过我们用的不是Python或JavaScript,而是自然语言。

在传统编程中,我们通过代码控制计算机;而在AI绘画中,我们通过\"咒语\"(Prompt)控制AI模型。这个过程同样需要逻辑思维、结构化表达和不断迭代优化,简直就是为我们程序员量身定做的新玩具!

经过几个月的摸索和实验,我总结出了一套\"咒语编写框架\",帮助我从生成模糊不清的草图,进化到能创作出令人惊叹的艺术作品。今天,我就把这套方法完整分享给大家,让你即使是零基础,也能快速掌握AI绘画的核心技巧。

无论你是想为自己的项目生成独特的插图,为博客创作吸引眼球的封面,还是纯粹出于兴趣想探索这项新技术,这篇教程都能帮你少走弯路,直达\"AI艺术家\"的殿堂。准备好了吗?让我们一起开始这段从\"文字到图像\"的神奇旅程!


第一部分:基础入门——认识你的魔法工具

什么是AI绘画?

在深入学习咒语之前,我们先简单了解一下AI绘画的原理。本质上,AI绘画模型是通过学习海量的图像和对应文本描述,建立起文字与视觉元素之间的关联。当我们输入一段文字描述(即\"咒语\")时,AI会尝试生成与这段描述最匹配的图像。

# 简化的AI绘画原理示意代码def generate_image(prompt, model): # 1. 将文本转换为模型可理解的向量表示 text_embedding = text_encoder.encode(prompt) # 2. 从随机噪声开始 image = random_noise() # 3. 逐步去噪,向文本描述靠拢 for step in range(diffusion_steps): image = denoise_step(image, text_embedding, model) return image

这段代码虽然极度简化,但展示了扩散模型(Diffusion Models)的核心思想:从随机噪声开始,根据文本描述逐步\"去噪\",最终形成符合描述的图像。

Midjourney vs. Stable Diffusion:我该如何选?

作为一个尝试过各种AI绘画工具的\"技术尝鲜党\",我可以给大家分享一下两大主流工具的对比:

Midjourney

Midjourney是目前市面上最容易上手、出图质量最稳定的AI绘画工具。它运行在Discord平台上,使用起来非常简单:

/imagine prompt: a beautiful sunset over mountains

只需在Discord中输入这样一行命令,几十秒后就能得到四张精美的日落图片。

优点:

  • 艺术感极强,即使是简单提示词也能生成惊艳效果
  • 操作简单,学习曲线平缓
  • 社区活跃,可以从其他用户作品中获取灵感

缺点:

  • 需要付费订阅(基础版每月10美元起)
  • 无法本地部署,依赖网络和服务器状态
  • 自定义程度相对有限
Stable Diffusion

作为一名开发者,我对Stable Diffusion的开源特性格外青睐。它允许你完全掌控生成过程的每个细节:

# 使用命令行运行Stable Diffusion (简化示例)python scripts/txt2img.py --prompt \"a beautiful sunset over mountains\" \\ --ckpt models/ldm/stable-diffusion-v1-5/model.ckpt \\ --H 512 --W 768 --seed 42

优点:

  • 完全免费且开源
  • 可本地部署,无需担心隐私问题
  • 自定义性极高,支持各种模型、插件和工作流

缺点:

  • 需要一定的技术背景才能充分利用
  • 对硬件要求较高(推荐至少8GB显存的GPU)
  • 默认效果不如Midjourney惊艳,需要更精细的提示词

“咒语”(Prompt)的本质

无论你选择哪种工具,掌握\"咒语\"的编写都是成功的关键。咒语不仅仅是简单的文字描述,而是一套结构化的指令系统,告诉AI你想要什么,不想要什么,以及如何表现这些元素。

#mermaid-svg-KbUfrBXBjx4WUIi9 {font-family:\"trebuchet ms\",verdana,arial,sans-serif;font-size:16px;fill:#fff;}#mermaid-svg-KbUfrBXBjx4WUIi9 .error-icon{fill:#fff;}#mermaid-svg-KbUfrBXBjx4WUIi9 .error-text{fill:#000000;stroke:#000000;}#mermaid-svg-KbUfrBXBjx4WUIi9 .edge-thickness-normal{stroke-width:2px;}#mermaid-svg-KbUfrBXBjx4WUIi9 .edge-thickness-thick{stroke-width:3.5px;}#mermaid-svg-KbUfrBXBjx4WUIi9 .edge-pattern-solid{stroke-dasharray:0;}#mermaid-svg-KbUfrBXBjx4WUIi9 .edge-pattern-dashed{stroke-dasharray:3;}#mermaid-svg-KbUfrBXBjx4WUIi9 .edge-pattern-dotted{stroke-dasharray:2;}#mermaid-svg-KbUfrBXBjx4WUIi9 .marker{fill:#1F456E;stroke:#1F456E;}#mermaid-svg-KbUfrBXBjx4WUIi9 .marker.cross{stroke:#1F456E;}#mermaid-svg-KbUfrBXBjx4WUIi9 svg{font-family:\"trebuchet ms\",verdana,arial,sans-serif;font-size:16px;}#mermaid-svg-KbUfrBXBjx4WUIi9 .label{font-family:\"trebuchet ms\",verdana,arial,sans-serif;color:#fff;}#mermaid-svg-KbUfrBXBjx4WUIi9 .cluster-label text{fill:#000000;}#mermaid-svg-KbUfrBXBjx4WUIi9 .cluster-label span{color:#000000;}#mermaid-svg-KbUfrBXBjx4WUIi9 .label text,#mermaid-svg-KbUfrBXBjx4WUIi9 span{fill:#fff;color:#fff;}#mermaid-svg-KbUfrBXBjx4WUIi9 .node rect,#mermaid-svg-KbUfrBXBjx4WUIi9 .node circle,#mermaid-svg-KbUfrBXBjx4WUIi9 .node ellipse,#mermaid-svg-KbUfrBXBjx4WUIi9 .node polygon,#mermaid-svg-KbUfrBXBjx4WUIi9 .node path{fill:#5D8AA8;stroke:#1F456E;stroke-width:1px;}#mermaid-svg-KbUfrBXBjx4WUIi9 .node .label{text-align:center;}#mermaid-svg-KbUfrBXBjx4WUIi9 .node.clickable{cursor:pointer;}#mermaid-svg-KbUfrBXBjx4WUIi9 .arrowheadPath{fill:undefined;}#mermaid-svg-KbUfrBXBjx4WUIi9 .edgePath .path{stroke:#1F456E;stroke-width:2.0px;}#mermaid-svg-KbUfrBXBjx4WUIi9 .flowchart-link{stroke:#1F456E;fill:none;}#mermaid-svg-KbUfrBXBjx4WUIi9 .edgeLabel{background-color:#006400;text-align:center;}#mermaid-svg-KbUfrBXBjx4WUIi9 .edgeLabel rect{opacity:0.5;background-color:#006400;fill:#006400;}#mermaid-svg-KbUfrBXBjx4WUIi9 .cluster rect{fill:#fff;stroke:hsl(0, 0%, 90%);stroke-width:1px;}#mermaid-svg-KbUfrBXBjx4WUIi9 .cluster text{fill:#000000;}#mermaid-svg-KbUfrBXBjx4WUIi9 .cluster span{color:#000000;}#mermaid-svg-KbUfrBXBjx4WUIi9 div.mermaidTooltip{position:absolute;text-align:center;max-width:200px;padding:2px;font-family:\"trebuchet ms\",verdana,arial,sans-serif;font-size:12px;background:#fff;border:1px solid undefined;border-radius:2px;pointer-events:none;z-index:100;}#mermaid-svg-KbUfrBXBjx4WUIi9 :root{--mermaid-font-family:\"trebuchet ms\",verdana,arial,sans-serif;}#mermaid-svg-KbUfrBXBjx4WUIi9 .process>*{fill:#5D8AA8!important;stroke:#333!important;stroke-width:1px!important;color:white!important;}#mermaid-svg-KbUfrBXBjx4WUIi9 .process span{fill:#5D8AA8!important;stroke:#333!important;stroke-width:1px!important;color:white!important;}#mermaid-svg-KbUfrBXBjx4WUIi9 .result>*{fill:#006400!important;stroke:#333!important;stroke-width:1px!important;color:white!important;}#mermaid-svg-KbUfrBXBjx4WUIi9 .result span{fill:#006400!important;stroke:#333!important;stroke-width:1px!important;color:white!important;} 解析 迭代1 迭代2 迭代3 迭代4 输入咒语 文本理解 生成过程 初步草图 细节增强 风格应用 最终图像

图1:AI绘画工作流程图 - flowchart - 展示从咒语输入到最终图像生成的迭代过程

#、# 第二部分:咒语的核心语法——四段式黄金公式

经过数百次实验和对比,我总结出了一套\"四段式黄金公式\",这个公式适用于几乎所有AI绘画场景,无论是Midjourney还是Stable Diffusion:

第二部分: 公式拆解:主体 + 环境 + 风格 + 构图

[主体描述], [环境描述], [风格指定], [构图与技术参数]

让我们详细解析每个部分:

1. 主体(Subject)

主体是你想要绘制的核心对象,是画面的焦点。描述主体时,应尽可能具体,包括外观、姿态、表情、服装等细节。

示例:

  • 基础版:a cat
  • 进阶版:a fluffy orange tabby cat with green eyes and a curious expression

2. 环境(Environment)

环境描述了主体所处的场景、背景、时间、天气等元素,为画面提供上下文和氛围。

示例:

  • 基础版:in a forest
  • 进阶版:in an enchanted forest at twilight, with glowing mushrooms and fireflies, misty atmosphere

3. 风格(Style)

风格定义了整个画面的艺术表现形式,可以是特定艺术流派、艺术家风格、媒介类型或视觉效果。

示例:

  • 基础版:oil painting style
  • 进阶版:in the style of Studio Ghibli, watercolor and ink, dreamlike quality, inspired by Hayao Miyazaki

4. 构图(Composition)

构图指定了画面的技术参数,如视角、光照、景深、分辨率等,这些元素决定了画面的专业质感。

示例:

  • 基础版:cinematic lighting
  • 进阶版:dramatic lighting, golden hour, shallow depth of field, ultra detailed, 8k resolution, professional photography

将这四个部分组合起来,我们就得到了一个完整的咒语:

A fluffy orange tabby cat with green eyes and a curious expression, in an enchanted forest at twilight with glowing mushrooms and fireflies, misty atmosphere, in the style of Studio Ghibli, watercolor and ink, dreamlike quality, inspired by Hayao Miyazaki, dramatic lighting, golden hour, shallow depth of field, ultra detailed, 8k resolution, professional photography

这个咒语已经足够详细,能够指导AI生成一幅具有明确主题、环境、风格和构图的精美图像。

%%{init: {\'theme\': \'base\', \'themeVariables\': { \'primaryColor\': \'#FF7F50\', \'primaryTextColor\': \'#fff\', \'primaryBorderColor\': \'#B22222\', \'lineColor\': \'#B22222\', \'secondaryColor\': \'#6B8E23\', \'tertiaryColor\': \'#4682B4\' }}}%%mindmap root((咒语结构)) 主体 人物 ::icon(fa fa-user) 外观 服装 表情 姿态 物体 ::icon(fa fa-cube) 形状 材质 大小 数量 场景 ::icon(fa fa-tree) 地点 规模 环境 时间 ::icon(fa fa-clock) 日出/日落 白天/黑夜 季节 天气 ::icon(fa fa-cloud) 晴/阴/雨/雪 雾/霞/极光 氛围 ::icon(fa fa-magic) 神秘/温馨 紧张/放松 风格 艺术流派 ::icon(fa fa-paint-brush) 印象派 超现实主义 像素艺术 媒介 ::icon(fa fa-palette) 油画 水彩 数字艺术 照片级真实 参考艺术家 ::icon(fa fa-star) 达芬奇 宫崎骏 梵高 构图 视角 ::icon(fa fa-camera) 俯视/仰视 特写/全景 光照 ::icon(fa fa-lightbulb) 自然光/人工光 柔和/强烈 技术参数 ::icon(fa fa-cog) 高清/8K 景深 细节程度

图2:咒语结构思维导图 - mindmap - 展示四段式黄金公式的各个组成部分及其细分要素

第三部分:实战演练——从\"火柴人\"到\"大师之作\"

理论讲完了,现在让我们通过一个实际案例,看看如何一步步优化咒语,从简单描述到精美艺术作品。

第一步:简单咒语

最基础的咒语往往只包含简单的主体描述:

a girl

这样的咒语过于简单,AI没有足够的信息来理解你的意图,生成的图像往往平淡无奇,缺乏特色和细节。

第二步:加入主体细节和环境

让我们丰富主体描述,并添加环境信息:

a beautiful girl with silver hair and blue eyes, wearing a white flowing dress, in a magical library with floating books and glowing crystals

这个咒语已经大大改善,AI现在知道了女孩的外貌特征、服装,以及她所处的具体环境。生成的图像会更加具体和有趣。

第三步:注入艺术风格

接下来,我们添加风格信息,让图像具有特定的艺术表现形式:

a beautiful girl with silver hair and blue eyes, wearing a white flowing dress, in a magical library with floating books and glowing crystals, anime style, by Makoto Shinkai, digital art, vibrant colors

通过指定\"anime style\"和\"by Makoto Shinkai\",我们告诉AI模仿新海诚的动画风格。\"digital art\"和\"vibrant colors\"进一步定义了媒介类型和色彩特点。

第四步:优化构图和光影

最后,我们添加构图和技术参数,提升图像的专业质感:

a beautiful girl with silver hair and blue eyes, wearing a white flowing dress, in a magical library with floating books and glowing crystals, anime style, by Makoto Shinkai, digital art, vibrant colors, cinematic lighting, ray tracing, volumetric lighting, ultra detailed, 8k resolution

这个最终版本的咒语涵盖了四段式公式的所有要素,能够指导AI生成一幅具有明确视觉风格、专业光影效果和高清细节的精美图像。

#mermaid-svg-0JzKeqln1RTcvQEJ {font-family:\"trebuchet ms\",verdana,arial,sans-serif;font-size:16px;fill:#fff;}#mermaid-svg-0JzKeqln1RTcvQEJ .error-icon{fill:#fff;}#mermaid-svg-0JzKeqln1RTcvQEJ .error-text{fill:#000000;stroke:#000000;}#mermaid-svg-0JzKeqln1RTcvQEJ .edge-thickness-normal{stroke-width:2px;}#mermaid-svg-0JzKeqln1RTcvQEJ .edge-thickness-thick{stroke-width:3.5px;}#mermaid-svg-0JzKeqln1RTcvQEJ .edge-pattern-solid{stroke-dasharray:0;}#mermaid-svg-0JzKeqln1RTcvQEJ .edge-pattern-dashed{stroke-dasharray:3;}#mermaid-svg-0JzKeqln1RTcvQEJ .edge-pattern-dotted{stroke-dasharray:2;}#mermaid-svg-0JzKeqln1RTcvQEJ .marker{fill:#483D8B;stroke:#483D8B;}#mermaid-svg-0JzKeqln1RTcvQEJ .marker.cross{stroke:#483D8B;}#mermaid-svg-0JzKeqln1RTcvQEJ svg{font-family:\"trebuchet ms\",verdana,arial,sans-serif;font-size:16px;}#mermaid-svg-0JzKeqln1RTcvQEJ .actor{stroke:#483D8B;fill:#6A5ACD;}#mermaid-svg-0JzKeqln1RTcvQEJ text.actor>tspan{fill:#fff;stroke:none;}#mermaid-svg-0JzKeqln1RTcvQEJ .actor-line{stroke:grey;}#mermaid-svg-0JzKeqln1RTcvQEJ .messageLine0{stroke-width:1.5;stroke-dasharray:none;stroke:#fff;}#mermaid-svg-0JzKeqln1RTcvQEJ .messageLine1{stroke-width:1.5;stroke-dasharray:2,2;stroke:#fff;}#mermaid-svg-0JzKeqln1RTcvQEJ #arrowhead path{fill:#fff;stroke:#fff;}#mermaid-svg-0JzKeqln1RTcvQEJ .sequenceNumber{fill:#b7c274;}#mermaid-svg-0JzKeqln1RTcvQEJ #sequencenumber{fill:#fff;}#mermaid-svg-0JzKeqln1RTcvQEJ #crosshead path{fill:#fff;stroke:#fff;}#mermaid-svg-0JzKeqln1RTcvQEJ .messageText{fill:#fff;stroke:#fff;}#mermaid-svg-0JzKeqln1RTcvQEJ .labelBox{stroke:#483D8B;fill:#6A5ACD;}#mermaid-svg-0JzKeqln1RTcvQEJ .labelText,#mermaid-svg-0JzKeqln1RTcvQEJ .labelText>tspan{fill:#fff;stroke:none;}#mermaid-svg-0JzKeqln1RTcvQEJ .loopText,#mermaid-svg-0JzKeqln1RTcvQEJ .loopText>tspan{fill:#fff;stroke:none;}#mermaid-svg-0JzKeqln1RTcvQEJ .loopLine{stroke-width:2px;stroke-dasharray:2,2;stroke:#483D8B;fill:#483D8B;}#mermaid-svg-0JzKeqln1RTcvQEJ .note{stroke:hsl(52.6829268293, 60%, 73.9215686275%);fill:#fff5ad;}#mermaid-svg-0JzKeqln1RTcvQEJ .noteText,#mermaid-svg-0JzKeqln1RTcvQEJ .noteText>tspan{fill:#333;stroke:none;}#mermaid-svg-0JzKeqln1RTcvQEJ .activation0{fill:#FF8C00;stroke:hsl(32.9411764706, 100%, 40%);}#mermaid-svg-0JzKeqln1RTcvQEJ .activation1{fill:#FF8C00;stroke:hsl(32.9411764706, 100%, 40%);}#mermaid-svg-0JzKeqln1RTcvQEJ .activation2{fill:#FF8C00;stroke:hsl(32.9411764706, 100%, 40%);}#mermaid-svg-0JzKeqln1RTcvQEJ .actorPopupMenu{position:absolute;}#mermaid-svg-0JzKeqln1RTcvQEJ .actorPopupMenuPanel{position:absolute;fill:#6A5ACD;box-shadow:0px 8px 16px 0px rgba(0,0,0,0.2);filter:drop-shadow(3px 5px 2px rgb(0 0 0 / 0.4));}#mermaid-svg-0JzKeqln1RTcvQEJ .actor-man line{stroke:#483D8B;fill:#6A5ACD;}#mermaid-svg-0JzKeqln1RTcvQEJ .actor-man circle,#mermaid-svg-0JzKeqln1RTcvQEJ line{stroke:#483D8B;fill:#6A5ACD;stroke-width:2px;}#mermaid-svg-0JzKeqln1RTcvQEJ :root{--mermaid-font-family:\"trebuchet ms\",verdana,arial,sans-serif;} 用户 AI模型 图像 咒语迭代优化过程 简单咒语: \"a girl\" 生成基础图像 模糊、缺乏特色 添加细节: \"a beautiful girl with silver hair, in a magical library\" 生成改进图像 主体和环境更清晰 添加风格: \"...anime style, by Makoto Shinkai\" 生成风格化图像 具有特定艺术风格 完整咒语: \"...cinematic lighting, ultra detailed, 8k\" 生成最终图像 专业质感、细节丰富 用户 AI模型 图像

图3:咒语优化流程时序图 - sequenceDiagram - 展示从简单到复杂的咒语迭代过程及其效果变化

第四部分:进阶技巧——让你的咒语更上一层楼

掌握了基本框架后,让我们探索一些进阶技巧,这些小窍门能让你的AI作品更上一层楼。

魔法词缀:提升画面质感的关键词

有一些特殊的\"魔法词缀\",能够显著提升画面的整体质感。这些词汇已经被AI模型强烈关联到高质量图像,因此在咒语中添加它们通常会带来积极效果:

masterpiece, best quality, highly detailed, ultra realistic, 8k, HDR, cinematic lighting, professional photography, artstation, trending on artstation

这些词缀可以根据需要添加到咒语的末尾,但不要过度使用,否则可能导致AI过度关注某些特定风格而忽略你的主要意图。

负向提示词(Negative Prompt):排除不想要的元素

在Stable Diffusion中,你可以使用负向提示词告诉AI\"不要生成什么\"。这在排除常见缺陷时特别有用:

# Stable Diffusion WebUI中的负向提示词示例negative_prompt = \"blurry, low quality, low resolution, deformed hands, extra fingers, mutated hands, poorly drawn face, bad anatomy, extra limbs, disfigured, oversaturated, text, watermark\"

这段负向提示词告诉AI避免生成模糊、低质量的图像,以及常见的解剖错误(如畸形的手、多余的手指等)。

在Midjourney中,你可以使用--no参数实现类似效果:

/imagine prompt: a beautiful landscape --no buildings,people,text

参数的力量:掌控生成过程的细节

Midjourney参数

Midjourney提供了多种参数来控制生成过程:

/imagine prompt: a cyberpunk city --ar 16:9 --v 5 --q 2 --s 750

这里:

  • --ar 16:9 设置宽高比为16:9(适合壁纸)
  • --v 5 使用Midjourney第5版模型
  • --q 2 设置质量等级(范围1-5,越高越精细但生成时间更长)
  • --s 750 设置风格化程度(范围0-1000)

Stable Diffusion参数

Stable Diffusion则提供了更多技术参数:

# Stable Diffusion生成参数示例generation_params = { \"steps\": 50,  # 去噪步数,通常20-50之间 \"cfg_scale\": 7.5, # 提示词遵循度,越高越严格遵循提示词 \"width\": 768, # 图像宽度 \"height\": 512, # 图像高度 \"sampler\": \"Euler a\", # 采样器类型 \"seed\": 42 # 随机种子,相同种子+提示词会生成相似图像}

这些参数让你能够精确控制生成过程的每个细节,是从入门到精通的必经之路。

#mermaid-svg-7E2UdlC48ZA5BLBc {font-family:\"trebuchet ms\",verdana,arial,sans-serif;font-size:16px;fill:#fff;}#mermaid-svg-7E2UdlC48ZA5BLBc .error-icon{fill:#fff;}#mermaid-svg-7E2UdlC48ZA5BLBc .error-text{fill:#000000;stroke:#000000;}#mermaid-svg-7E2UdlC48ZA5BLBc .edge-thickness-normal{stroke-width:2px;}#mermaid-svg-7E2UdlC48ZA5BLBc .edge-thickness-thick{stroke-width:3.5px;}#mermaid-svg-7E2UdlC48ZA5BLBc .edge-pattern-solid{stroke-dasharray:0;}#mermaid-svg-7E2UdlC48ZA5BLBc .edge-pattern-dashed{stroke-dasharray:3;}#mermaid-svg-7E2UdlC48ZA5BLBc .edge-pattern-dotted{stroke-dasharray:2;}#mermaid-svg-7E2UdlC48ZA5BLBc .marker{fill:#0000CD;stroke:#0000CD;}#mermaid-svg-7E2UdlC48ZA5BLBc .marker.cross{stroke:#0000CD;}#mermaid-svg-7E2UdlC48ZA5BLBc svg{font-family:\"trebuchet ms\",verdana,arial,sans-serif;font-size:16px;}#mermaid-svg-7E2UdlC48ZA5BLBc .pieCircle{stroke:black;stroke-width:2px;opacity:0.7;}#mermaid-svg-7E2UdlC48ZA5BLBc .pieTitleText{text-anchor:middle;font-size:25px;fill:#fff;font-family:\"trebuchet ms\",verdana,arial,sans-serif;}#mermaid-svg-7E2UdlC48ZA5BLBc .slice{font-family:\"trebuchet ms\",verdana,arial,sans-serif;fill:#fff;font-size:17px;}#mermaid-svg-7E2UdlC48ZA5BLBc .legend text{fill:#fff;font-family:\"trebuchet ms\",verdana,arial,sans-serif;font-size:17px;}#mermaid-svg-7E2UdlC48ZA5BLBc :root{--mermaid-font-family:\"trebuchet ms\",verdana,arial,sans-serif;} 45% 25% 15% 10% 5% 影响AI绘画质量的因素占比 提示词结构与内容 模型版本与参数 负向提示词 随机种子 后期处理

图4:AI绘画质量影响因素占比 - pie - 展示不同因素对最终图像质量的影响程度

工具对比:选择适合你的AI绘画平台

特性 Midjourney Stable Diffusion DALL-E 2 Firefly 易用性 ★★★★★ ★★★ ★★★★★ ★★★★ 自定义程度 ★★★ ★★★★★ ★★ ★★★ 艺术效果 ★★★★★ ★★★★ ★★★ ★★★★ 价格 订阅制($10-30/月) 免费(开源) 按积分付费 订阅制(Creative Cloud) 本地部署 ❌ ✅ ❌ ❌ 社区支持 ★★★★★ ★★★★★ ★★★ ★★ 适合人群 艺术家、设计师、内容创作者 开发者、技术爱好者、隐私关注者 商业用户、快速原型设计 Adobe生态系统用户

实用技巧:提升成功率的小窍门

  1. 使用英文编写咒语:虽然AI模型支持多语言,但英文训练数据最丰富,通常能获得更好的结果。

  2. 使用逗号分隔元素:在咒语中使用逗号分隔不同元素,这样AI更容易理解每个部分的含义。

  3. 保存有效的种子值:在Stable Diffusion中,如果生成了一张满意的图像,记录下使用的种子值,这样你可以在保持相同主体的同时微调其他元素。

  4. 使用权重调整:在Stable Diffusion中,你可以使用括号调整关键词的权重:

    a (cyberpunk:1.5) city with (neon lights:1.2) and (flying cars:0.8)

    这里,\"cyberpunk\"的权重为1.5,\"neon lights\"为1.2,\"flying cars\"为0.8。

  5. 参考艺术家组合:结合多位艺术家的风格可以创造独特效果:

    in the style of (Greg Rutkowski:0.8), (Alphonse Mucha:0.6), (Hayao Miyazaki:0.7)
%%{init: {\'theme\': \'base\', \'themeVariables\': { \'primaryColor\': \'#8A2BE2\', \'primaryTextColor\': \'#fff\', \'primaryBorderColor\': \'#4B0082\', \'lineColor\': \'#4B0082\', \'secondaryColor\': \'#FF4500\', \'tertiaryColor\': \'#fff\' }}}%%xychart-beta title \"AI绘画模型性能对比\" x-axis [艺术性, 真实感, 创意性, 细节表现, 速度] y-axis \"评分(1-10)\" 0 --> 10 bar [8, 6, 9, 7, 9] \"Midjourney\" bar [6, 8, 7, 8, 6] \"Stable Diffusion\" bar [7, 9, 6, 7, 8] \"DALL-E 2\"

图5:AI绘画模型性能对比 - xychart-beta - 展示不同AI绘画模型在各个维度上的表现评分


结语:开始你的创作之旅

“AI不是来取代艺术家的,而是给每个人提供了成为艺术家的可能性。”

经过这篇教程的学习,你已经掌握了AI绘画的核心技巧——“四段式黄金公式”:主体 + 环境 + 风格 + 构图。这个框架适用于所有主流AI绘画工具,能帮助你系统性地构建高质量咒语。

作为一个从零基础开始探索AI绘画的程序员,我深刻体会到这项技术的魅力不仅在于它能生成美丽的图像,更在于它打破了传统创作的门槛,让每个人都能表达自己的创意想法。就像编程一样,AI绘画也是一门需要不断实践和迭代的技艺,你写的每一个咒语,都是一次创意的表达和技术的实践。

我还记得自己第一次成功生成一张满意作品时的兴奋——那是一张赛博朋克风格的城市夜景,霓虹灯在雨中闪烁,反射在湿漉漉的街道上。那一刻,我感受到了技术与艺术融合的力量,也明白了为什么越来越多的开发者开始关注这个领域。

AI绘画不仅仅是一个有趣的工具,它正在改变我们创作和表达的方式。作为开发者,我们有幸站在这场变革的前沿,不仅能够使用这些工具,还能参与构建它们的未来。

如果你对AI绘画感兴趣,我强烈建议你从今天开始尝试。不要害怕犯错,每一个\"失败\"的生成都是学习的机会。记住,最重要的不是技术本身,而是你想要表达的创意和想法。

最后,分享几个寻找灵感和学习的社区:

  • Midjourney官方Discord社区
  • r/StableDiffusion Reddit社区
  • Civitai.com(Stable Diffusion模型和提示词分享平台)
  • Lexica.art(AI艺术搜索引擎)

希望这篇教程能帮助你开启AI绘画的奇妙旅程。如果你有任何问题或想法,欢迎在评论区留言讨论!

%%{init: {\'theme\': \'base\', \'themeVariables\': { \'primaryColor\': \'#9370DB\', \'primaryTextColor\': \'#fff\', \'primaryBorderColor\': \'#7B68EE\', \'lineColor\': \'#7B68EE\', \'secondaryColor\': \'#20B2AA\', \'tertiaryColor\': \'#fff\' }}}%%quadrantChart title AI绘画工具选择矩阵 x-axis 易用性 --> 高 y-axis 自定义程度 --> 高 quadrant-1 专业级工具 quadrant-2 理想选择 quadrant-3 入门级工具 quadrant-4 灵活工具 Midjourney: [0.9, 0.6] \"Stable Diffusion\": [0.5, 0.95] \"DALL-E 2\": [0.85, 0.4] Firefly: [0.7, 0.55] \"Disco Diffusion\": [0.3, 0.8] \"Craiyon\": [0.8, 0.2]

图6:AI绘画工具选择矩阵 - quadrantChart - 基于易用性和自定义程度的AI绘画工具定位图

作为一个从代码世界跳入AI艺术领域的开发者,这段旅程让我重新思考了创造力的本质。在过去的几个月里,我用AI绘画工具创作了超过500张图像,从最初的模糊不清到现在能精准表达我的创意,每一步都充满了惊喜和发现。

最让我惊讶的是,编程思维在AI绘画中竟然如此有用——结构化思考、模块化设计、迭代优化,这些软件开发的核心理念同样适用于构建高质量的\"咒语\"。就像重构代码一样,我们可以不断优化提示词,直到得到理想的结果。

AI绘画也让我重新审视了人类创造力的价值。在这个工具日益强大的时代,真正珍贵的不是绘画技巧本身,而是创意构思、审美判断和情感表达的能力。AI是画笔,而我们仍然是决定画什么、如何画的艺术家。

我希望这篇教程不仅能帮你掌握技术细节,更能激发你的创造热情。无论你是想为自己的项目生成独特插图,还是纯粹出于兴趣探索这项新技术,记住:最好的学习方式就是动手实践。


参考链接与关键词标签

参考链接

  1. Midjourney官方指南
  2. Stable Diffusion WebUI使用手册
  3. Lexica - AI艺术搜索引擎
  4. Civitai - Stable Diffusion模型社区
  5. Prompt Engineering Guide - AI绘画提示词工程指南

关键词标签

#AI绘画 #Midjourney #StableDiffusion #提示词工程 #数字艺术


📢 如果你也喜欢这种\"不呆头\"的技术风格:
👁️ 【关注】 看一个非典型程序员如何用野路子解决正经问题
👍 【点赞】 给\"不写八股文\"的技术分享一点鼓励
🔖 【收藏】 把这些\"奇怪但有用\"的代码技巧打包带走
💬 【评论】 来聊聊——你遇到过最\"呆头\"的 Bug 是啥?
🗳️ 【投票】 决定我下一篇写\"如何用游戏思维学编程\"还是\"和 ChatGPT 结对编程的翻车现场\"