浅聊一下 AI 画画 - 成就云开发者社区

1、AI 画画爆火

2022 年 8 月，在美国科罗拉多州举办了一场新兴数字艺术家竞赛，其中『数字艺术/数字修饰照片』类别的一等奖由一幅名为《太空歌剧院》的作品获得，而神奇的是这幅作品的参赛者并没有绘画基础，而是完全用 AI 完成了这幅作品。这一事件引发了热议，并由此激发了大家对 AI 画画的兴趣。

AI 绘画作品《太空歌剧院》

随后，AI 画画的黑科技：文本描述自动生成图片（Text-to-Image）变成科技媒体频频报道的当红炸子鸡，甚至由此诞生了一个新名词：AIGC（AI Generated Content），并把 2022 年称为 AIGC 元年。

2、平台介绍

目前，AI 画画平台如雨后春笋，很多厂商都推出自己的 AI 画画平台。这里我们就简单介绍几个：

1）Stable Diffusion

Stable Diffusion 是 Stability AI 公司在 2022 年发布的深度学习文生图模型，它主要用于根据文本的描述产生详细图像，它也可以应用于其他任务。该平台一经推出就因为免费、生成速度快（一般不到 30s）受到了广大网友的喜爱。

此外，Stable Diffusion 已经开源了代码和模型权重，可以在大多数配备有适度 GPU 的电脑硬件上运行。所以现在很多公司都在根据他们的代码，来开发自己的 AI 绘画产品。他们的口号是：『AI by the people, for the people』。

2）Dall-E2

Dall-E 是 OpenAI 这家 AI 公司发布的支持文本生成图像的模型，OpenAI 的创始人之一就是我们熟悉的马斯克。

2022 年 4 月，OpenAI 宣布了新版本的 DALL-E 2，声称它可以从文本描述中生成照片般逼真的图像，另外还有一个允许对输出进行简单修改的编辑器。如图所示：

DALL-E 2

DALL-E 2

3）Midjourney

Midjourney 目前是架设在 Discord 频道上的 AI 工具，因此需要注册 Discord 帐号才能使用。

使用方法也很简单，进入 Midjourney 的 Discord 频道，在频道对话框输入 /imagine + 关键词，系统就会在对话框里发送生成的图。值得注意的是，系统出的图全频道可见，部分网友会选择付费隐私订阅。

下图是 Midjourney 输出的英雄联盟金克丝的真人形象：

金克丝

咒语：jinx from league of legends as a real person, realistic, 8k

Midjourney 也是开头提到《太空歌剧院》的创作平台。

4）文心一格

国内百度也推出了自己的 AI 画画产品：文心一格。平均出图时间在 2s 内，文心最大的优点在于理解中国文化，尤其擅长古风和水墨画。

下图是诗句『相看两不厌，只有敬亭山』输出的中国风画作。

相看两不厌，只有敬亭山

相信这是国外的 AI 平台很难理解的文化内涵，感兴趣的同学可以试试。

3、Stable Diffusion 操作实践

接下来选择我最喜欢的平台 Stable Diffusion 进行简单操作实践：

1）官网注册账号

打开官网：https://beta.dreamstudio.ai/dream，选择喜欢的注册方式完成注册。

Stable Diffusion

2）开始画画

登陆后我们看到的是这样的界面。其中，底部输入框可以输入关键词，右边工具栏可以修改配置。

Stable Diffusion

系统已经提供了一个默认咒语：A dream of a distant galaxy, by Caspar David Friedrich, matte painting trending on artstation HQ。

点击 Dream 即可生成一张浪漫主义的银河画作。

Stable Diffusion

鼠标放在图片中间可免费下载。

如果我想换种风格怎么办，我想画一张梵高风格的银河，修改咒语即可：A dream of a distant galaxy, by Vincent Willem van Gogh, matte painting trending on artstation HQ。

Stable Diffusion

或者我不想画星空，我想画一个小姐姐，同样修改咒语：A dream of a pretty girl, by Caspar David Friedrich, matte painting trending on artstation HQ。

Stable Diffusion

对目前的 AI 画画来说，咒语的调教可谓重中之重，画作质量全靠咒语有没有选好。

原则上越精准越好，AI 不会违抗你的指令，但会对你没有明确的部分做一些猜测，只是很多时候并不如人所愿。这也要求用户不要输入一些自相矛盾的词。

推荐一个翻译网站：https://www.deepl.com/translator。如果你想把关键词翻译成英文，这个网站翻译出来的结果 AI 会更好理解。

3）修改设置

我们可以修改下面这些设置：

Stable Diffusion

Width/Height：生成图像尺寸
Cfg Scale：生成图像和咒语贴近的程度
Steps：数值越高质量越好，耗时越久
Numbers of Images：一次生成几张图像
Sampler：采样器
Model：模型版本
Seed：随机种子
Image：如果输入底图，AI 会参考底图来画图。但 AI 未必会参考底图的构图和风格，而是会识别底图中的元素，把它转化为关键词，生成图片。所以很多时候生成的图片和底图并不相像，了解原理后就好理解了。

小结

不同的 AI 画画平台的技术实现会有差异，其核心能力都是输入巨量训练集，把人类画作转换为抽象的数学向量表示，再通过反向转换，用 AI 来创作新的作品。目前比较火的模型就是 Stable diffusion，因为开源、效果也好。

篇幅所限，我们今天的 AI 画画就浅试一下。如果大家喜欢，在后续的文章中我们会继续介绍 AI 画画的算法原理。