1、AI 画画爆火
2022 年 8 月,在美国科罗拉多州举办了一场新兴数字艺术家竞赛,其中『数字艺术/数字修饰照片』类别的一等奖由一幅名为《太空歌剧院》的作品获得,而神奇的是这幅作品的参赛者并没有绘画基础,而是完全用 AI 完成了这幅作品。这一事件引发了热议,并由此激发了大家对 AI 画画的兴趣。
AI 绘画作品《太空歌剧院》
随后,AI 画画的黑科技:文本描述自动生成图片(Text-to-Image)变成科技媒体频频报道的当红炸子鸡,甚至由此诞生了一个新名词:AIGC(AI Generated Content),并把 2022 年称为 AIGC 元年。
2、平台介绍
目前,AI 画画平台如雨后春笋,很多厂商都推出自己的 AI 画画平台。这里我们就简单介绍几个:
1)Stable Diffusion
Stable Diffusion 是 Stability AI 公司在 2022 年发布的深度学习文生图模型,它主要用于根据文本的描述产生详细图像,它也可以应用于其他任务。该平台一经推出就因为免费、生成速度快(一般不到 30s)受到了广大网友的喜爱。
此外,Stable Diffusion 已经开源了代码和模型权重,可以在大多数配备有适度 GPU 的电脑硬件上运行。所以现在很多公司都在根据他们的代码,来开发自己的 AI 绘画产品。他们的口号是:『AI by the people, for the people』。
2)Dall-E2
Dall-E 是 OpenAI 这家 AI 公司发布的支持文本生成图像的模型,OpenAI 的创始人之一就是我们熟悉的马斯克。
2022 年 4 月,OpenAI 宣布了新版本的 DALL-E 2,声称它可以从文本描述中生成照片般逼真的图像,另外还有一个允许对输出进行简单修改的编辑器。如图所示:
DALL-E 2
DALL-E 2
3)Midjourney
Midjourney 目前是架设在 Discord 频道上的 AI 工具,因此需要注册 Discord 帐号才能使用。
使用方法也很简单,进入 Midjourney 的 Discord 频道,在频道对话框输入 /imagine + 关键词
,系统就会在对话框里发送生成的图。值得注意的是,系统出的图全频道可见,部分网友会选择付费隐私订阅。
下图是 Midjourney 输出的英雄联盟金克丝
的真人形象:
金克丝
咒语:jinx from league of legends as a real person, realistic, 8k
Midjourney 也是开头提到《太空歌剧院》的创作平台。
4)文心一格
国内百度也推出了自己的 AI 画画产品:文心一格。平均出图时间在 2s 内,文心最大的优点在于理解中国文化,尤其擅长古风和水墨画。
下图是诗句『相看两不厌,只有敬亭山』输出的中国风画作。
相看两不厌,只有敬亭山
相信这是国外的 AI 平台很难理解的文化内涵,感兴趣的同学可以试试。
3、Stable Diffusion 操作实践
接下来选择我最喜欢的平台 Stable Diffusion 进行简单操作实践:
1)官网注册账号
打开官网:https://beta.dreamstudio.ai/dream,选择喜欢的注册方式完成注册。
Stable Diffusion
2)开始画画
登陆后我们看到的是这样的界面。其中,底部输入框可以输入关键词,右边工具栏可以修改配置。
Stable Diffusion
系统已经提供了一个默认咒语:A dream of a distant galaxy, by Caspar David Friedrich, matte painting trending on artstation HQ
。
点击 Dream 即可生成一张浪漫主义的银河画作。
Stable Diffusion
鼠标放在图片中间可免费下载。
如果我想换种风格怎么办,我想画一张梵高风格的银河,修改咒语即可:A dream of a distant galaxy, by Vincent Willem van Gogh, matte painting trending on artstation HQ
。
Stable Diffusion
或者我不想画星空,我想画一个小姐姐,同样修改咒语:A dream of a pretty girl, by Caspar David Friedrich, matte painting trending on artstation HQ
。
Stable Diffusion
对目前的 AI 画画来说,咒语的调教可谓重中之重,画作质量全靠咒语有没有选好。
原则上越精准越好,AI 不会违抗你的指令,但会对你没有明确的部分做一些猜测,只是很多时候并不如人所愿。这也要求用户不要输入一些自相矛盾的词。
推荐一个翻译网站:https://www.deepl.com/translator。如果你想把关键词翻译成英文,这个网站翻译出来的结果 AI 会更好理解。
3)修改设置
我们可以修改下面这些设置:
Stable Diffusion
Width/Height
:生成图像尺寸Cfg Scale
:生成图像和咒语贴近的程度Steps
:数值越高质量越好,耗时越久Numbers of Images
:一次生成几张图像Sampler
:采样器Model
:模型版本Seed
:随机种子Image
:如果输入底图,AI 会参考底图来画图。但 AI 未必会参考底图的构图和风格,而是会识别底图中的元素,把它转化为关键词,生成图片。所以很多时候生成的图片和底图并不相像,了解原理后就好理解了。
小结
不同的 AI 画画平台的技术实现会有差异,其核心能力都是输入巨量训练集,把人类画作转换为抽象的数学向量表示,再通过反向转换,用 AI 来创作新的作品。目前比较火的模型就是 Stable diffusion,因为开源、效果也好。
篇幅所限,我们今天的 AI 画画就浅试一下。如果大家喜欢,在后续的文章中我们会继续介绍 AI 画画的算法原理。