基于腾讯云HAI探索AI生成小说图片之道

前言

腾讯云最近推出了高性能应用服务 HAI，这个服务可以在几分钟之内就可以一键部署多种 AIGC 场景，比如AI作画、AI视频、AI写作等。本文就基于HAI部署一个AI 绘画环境，实现AI生成小说图片的功能。

HAI介绍

高性能应用服务（Hyper Application Inventor，HAI）是一款面向 AI 和科学计算的 GPU/NPU 应用服务产品，提供即插即用的强大算力和常见环境。它可以帮助中小企业和开发者快速部署语言模型（LLM）、AI 绘图、数据科学等高性能应用，原生集成配套的开发工具和组件，大大提升应用层的开发生产效率。

相比使用GPU 云服务器，HAI有以下几点优势：

不需要了解 GPU 型号，不用选择机型。基于 AI 应用，自动匹配合适套餐。
不需要自行部署驱动、CUDA、Python、Notebook 等环境依赖。分钟级快速启动，直接交付可用应用环境。
打包 GPU、云硬盘、带宽及网络，直接一键启动。
提供 WebUI 可视化连接方式，一键进入服务，不需要具备运维知识。
跨境线路自动择优，支持学术资源平台访问、下载加速。
支持关机不计费、制作自定义应用等功能。用户可根据自身使用需求动态开关机，节省成本，长期使用。
分钟级自动构建LLM、AI作画等应用环境。提供多种预装模型环境，包含如StableDiffusion、ChatGLM等热门模型。

部署AI作画应用

抢购8小时HAI使用券

现在还是春季特惠活动期间，可以1元抢购HAI 8 小时使用券，进入高性能应用服务 HAI后，在下图进行购买 HAI 服务。

开通HAI服务

购买成功后就可以移步HAI控制台进行授权开通。

一键部署应用（StableDiffusion WebUI）

HAI开通后，部署一个AI应用就非常简单了。这里创建一个AI作画应用 StableDiffusion WebUI，只需要两步：

在算力管理界面点击“新建”按钮。
选择 StableDiffusion WebUI 模型，并按照需求选择一个地域和算力方案。

“新建”按钮如下图。

选择 StableDiffusion WebUI 进行购买。

购买成功后会看到创建中的应用，等待1分钟即可创建成功。

当状态为运行中时，即可通过点击下图红框进入 StableDiffusion WebUI 界面。

StableDiffusion WebUI 介绍

Stable Diffusion WebUI是一个基于Stable Diffusion模型的图形界面工具（如下图），通过这个WebUI，用户可以输入他们想要的文本描述，然后系统会根据这些描述自动生成相应的图像。

提示词

提示词对于生成图片至关重要，通过提示词可以描述希望生成的图像的内容、风格、画质、画风以及画面中不想出现的内容。

画质提示词一般为：

(masterpiece:1.2), best quality,masterpiece,extremely detailed wallpaper,highers,perfect lighting,8k wallpaper,

意思是生成高质量的、完美的、极其详细的画质。

其中()中的数字代表该提示词出现在画面中的权重。

如果想要生成二次元的风格，可以填写anime, comic ,gameCG,等提示词。

如果想要生成的画像更逼近人类，那么可以填写 photograph, photorealistic等提示词。

如果喜欢宫崎骏的画风，那么可以填写studio ghibli提示词。

总之，可以按照自己喜欢的风格、画风去填写相关提示词。

生成具体的内容同样需要提示词去描述，比如人物、年龄、发型、头发颜色、情绪表情、衣服装束、做什么事等等。

而画面中不想出现的内容也称之为负面提示词，比如：

NSFW, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality,((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051), (unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers, (((extra arms and legs))),

其中NSFW为不要出现不适宜工作场所的内容。

提示词插件

当然，如果对提示词的格式、语法不是很熟悉，可以在StableDiffusion WebUI安装一个插件提示词，这样在页面上就可以直接选择想要生成的提示词了。

安装提示词插件如下图，将 https://github.com/Physton/sd-webui-prompt-all-in-one 复制到网址输入框直接安装即可。

在重启WebUI后就可以看到下图这样的中文提示词框，大家可以直接选择人物、服饰、表情动作等提示词。

采集器

在Stable Diffusion中，采样器是用于生成图像的一种技术或方法。它决定了模型如何从潜在空间中抽样并生成图像，因此，采样器在生成图像的过程中起着关键作用。

Stable Diffusion支持多种采样器，包括Euler、Euler a、LMS、Heum Euler、DPM和DDIM等。每种采样器都有其独特的特性和运算速度，可以根据应用场景进行选择。

AI 生成小说图片

接下来，基于高性能应用服务 HAI搭建的 StableDiffusion WebUI 生成小说图片。

小说场景描述

这里举例一个简单的小说场景：

程序员结束一天的工作后，在楼下随意吃了个便饭，巧遇同事，便友好地打了声招呼。饭后，他挤上了熙熙攘攘的地铁，踏上了回家的路。

场景分镜

按照场景描述，可以想象出几个镜头：

程序员穿着衬衫和裤子，背着背包走在人来人往的路上。
程序员穿着衬衫坐在小吃摊前，面前是一碗热腾腾的面条。
一位穿着制服的年轻女同事笑着和程序员打招呼。
许多人排队等公交的画面。
程序员回到家的画面。

根据提示词生成图片

根据第一个镜头，可以填写相关的提示词，比如画面中有高楼大厦、人来人往的人群、衬衫和裤子、程序员正在走路等。

这里选择生成宫崎骏的画风，加上画质、画风、画面描述等，完整的提示词如下：

(masterpiece:1.2), best quality,masterpiece,extremely detailed wallpaper,highers,perfect lighting,8k wallpaper,studio ghibli,

1boy, shirt, pants, backpack, sunny, office building, after work, walking, bustling with pedestrians,

将提示词和负面提示词分别填入，点击生成即可，如下图。

其余几个镜头的画面描述内容分别为：

1boy, shirt, pants, backpack, a bowl of noodles,food stand,
a bowl of noodles,(1girl),smile,waving,business_suit,upper_body,front view,looking_at_screen,
(bus),((crowd)),shirt,pants,backpack,arm_up,holding_bag,
backpack, cat, floor, window, living room

将这些提示词依次填入进行生成，就完成了通过AI生成小说图片的工作了。

最后，展示。

镜头1

镜头2

镜头3

镜头4

镜头5

总结

借助高性能应用服务 HAI，非专业人员也能轻松部署AI绘画应用，真正实现人人皆可用AI，人人理解大模型。开发人员更是可以专注于业务场景，也不用操心GPU、硬盘、带宽这些细节了。