云端绘梦:依托腾讯云HAI服务开启AI绘画新纪元

前言

很开心能够加入腾讯云社区这个大家庭,本文也是我接触到腾讯云后的第一篇文章。过去作者本人多活跃于某里和某为的社区,如今因业务需求有幸涉足腾讯云这片广袤天地,感受其独特而强大的云服务能力。

本次撰文旨在揭秘腾讯云高性能应用服务HAI如何通过云端GPU的强大算力,让AI绘画这一前沿技术变得触手可及。我们将一起领略如何在腾讯云的助力下,实现从本地环境到云端部署的无缝过渡,进而挖掘AI绘画工具的全部潜力,无论对于个人艺术家还是企业级应用开发者,都将开启全新的创作维度和商业可能性。

当然,除此之外也是为了积极响应腾讯云的活动号召~,活动链接如下:(https://cloud.tencent.com/developer/article/2394003)

本次活动要求使用高性能应用服务 HAI来完成,那么,何为高性能应用服务 HAI呢?

高性能应用服务 HAI

产品简介

高性能应用服务(Hyper Application Inventor,HAI)是一款面向AI、科学计算的GPU应用服务产品,提供即插即用的澎湃算力与常见环境。助力中小企业及开发者快速部署LLM、AI作画、数据科学等高性能应用,原生集成配套的开发工具与组件,大幅提高应用层的开发生产效率。

其实一开始,我以为这个只是普通的GPU服务器而已,但是这里看完我才发现,高性能应用服务HAI远不止于此。它不仅仅是一个配备了强大GPU硬件的基础资源平台,更是集成了诸多高级功能和服务的一站式解决方案

产品售价

按照春日大促的价格来看还是十分划算的。如短时体验可直接购买1元8小时的HAI使用券,买不来吃亏买不来上当!如果还有兴趣可选择购置70元80小时的和200元250小时的使用券,平均算下来都是0.8元/小时左右,也是十分划算的!

产品特性

  • 灵活使用:支持关机不计费(暂停应用)、应用存档。适合根据使用需求动态开关机,节省成本,长期使用。

这一点对于用户来说及其人性化,用户可以根据业务的实际运行时段来开启或关闭HAI服务,当应用暂停时,不会产生费用,有效降低了空闲时段的成本支出。这对于那些不需要全天候运行AI应用的用户来说非常实用,比如研发阶段、周期性任务处理或者夜间无人值守期间,都可以灵活地暂停并恢复服务,实现按需付费,最大程度优化IT投入,降本增效。

  • 一键部署:分钟级自动构建LLM、AI作画等应用环境。提供多种预装模型环境,包含如StableDiffusion、ChatGLM等热门模型。

HAI允许用户在短短几分钟内快速部署大规模语言模型(LLM)、AI绘画及其他高性能应用,大大减少了配置和环境搭建所需的时间,尤其对初次接触深度学习和AI开发的用户十分友好。内置诸如StableDiffusion、ChatGLM等热门模型,意味着用户可以直接利用这些已训练好的模型进行二次开发或直接用于生产环境,省去了从零开始训练模型的大量时间和计算资源。

  • 可视化界面:提供开发者友好的图形界面,支持JupyterLab、WebUI等多种算力连接方式,AI研究调试超低门槛。

通过直观易用的图形化界面,无论是初学者还是专业开发者,都能更轻松地管理和操作复杂的AI应用与计算资源,减少对底层技术细节的关注,集中精力于创新和应用层面上的工作。而支持多种算力连接方式也方便不同习惯的开发者接入和利用云端算力资源,进行高效的数据分析、模型训练和测试,极大地降低了AI研究和调试过程中的技术门槛。

产品对比

而通过此处产品对比,我们也可以更加清晰的发现高性能应用服务HAI确确实实是一个更优秀、更集成的一体化解决方案

应用场景

他的应用场景,也不止单单局限于绘画、作文、开发等。。。但凡AI能够参与并显著提升工作效率的领域,高性能应用服务(HAI)都能大显身手。

  • 高性能计算:在科研领域,无论是生物信息学中的基因序列比对分析,还是物理学中的粒子模拟实验,亦或是气候模型预测,HAI都能够提供足够的算力支持,加快科研进程。
  • 图形渲染与游戏开发:不仅限于AI相关的应用,HAI同样适用于需要高性能GPU的应用场景,比如高清影视特效制作、建筑可视化设计,以及开发和测试具有丰富图形效果的电子游戏等。

高性能应用服务HAI犹如一个全能型的数字引擎,无论是在创意产业、科学研究、商业决策,还是在新兴技术领域,只要涉及高性能计算和AI应用的环节,它都能作为有力的后盾,帮助用户高效利用计算资源,释放人工智能的巨大潜力。

小试牛刀:利用腾讯云高性能应用服务HAI部署StableDiffusion AI绘画平台

进入到春日大促界面(https://cloud.tencent.com/act/pro/hai),看到春季特惠活动,点击第一个立即购买。

点击立即付款。

勾选我已阅读并同意,点击下一步支付。

支付后界面如图所示,点击返回。

点击进入控制台,注意此处可能需要等待三到五分钟。

返回到如下界面后,点击新建按钮。

选择 Stable Diffusion WebUI(有界面),区域选择离自己所在地近的(因人而异),选择GPU基础型(前面花一元买的只支持使用 8 小时 GPU基础型算力套餐),实例名称可自定义,选择完后点击确认购买按钮。

这时可以看实例在创建中,创建完成后手机会收到提示短信的,很贴心~

当显示为运行中时,此台实例则是部署完成了。

点击算力链接,选择Gradio WebUI

铛铛铛铛,一个带WebUI的Stable Diffusion就做好了,简直是太简便了!

输入魔咒如下:"cute penguin, baby penguin, adorable, cartoon style, big round eyes, playful pose, feather details, beak, tuxedo pattern, happy expression",让他帮我生成一只可爱的小企鹅,20s之后也是很快的生成出来了。

Stable Diffusion是老朋友了,其他的功能也不多介绍,此次的重点还是HAI服务哈~

其他应用实践详解

再回到新建页面处,我们来仔细看看腾讯云HAI服务到底支持预制哪些服务。

在AI模型处,它支持预制五种,分别是:Stable Diffusion WebUIChatGLM2 6BLlama2 7BLlama2 13BStable Diffusion ComfyUI

其中ChatGLM2 6B、Llama2 7B/13B主要是针对于各种自然语言处理任务,例如文本生成、问答系统、聊天机器人开发等,可以应对复杂的自然语言理解和生成任务,为企业级应用提供强大的语义理解和生成能力。

而Stable Diffusion WebUI、Stable Diffusion ComfyUI这两个则是文本到图像的转换,允许用户通过简单的提示词输入来创作高质量的艺术作品和概念设计。

在AI框架处,为了确保用户能够无缝对接主流深度学习框架,方便模型开发、训练和部署,平台预先集成了两种业界广泛使用的深度学习框架版本:,分别是:Pytorch2.0.0Tensorflow2.9.0

  • PyTorch 2.0.0: PyTorch以其动态计算图、易读的代码风格和丰富的生态系统深受研究者和开发者的喜爱。HAI服务内置PyTorch 2.0.0版本,用户可以直接在这个环境中进行模型构建、训练以及推理,无需额外安装配置。
  • TensorFlow 2.9.0: TensorFlow作为另一个广泛应用的深度学习框架,以其灵活的架构和高效的执行效率著称。腾讯云HAI服务同样预装了TensorFlow 2.9.0版本,为用户提供了一个稳定、高性能的开发环境,方便用户直接基于该版本开发、部署各类机器学习和深度学习应用。

而windows部署,则是相当于仅预装操作系统,给用户足够的空间去自定义自己想要的AI应用。

云端绘梦:依托腾讯云HAI服务搭建CodeFormerAI 视频、图片修复工具

为了搭建我自己的AI应用,此处我也是选择了windows部署,具体部署步骤其实和上面一致,在此我就不过多赘述了。

点击算力链接—远程链接,或者直接win+R,输入mstsc,链接该服务器。

账号密码需要到站内信中获取。

这里我计划搭建的是CodeFormer工具,下面我也简单介绍一下关于CodeFormer的一些信息。

CodeFormer是一款由南洋理工大学S-Lab研发的强大AI图像与视频处理工具,主要应用于人脸修复领域,拥有出色的人脸清晰化、人脸色彩化以及人脸去马赛克等功能。该工具基于先进的深度学习和神经网络技术,可以有效地处理各种质量较低或受损的人脸图像,包括模糊、马赛克、噪声、遮挡等问题,以高度精确的方式恢复图像中人脸的细节和清晰度。

CodeFormer不仅支持图片格式的人脸修复,还具备视频去马赛克能力,能够自动识别并处理视频流中的马赛克部分,还原出高清晰度的画面内容。此外,该项目已在GitHub上开源,允许开发者和研究人员获取源代码并进行二次开发或直接使用其算法模型。

由于其广泛适用性和卓越的性能,CodeFormer获得了业内的高度评价,并被称为“业界顶尖AI去马赛克工具”。用户可以通过阅读GitHub项目上的README文件来了解项目的构建、安装和使用流程,适用于不同技术水平的用户,包括专业人士和业余爱好者。同时,还有移动端版本的CodeFormer可供移动设备用户进行图片和可能的视频编辑操作,提供了一种方便快捷的图像修复解决方案。

常规搭建方式

1 . 完成python 、git、conda 的环境安装

2 . 拉取CodeFormer

代码语言:python
代码运行次数:0
复制
Cloud Studio 代码运行
git clone https://github.com/sczhou/CodeFormer
cd CodeFormer
pip install -r requirements.txt -q
pip install -q gradio
python basicsr/setup.py develop

3 . 下载预训练模型

  • 从 Google Drive |下载 facelib 预训练模型 OneDrive 到weights/facelib文件夹。您可以手动下载预训练模型或通过运行以下命令下载。
代码语言:python
代码运行次数:0
复制
Cloud Studio 代码运行
python scripts/download_pretrained_models.py facelib
  • 从 Google Drive |下载 CodeFormer 预训练模型 OneDrive 到weights/CodeFormer文件夹。您可以手动下载预训练模型或通过运行以下命令下载。
代码语言:python
代码运行次数:0
复制
Cloud Studio 代码运行
python scripts/download_pretrained_models.py CodeFormer

其中:

面部修复(裁剪和对齐的面部)

代码语言:python
代码运行次数:0
复制
Cloud Studio 代码运行
# For cropped and aligned faces
python inference_codeformer.py -w 0.5 --has_aligned --input_path [input folder]

整体图像增强

代码语言:python
代码运行次数:0
复制
Cloud Studio 代码运行
# For whole image
# Add '--bg_upsampler realesrgan' to enhance the background regions with Real-ESRGAN
# Add '--face_upsample' to further upsample restorated face with Real-ESRGAN
python inference_codeformer.py -w 0.7 --input_path [image folder/image path]

视频增强

代码语言:python
代码运行次数:0
复制
Cloud Studio 代码运行
# For video clips
python inference_codeformer.py --bg_upsampler realesrgan --face_upsample -w 1.0 --input_path

保真度权重w位于 0, 1 中。通常,较小的w往往会产生较高质量的结果,而较大的w会产生较高保真度的结果。

结果将保存在results文件夹中。

快捷GUI一键安装

为了便于大家快速上手尝试,这里也是准备了一键安装版。(感谢B站大佬爱吃鱼的番茄共享)

链接:https://pan.baidu.com/s/1o9Xo9Cvxg5-h-KP9bM7Dtw

提取码:3kym

下载完成后如下图所示:

解压文件,等待约10分钟~

点击一键启动即可。

先进入到人脸图所在的文件夹目录下:

代码语言:shell
复制
C:\codeFormer-GUI-20230427\_internal\test_img

放入一张很模糊的人脸图。

选择输出后的图片位置为:

代码语言:shell
复制
C:/codeFormer-GUI-20230427/_internal/test_img/enhance_aligned

点击开始处理,在下方日志中可以看到实时进度。

10s左右可以处理完成,处理完结果如下所示:

清晰是清晰了,但是恢复的不是很好看,这时我们试着调整一下参数,让其多刻画一些细节。

但是此时会发现,当过度追求细节时反而会忽视掉整体的效果,反而不如以前了。

再调整为忠于原图

此时的整体效果就会好很多很多。

前后对比如下:

同样的,该工具也可以进行视频的清晰化,使用方式及步骤相同,在此不过多赘述。

至此,依托腾讯云HAI服务搭建CodeFormerAI 视频、图片修复工具完成。

基于腾讯云高性能应用服务 HAI ,探索 AI 绘画在创新业务中的应用

在当今数字化浪潮下,腾讯云高性能应用服务HAI正以其卓越的算力和高效的资源配置能力,有力地驱动着人工智能前沿技术在各行业的深度融合与创新应用。尤其是在AI绘画这一领域,HAI所带来的潜力犹如一幅正在徐徐展开的画卷,让科技与艺术完美交汇,从而开启了一系列创新业务的可能性。

在云端构建的智能绘画工作室中,借助HAI的强大支撑,艺术家们无需再受限于传统画笔与画布,只需凭借对美的理解和独特创意,通过简洁的文字描绘或精选的参考图像,即可实时唤起AI算法的心领神会,瞬息间生成令人赞叹不已的高质量艺术作品。这不仅为艺术创作提供了前所未有的便利性和效率,也大大拓宽了设计行业的边界,使个性化的品牌形象设计、包装设计乃至商业广告海报等业务得以迅速响应市场需求,实现按需定制化生产。

教育领域,HAI赋能的AI绘画工具亦展现出无尽的教学价值,它既可成为教师手中的可视化教辅神器,帮助学生们直观感受和理解各类艺术风格与技法;也能激发孩子们无限的创新精神,让他们与AI共同挥洒创意,借由一次次的互动与共创,培养出未来一代的艺术鉴赏能力和创造思维。

影视特效制作团队、游戏开发商以及电商零售巨头们也在纷纷向HAI投来关注的目光。在光影交错的电影世界里,AI绘画能够助力创作者瞬间跃升至幻想之地,快速构建故事所需的宏伟场景与鲜活角色,缩短特效制作周期,提升观影体验。而对于游戏界而言,AI绘画意味着能更高效地构建千变万化的游戏世界,赋予角色和场景以生动而细腻的生命力。

同时,在电商平台上,借助AI绘画技术,消费者能够亲身体验虚拟试穿或试戴,真实感十足的商品展示无疑将大大提升转化率。

至于社交媒体和内容创作平台,则因AI绘画的介入而焕发出新的活力。用户不再只是内容的消费者,而是转变为积极的参与者,他们可以随心所欲地运用AI绘画功能,轻松创作独一无二的图像内容,为自己在社交网络上的表达增添更多维度和趣味。此外,无论是电子书的封面设计还是新闻报道的插图生成,AI绘画都能扮演重要角色,确保每个细节都精准传递内容精髓,同时也为出版传媒行业注入创新动能。

写在结尾的话

鉴于本人第一次在腾讯云社区中发表相关文章,着实也不知道需要按照何种写法来叙述,所以此文也是按照本人一贯的行文方式来进行的,力求既保持技术内容的专业严谨,又兼顾新手入门的友好易懂。

不得不说,腾讯云的高性能应用服务HAI的确为我们提供了极大的便利和无限的可能性,尤其是在AI模型的部署与应用方面。其预置的各种先进AI模型和深度学习框架,如Stable Diffusion的WebUI和ComfyUI接口,以及ChatGLM2、Llama2等语言模型,极大地降低了AI技术的准入门槛。即使是不具备深厚AI背景的开发者,也可以借助HAI服务迅速搭建起自己的AI应用环境,实现从模型训练到部署上线的一体化流程。

此外,HAI服务也特别注重用户体验,它支持一键式部署和管理,使得开发者无需关心底层硬件配置和软件环境搭建,即可专注于上层业务逻辑的设计与开发。而其所提供的Pytorch 2.0.0和TensorFlow 2.9.0等预置框架,更是考虑到了广大开发者在实际项目中的多样需求,进一步提升了开发效率。

初次尝试难免会有不足之处,我也热切期待各位专家及社区同仁能够对本文提出宝贵的意见和建议,无论是关于技术细节的指正,还是针对讲解方式的优化,都将是我未来进步的动力。同时,我在此也鼓励读者们动手实践,并在实践中不断探索和完善,因为真正的理解往往源自于亲自操作与解决问题的过程。

我希望通过这篇分享,能够激发更多初入AI领域的朋友们的兴趣,引导他们了解并掌握腾讯云高性能应用服务HAI的强大功能。在未来,我也会继续深入研究,带来更多关于如何利用云计算技术推动AI落地应用的实战经验和案例分析,让我们共同见证和参与到人工智能技术发展的浪潮之中。

在此,我也衷心感谢腾讯云平台为开发者提供的强大支撑,也期待能在后续的文章中与大家持续交流,共享技术成长的乐趣。敬请关注我的频道,我们将一起踏上这段精彩的云计算与AI之旅,共同构建更加智能的未来世界。