编辑推荐
适读人群 :本书既适合AI图像生成领域的从业者尤其是软件开发人员、产品经理阅读,也适合对AI图像生成感兴趣的AI技术科研人员和计算机相关专业的学生阅读。
如果你已经掌握了一些图像生成的零散知识,但是想要形成完整的知识体系
如果你好奇Midjourney、Stable Diffusion、DALL·E等模型,在实现上有何不同
如果你想自己动手训练一个图像生成模型
那么可以读一读这本书,系统、快速地构建AI图像生成的知识脉络!

内容简介
《AI图像生成核心技术与实战》本书以AI图像生成为主线,串联讲解了Stable Diffusion、DALL·E、Imagen、Midjourney等模型的技术方案,并带着读者训练一个自己专属的AI图像生成模型。
《AI图像生成核心技术与实战》本书共6章。第1章先介绍身边的AIGC产品,再讲解AI图像生成相关的深度学习基础知识,包括神经网络和多模态模型的基础知识。第2章讲解AI图像生成技术,从VAE到GAN到基于流的模型再到扩散模型的演化,并详细介绍扩散模型的算法原理和组成模块。第3章讲解Stable Diffusion模型的核心技术。第4章讲解DALL·E 2、Imagen、DeepFloyd和Stable Diffusion图像变体模型的核心技术。第5章讲解Midjourney、SDXL和DALL·E 3的核心技术。第6章是项目实战,使用LoRA技术对Stable Diffusion模型进行微调,得到特定风格的AI图像生成模型。
作者简介
南柯,某头部互联网公司 AIGC 团队技术负责人,高级算法专家,极客时间“AI 绘画核心技术与实战”专栏作者,拥有十多年计算机视觉领域从业经验,带领团队推动多模态生成,尤其是 AI 图像生成与编辑、多模态大语言模型、数字人等热点方向的技术建设。在 ICCV 和AAAI 年会等 AI 领域顶级会议上发表过多篇论文,拥有 100 多项专利。










京公网安备11010502052249号