AI 图书馆AI科研教学

《DeepSeek大模型高性能核心技术与多模态融合开发》

揭示DeepSeek高性能的秘密,解析注意力机制与多模态融合技术

  • 作者王晓华
  • 出版社清华大学出版社
  • 出版日期2025-03-01
  • 用纸胶版纸
  • 装帧平装
  • ISBN编号9787302684893
  • 标签

编辑推荐

(1)DeepSeek多模态大模型正备受瞩目,而其背后的高性能注意力机制与多模态融合技术更是成为了深度学习研究领域的热点。

(2)《DeepSeek大模型高性能核心技术与多模态融合开发》致力于成为读者全面掌握DeepSeek核心技术的宝典,通过深入浅出的原理讲解与实例分析,引导读者系统学习DeepSeek的核心原理、架构及应用开发方法。

(3)《DeepSeek大模型高性能核心技术与多模态融合开发》深入剖析DeepSeek的核心技术多头潜在注意力MLA与混合专家模型MoE,详细阐述它们的工作原理与技术优势。

(4)《DeepSeek大模型高性能核心技术与多模态融合开发》详细探讨DeepSeek中的多模态融合方法,结合丰富的应用实例,为读者提供全面的理论与实践指导,助力读者深入理解高性能大模型的运行机制。

(5)实战项目涵盖情感分类、图像识别、语音识别、文本生成、图像生成、图文问答、视频分类、智能客服等应用场景。

(6)配套示例源码、数据文件、PPT课件、配图PDF文件与读者微信交流群。

内容简介

《DeepSeek大模型高性能核心技术与多模态融合开发》深入剖析国产之光DeepSeek多模态大模型的核心技术,从高性能注意力机制切入,深入揭示DeepSeek的技术精髓与独特优势,详细阐述其在人工智能领域成功的技术秘诀。《DeepSeek大模型高性能核心技术与多模态融合开发》循序渐进地讲解深度学习注意力机制的演进,从经典的多头注意力(MHA)逐步深入DeepSeek的核心技术—多头潜在注意力(MLA)与混合专家模型(MoE)。此外,《DeepSeek大模型高性能核心技术与多模态融合开发》还将详细探讨DeepSeek中的多模态融合策略、技术及应用实例,为读者提供全面的理论指导与应用实践。《DeepSeek大模型高性能核心技术与多模态融合开发》配套所有示例源码、PPT课件、配图PDF文件与读者微信技术交流群。

《DeepSeek大模型高性能核心技术与多模态融合开发》共分15章,内容涵盖高性能注意力与多模态融合概述、PyTorch深度学习环境搭建、DeepSeek注意力机制详解(包括基础篇、进阶篇、高级篇及调优篇)、在线与本地部署的DeepSeek实战(如旅游特种兵迪士尼大作战、广告文案撰写与微调、智能客服等),以及多模态融合技术与实战应用(如Diffusion可控图像生成、多模态图文理解与问答、交叉注意力语音转换、端到端视频分类等)。

《DeepSeek大模型高性能核心技术与多模态融合开发》既适合DeepSeek核心技术初学者、注意力机制初学者、大模型应用开发人员、多模态融合开发人员、大模型研究人员,也适合高等院校及高职高专院校人工智能大模型方向的师生。

作者简介

王晓华

高校计算机专业讲师,研究方向为云计算、大数据与人工智能。其著作包括《深入探索Mamba模型架构与应用》《PyTorch深度学习与计算机视觉实践》《PyTorch语音识别实战》《ChatGLM3大模型本地化部署、应用开发与微调》《从零开始大模型开发与微调:基于PyTorch与ChatGLM》《PyTorch 2.0深度学习从零开始学》《Spark 3.0大数据分析与挖掘:基于机器学习》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow语音识别实战》《TensorFlow 2.0卷积神经网络实战》《深度学习的数学原理与实现》。

相关图书

《空间计算:人工智能驱动的新商业革命》
一本书读懂继手机之后的下一代人机交互平台
《可解释人工智能导论》(全彩)
阐述可解释AI研究的问题和方法,详尽展示其广泛应用和积极作用
《AI场景革命》
空间计算时代如何打造爆款场景模型
《解码生物电:下一场生命科学革命》
读懂生物电简史,迎接下一场生命科学革命
《生成式人工智能:AIGC的逻辑与应用》
一本书带你读懂AIGC,了解ChatGPT等新兴技术的核心逻辑,从技术、功能、逻辑到前景商业应用。
《 多模态大模型:技术原理与实战》
详述多模态大模型的核心技术和应用场景,让中小公司可以从0到1部署多模态大模型

暂无评论

暂无评论...