《图解DeepSeek技术》

编辑推荐

适读人群：大众读者

1.【短小精悍】2小时搞懂DeepSeek底层技术

2.【通俗图解】近120幅全彩插图通俗解读，不枯燥

3.【内容系统】从推理模型原理到DeepSeek-R1训练

4.【作者资深】大模型领域知名专家Jay & Maarten作品

5.【图解系列】袋鼠书《图解大模型》同系列，广受欢迎

内容简介

《图解DeepSeek技术》本书以通俗易懂、大量图解的方式剖析了DeepSeek的底层技术。

《图解DeepSeek技术》全书分为3章和附录，第1章详细分析推理大模型的范式转变，即从“训练时计算”到“测试时计算”；第2章解读DeepSeek-R1的架构——混合专家（MoE），第3章展示DeepSeek-R1详细的训练过程及核心技术，涵盖基于GRPO的强化学习等；附录分享DeepSeek开源周活动。

《图解DeepSeek技术》本书适合大模型从业人员和对大模型底层技术感兴趣的读者。书中通过丰富的图解将复杂的技术解释得简单、清晰、通透，是学习大模型技术难得一见的参考书。

作者简介

Jay Alammar（杰伊·阿拉马尔）

Cohere总监兼工程研究员，知名大模型技术博客Language Models & Co作者，DeepLearning.AI和Udacity热门机器学习和自然语言处理课程作者。

Maarten Grootendorst（马尔滕·格鲁滕多斯特）

IKNL（荷兰综合癌症中心）高级临床数据科学家，知名大模型技术博客博主，BERTopic等开源大模型软件包作者（下载量超过百万次），DeepLearning.AI和Udacity课程作者。

Jay & Maarten撰写的图解系列文章广受赞誉，累计吸引了数百万专业读者的目光。其中，Jay 的“The Illustrated Transformer”“The Illustrated DeepSeek-R1”、Maarten的“A Visual Guide to Reasoning LLMs”在全网热度极高。

Jay & Maarten的第一部作品《图解大模型：生成式AI原理与实战》（Hands-On Large Language Models）是业内广受赞誉的经典。《图解DeepSeek技术》是Jay & Maarten的第二部作品，人民邮电出版社图灵全球独家发布，是解读DeepSeek原理与训练的宝贵读物。

李博杰

智能体初创公司PINE AI联合创始人、首席科学家。曾任华为计算机网络与协议实验室副首席专家，入选华为首批“天才少年”项目。2019年获中国科学技术大学与微软亚洲研究院联合培养博士学位，曾获ACM中国优秀博士学位论文奖和微软学者奖学金。在SIGCOMM、SOSP、NSDI、USENIX ATC和PLDI等顶级会议上发表多篇论文。

孟佳颖

中国科学技术大学博士。现任北京中关村实验室助理研究员，主要从事网络协议栈的漏洞挖掘与风险分析技术的研究工作。