《从零构建大模型》

编辑推荐

适读人群：本书适合对机器学习和生成式AI 感兴趣的读者阅读，特别是那些希望从零开始构建自己的大模型的读者。

Github4万星神作，数据处理+模型搭建+无监督训练+任务微调，仅需掌握Python，带你从零构建AI大模型；

揭开大模型背后的面纱，让读者了解其工作原理，学习如何评估其质量，并掌握微调和改进的具体技术；

强调亲手实践，使用PyTorch而不依赖现有库，通过各种图表和图解帮助读者深入理解LLM的工作机制、局限性和定制方式；

通过本书的学习，读者可以创建自己的小型但功能强大的模型，并将其作为个人助手使用；

更有惊喜彩蛋：深度解析DeepSeek大模型背后技术，揭秘行业前沿！

内容简介

《从零构建大模型》本书是关于如何从零开始构建大模型的指南，由畅销书作家塞巴斯蒂安·拉施卡撰写，通过清晰的文字、图表和实例，逐步指导读者创建自己的大模型。在本书中，读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练，以及定制特定任务的微调。此外，本书还将探讨如何利用人工反馈确保大模型遵循指令，以及如何将预训练权重加载到大模型中。

作者简介

塞巴斯蒂安·拉施卡（Sebastian Raschka）

极具影响力的人工智能专家，本书配套GitHub项目LLMs-from-scratch达4万星。现在大模型独角兽公司Lightning Al任资深研究工程师。博士毕业于密歇根州立大学，2018~2023年威斯康星大学麦迪逊分校助理教授（终身教职），从事深度学习科研和教学。除本书外，他还写作了畅销书《大模型技术30讲》和《Python机器学习》。