AI 图书馆AI科研教学

《大语言模型:原理与工程实践》(全彩)

大模型工程实践,系统性强,手把手教你训练LLM

  • 作者杨青
  • 出版社电子工业出版社
  • 出版日期2024-03-01
  • 页数260
  • 装帧平装
  • ISBN编号9787121473043
  • 标签

编辑推荐

适读人群 :通过阅读本书,读者可以获得全面且深入的大语言模型的知识框架。无论您是研究人员、工程师,还是产品经理,都能从中获得有价值的知识。

作者知名:轩辕大模型负责人:真正的大语言模型实践者,拥有十亿、百亿、千亿等不同参数规模大语言模型的训练经验

系统性强:从数据处理的基础工作(如数据清洗与去重)讲起,逐步深入,探讨预训练、微调技术和强化对齐技术等核心技术环节。同时,书中对大语言模型评估策略及其应用技术架构,包括推理引导技术和动态交互技术,进行了全面且深入的探讨,确保读者能够从理论和技术角度全面理解大语言模型。

实践性强:精心设计了从零开始的教学章节,提供大语言模型微调的详细指导,逐步引领读者掌握关键技能。

《大语言模型:原理与工程实践》本书不仅有助于初学者迅速上手,也为有经验的开发者提供了深入学习的机会

《大语言模型:原理与工程实践》(全彩)

内容简介

《大语言模型:原理与工程实践》本书用10章对大语言模型进行全面且深入的介绍。首先对大语言模型的基本概念进行介绍。其次,从大语言模型的基础技术、预训练数据构建、预训练技术等方面展开讨论,帮助读者深入了解大语言模型的构建和训练过程。然后,详细介绍有监督微调和强化对齐等技术,以及如何评估大语言模型的性能。此外,介绍提示工程和工程实践等方面的内容,帮助读者了解大语言模型的应用和实际操作过程。最后,介绍如何从零开始微调大语言模型,辅以代码示例,帮助读者更好地应用这些技术。

通过阅读《大语言模型:原理与工程实践》这本书,读者可以获得全面且深入的大语言模型的知识框架。无论您是研究人员、工程师,还是产品经理,都能从中获得有价值的知识。

作者简介

杨青

度小满金融技术委员会执行主席、数据智能应用部总经理,度小满AI Lab负责人,硕士毕业于清华大学计算机系,曾就职于百度、阿里巴巴,从事自然语言处理、搜索、推荐、大数据架构等相关方向的研发工作。

2018年年初加入度小满金融,组建数据智能部和AI Lab团队,从0到1构建度小满金融的智能引擎核心算法,深耕计算机视觉、自然语言处理、图模型、机器学习、因果推断等技术领域,多篇文章被EMNLP、ACL、CIKM等国际会议收录,“智能化征信解读中台”工程荣获吴文俊人工智能科技进步奖。相关技术广泛应用于度小满营销、经营、风控、反欺诈全流程业务场景,为上千万客户提供稳定、安全的金融服务。

目前,专注于AIGC相关研究及产品落地工作,基于度小满模型即服务(MaaS)的模式积极探索文生图、数字人与生成式大语言模型的应用转化。于2023年年初带领团队发布千亿参数规模的中文大语言模型“轩辕”。2023年9月, “轩辕-70B”大语言模型在C-Eval和CMMLU两大权威榜单上位列所有开源模型榜首。

相关图书

《 多模态大模型:技术原理与实战》
详述多模态大模型的核心技术和应用场景,让中小公司可以从0到1部署多模态大模型
《实战AI大模型》
从基本概念到实践技巧的,全方位解读AI大模型
《突破边界:AI大模型驱动数智化能力变革》
深入探索AI大模型在企业发展中的应用,提供一系列战略建议和实践案例
《多模态大模型:算法、应用与微调》
多模态大模型技术全景解析,丰富实战案例助你掌握部署、微调和优化
《GPT图解:大模型是怎样构建的》
带你从0到1构建大模型,突破语言奥秘,开启智能未来!
《大模型导论》
手把手教你大模型开发,从基础概念入手,逐步深入技术原理和应用,实战案例讲解

暂无评论

暂无评论...