AI 图书馆AI教研图书

《大模型算法:强化学习、微调与对齐》(全彩)

系统讲解大模型技术、训练算法、 微调与对齐、效果优化及其实践。

  • 作者余昌叶
  • 出版社电子工业出版社
  • 出版日期2025-05-01
  • 页数260
  • 装帧平装
  • ISBN编号9787121500725
  • 标签

编辑推荐

适读人群 :AI方向的大学生、工程师、研究者。希望学习大模型技术的跨行业读者
精心绘制100+全彩架构图,深入浅出,直击核心

资深算法工程师撰写,深度契合大厂所用所需

全程独著打磨,确保至臻品质、始终如一

开创性地系统讲解强化学习等大模型算法

电子版原理图及相关资料

《大模型算法:强化学习、微调与对齐》(全彩)

内容简介

《大模型算法:强化学习、微调与对齐》本书系统地讲解了大模型技术、训练算法(包括强化学习、RLHF、GRPO、DPO、SFT与CoT蒸馏等)、 微调与对齐、效果优化及其实践。全书以大语言模型(LLM)为主线,绝大部分内容也适用于多模态大模型(VLM 和MLLM)。

《大模型算法:强化学习、微调与对齐》本书面向AI算法与工程领域的从业者、相关专业的学生,以及希望深入了解大模型技术、拥抱AI与大模型浪潮的跨行业读者。

作者简介

余昌叶

资深算法工程师,哈尔滨工业大学优秀毕业生。曾就职于腾讯等多家头部互联网企业,拥有十年行业经验。主要研究方向为大模型、强化学习、推荐系统及图像处理。具备扎实的数学功底与深厚的算法理论基础,主导并完成多项核心AI技术项目的工程化落地。已获六项国家发明专利,曾荣获科研类全国航空航天模型锦标赛亚军等专业奖项,以及腾讯卓越研发奖(团队)、腾讯知识奖等多项企业级荣誉。

相关图书

《未来医疗:智能时代的个体医疗革命》
全景展现未来医疗图,定位移动医疗的下一个风口
《深度剖析ChatGLM :原理、训练、微调与实战》
关注ChatGLM在客服、金融、医疗、教育等领域的创新应用
《人机物融合群智计算》
人类正在进入一个人机物三元融合的万物智能互联时代!人机物融合群智计算必将是下一个AI风口!
《DeepSeek驱动工业智能:技术架构、应用路径与实践创新》
本书以DeepSeek技术体系为核心,全面探讨了工业智能的技术架构与应用实践
《如何创造可信的AI》
本书勾勒了未来人工智能发展的最佳路线图
《AI传媒学:大模型助力传媒行业应用与创新》
传媒行业转型浪潮汹涌,大模型如何赋能?本书为您全景解读。

暂无评论

暂无评论...