编辑推荐
适读人群 :AI方向的大学生、工程师、研究者。希望学习大模型技术的跨行业读者
精心绘制100+全彩架构图,深入浅出,直击核心
资深算法工程师撰写,深度契合大厂所用所需
全程独著打磨,确保至臻品质、始终如一
开创性地系统讲解强化学习等大模型算法
电子版原理图及相关资料

内容简介
《大模型算法:强化学习、微调与对齐》本书系统地讲解了大模型技术、训练算法(包括强化学习、RLHF、GRPO、DPO、SFT与CoT蒸馏等)、 微调与对齐、效果优化及其实践。全书以大语言模型(LLM)为主线,绝大部分内容也适用于多模态大模型(VLM 和MLLM)。
《大模型算法:强化学习、微调与对齐》本书面向AI算法与工程领域的从业者、相关专业的学生,以及希望深入了解大模型技术、拥抱AI与大模型浪潮的跨行业读者。
作者简介
余昌叶
资深算法工程师,哈尔滨工业大学优秀毕业生。曾就职于腾讯等多家头部互联网企业,拥有十年行业经验。主要研究方向为大模型、强化学习、推荐系统及图像处理。具备扎实的数学功底与深厚的算法理论基础,主导并完成多项核心AI技术项目的工程化落地。已获六项国家发明专利,曾荣获科研类全国航空航天模型锦标赛亚军等专业奖项,以及腾讯卓越研发奖(团队)、腾讯知识奖等多项企业级荣誉。
相关图书
《人工智能的底层逻辑》
清华大学人工智能通识课,跟清华学子同上一门课
《DeepSeek教师实战手册》
针对教师的保姆级使用指南,手把手教你用DeepSeek焕新课堂
《教师助手2:巧用DeepSeek高效工作》
学会AI,解放教师双手,助力教师行政办公+学生管理+学风建设+思政教育+科研效率100倍提升。
《课堂智变:生成式人工智能赋能学科实践》
结合各学科的真实教学案例,深入剖析文科、理科、艺术与体育等学科的独特需求
《人工智能线性代数基础》
AI工程师的数学密码:用线性代数重塑你的算法竞争力
《生成式AI写作》
AIGC赋能新闻传播研究与实战
暂无评论...










京公网安备11010502052249号