




 
本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAI GPT、清华大学GLM、Meta Llama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型。 本书适合人工智能领域有大模型开发需求或对大模型技术感兴趣的技术人员阅读,也适合普通用户扩展了解大模型的前沿应用。
作者简介:
文亮 硕士毕业于电子科技大学,奇虎360智脑团队资深算法专家,参与过千亿参数级别大模型的训练与优化,拥有超过8年的人工智能模型优化经验,目前主要负责大模型后训练、COT优化以及通用技能优化等工作,著有《推荐系统技术原理与实践》一书。 江维 电子科技大学教授、博士生导师,主要研究可信人工智能、安全关键嵌入式系统、移动智能、大数据加速等领域,发表相关高水平论文100余篇。
目录:
第1章 大模型简介 .................. 1
第2章 大模型理论基础 .......... 20
第3章 OpenAI GPT系列大模型 ....................... 54
第4章 清华大学通用预训练 模型—GLM ............. 86
第5章 Meta开源大模型 —Llama ............... 110
第6章 大模型参数高效 微调 .........................125
第7章 大模型指令微调 ........ 138
第8章 大模型训练优化 ........ 153
第9章 大模型推理优化 ........ 177
第10章 AIGC和大模型 结合 .................... 189
第11章 大模型和推荐系统结合 ..................... 228
第12章 构建私有大模型 .... 236
点击下载