



本书系统构建了深度学习理论与应用的全栈知识体系,从数学基础与机器学习核心原理出发,贯通线性代数、概率统计等关键数学工具,夯实算法研发的理论根基.面向新一代通用图形处理器(GPGPU)硬件架构,深入解析专用编程语言的语法设计与高效编程实践,剖析主流训练与推理框架的底层机制,并结合壁仞科技GPGPU平台,提供针对性的适配与性能优化方案.通过计算机视觉与自然语言处理领域的经典案例,展示传统算法在异构计算架构下的性能跃迁.聚焦大模型技术前沿,系统阐述大语言模型(LLM)入、视觉语言模型(VLM)及混合专家模型(MoE)的架构演进,结合DeepSeek--V3、Mixtral8×TB等代表性模型在壁仞GPGPU上的优化实践,揭示硬件加速对千亿参数模型训练与推理的显著增益.进一步拓展至人工智能(AI)与科学计算融合前沿,通过物理信息神经网络、量子系统模拟、微分方程求解等跨学科应用,展现GPGPU在高性能计算中的核心优势.全书融合理论推导与工程实践,既涵盖算法原理的严谨分析,又提供可复现的芯片级优化指南,为AI工程师与研究人员提供从模型设计到硬件加速的端到端技术路径。
作者简介:
洪洲是壁仞科技的联合创始人、首席技术官(CTO)兼首席架构师,拥有近30年GPU架构设计经验,专注于GPU架构设计、渲染算法、光线跟踪算法、并行计算、GPGPU、X86和Arm SoC的架构设计等领域,持有50多项已获批准的专利。在加入壁仞科技前,洪洲曾担任华为旗下海思自研GPU的负责人和首席架构师,组建了全球数百人的GPU研发团队,并推进了拥有自主IP的GPU芯片研发。此前,他还曾在英伟达工作,负责Tesla架构的设计与性能调优,英伟达第一版CUDA即基于该架构开发;并在S3 Graphics、兆芯等企业领导和管理GPU研发项目多年。教育背景方面,洪洲拥有北京大学数学学士学位,清华大学管理硕士学位,以及纽约州立大学布法罗分校数学及计算机科学硕士学位。
目录:
第 1 章 数学与机器学习基础 / 1
第 2 章 BIRENSUPA 编程模型 / 46
第 3 章 深度学习框架 / 95
第 4 章 传统计算机视觉与自然语言处理 / 125
第 5 章 大语言模型 / 218
第 6 章 视觉语言模型 / 271
第 7 章 混合专家模型 / 289
第 8 章 科学计算与 AI / 308
点击下载