登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書

『簡體書』DeepSeek图解:大模型是怎样构建的

書城自編碼: 4118899
分類:簡體書→大陸圖書→計算機/網絡人工智能
作者: 张治政,薛栋,公鑫 著
國際書號(ISBN): 9787301362020
出版社: 北京大学出版社
出版日期: 2025-07-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 97.9

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
世界情报组织秘密行动:上下册
《 世界情报组织秘密行动:上下册 》

售價:HK$ 217.8
梁思成眼中的中国建筑史
《 梁思成眼中的中国建筑史 》

售價:HK$ 96.8
女性心理学
《 女性心理学 》

售價:HK$ 87.8
CEO的五项修炼
《 CEO的五项修炼 》

售價:HK$ 96.8
叹为观纸 中国古纸的传说与历史
《 叹为观纸 中国古纸的传说与历史 》

售價:HK$ 86.9
中国历代男子服饰:图解中国男子传统服饰 解密古代男子穿什么 为什么这样穿
《 中国历代男子服饰:图解中国男子传统服饰 解密古代男子穿什么 为什么这样穿 》

售價:HK$ 107.8
经济学的观念:13位经济学巨匠和他们改变世界的思想(一本书领略群星璀璨的百年经济思想史)
《 经济学的观念:13位经济学巨匠和他们改变世界的思想(一本书领略群星璀璨的百年经济思想史) 》

售價:HK$ 85.8
面包+每日三明治(2册)
《 面包+每日三明治(2册) 》

售價:HK$ 143.0

編輯推薦:
(1)图解奥义 :思维导图详解大模型构建之道,开启AI智能新时代
(2)全面覆盖:从文本预处理到知识库系统,全链路解析DeepSeek核心技术
(3)实战演练:理论与实战交织,深度剖析大模型构建的关键环节
(4)聚焦未来:聚焦Transformer、多模态与MoE,助你掌握未来智能发展的密码
內容簡介:
《DeepSeek图解:大模型是怎样构建的》是一本系统讲解DeepSeek开发的技术指南,传授大家开发DeepSeek模型的基础知识。旨在帮助读者深入理解DeepSeek的工作机制,并掌握其在大规模预训练、推理优化及应用开发中的关键技术。 來源:香港大書城megBookStore,http://www.megbook.com.hk
全书共10章,依次介绍文本预处理、特征提取、文本分类与情感分析、语言的生成、机器翻译、DeepSeek的核心Transformer模型、多模态模型的架构和训练、预训练模型的训练与微调、DeepSeek API应用开发实战,以及基于DeepSeek的Web知识库系统。
《DeepSeek图解:大模型是怎样构建的》不仅适合对大模型感兴趣的技术人员阅读,也适合人工智能研究者、开发者及行业从业者等阅读。
關於作者:
张治政
----------------------------
张治政,中国海洋大学计算机硕士,哈尔滨工业大学通信博士,百度云研发工程师,百度大模型工程师,在大规模机器学习、深度学习、数据搜索、行业垂直应用、研发管理等领域拥有丰富经验。在企业智能化转型、业务线上化经营、拥有丰富的大规模搜索架构、个性化推荐架构、机器学习系统架构经验和技术团队管理经验。现在从事城市大数据中心的开发和建设工作,将深度学习运用到数字经济等领域。
薛栋
----------------------------
薛栋,华东理工大学信息科学与技术学院副教授、硕士生导师,德国慕尼黑工业大学工学博士,上海市高层次青年人才计划上海市浦江人才计划获得者。所在的X-D Lab(心动实验室)致力于人工智能技术的探索与研究,已发布多个垂直领域的大模型项目,包括心理领域的MindChat(漫谈)、医疗领域的 Sunsimiao(孙思邈)、教育领域的 GradChat(锦鲤)。
公鑫
----------------------------
公鑫,东南大学副教授,香港大学控制工程专业博士,研究领域主要聚焦集群智能,包括分布式控制、估计与优化、基于分布式估计和数字孪生的复合网络攻击与防御等。现任中国指挥与控制学会高级会员和青工委委员、中国自动化学会会员、中国计算机学会会员和网络弹性专委会委员、IEEE Member,并在多个国际期刊和会议上担任审稿人和分会场主席,曾获多项杰出审稿人奖。
目錄
目录
第1章 明月松间照,清泉石上流:文本预处理
1.1? 分词
1.1.1 分词的重要性和基本原理
1.1.2 基于空格的分词
1.1.3 基于标点符号的分词
1.2? 词干化与词形还原
1.2.1 词干化与词形还原的区别
1.2.2 词干化
1.2.3 词形还原
1.3? 去除停用词
1.3.1 什么是停用词
1.3.2 基于词汇列表的去除
1.3.3 基于词频的去除
1.3.4 TF-IDF 方法去除
1.3.5 机器学习方法去除
1.4? 数据清洗和处理
1.4.1 处理缺失值
1.4.2 异常值检测与处理
1.4.3 处理重复数据
第2章 大音希声,大象无形:特征提取
2.1? 特征提取介绍
2.1.1 特征在大模型中的关键作用
2.1.2 特征提取与数据预处理的关系
2.2? 特征选择
2.2.1 特征选择的必要性
2.2.2 特征选择的方法
2.3? 特征抽取
2.3.1 特征抽取的概念
2.3.2 主成分分析
2.3.3 独立成分分析
2.3.4 自动编码器
2.4? 嵌入
2.4.1 嵌入介绍
2.4.2 使用嵌入层进行特征提取
2.4.3 Word2Vec 模型
2.4.4 GloVe 模型
2.5? 词袋模型
2.5.1 实现词袋模型的步骤
2.5.2 词袋模型的限制与改进
2.6? TF-IDF 值
2.6.1 什么是 TF-IDF
2.6.2 使用 TF-IDF 方法提取文本特征
2.6.3 TF-IDF 方法与词袋模型的比较
第3章 人有悲欢离合,月有阴晴圆缺:文本分类与情感分析
3.1? 朴素贝叶斯分类器
3.1.1 朴素贝叶斯分类器的基本概念
3.1.2 朴素贝叶斯分类器的应用场景
3.2? 支持向量机
3.2.1 SVM 介绍
3.2.2 线性 SVM 与非线性 SVM
3.3? 随机森林
3.3.1 随机森林介绍
3.3.2 随机森林的应用场景
3.4? 卷积神经网络
3.4.1 CNN 的发展背景
3.3.2 CNN 的结构
3.3.3 文本特征提取与分类
3.5? 循环神经网络
3.5.1 循环神经网络介绍
3.5.2 使用 TensorFlow 框架制作情感分析模型
3.6? 递归神经网络
3.6.1 递归神经网络的主要特点
3.6.2 RvNN
第4章 白日依山尽,黄河入海流:语言的生成
4.1? 基于规则的生成
4.1.1 基于规则的生成方法介绍
4.1.2 基于规则的生成方法在 NLP 中的应用场景
4.2? 基于统计的生成
4.2.1 基于统计的生成方法介绍
4.2.2 N-gram 模型
4.2.3 隐马尔可夫模型
4.2.4 最大熵模型
4.3? 基于神经网络的生成
4.3.1 基于神经网络的生成方法
4.3.2 生成对抗网络
4.4? 注意力机制
4.4.1 注意力机制介绍
4.4.2 注意力机制的变体
4.5? 序列到序列模型
4.5.1 Seq2Seq 模型介绍
4.5.2 使用 Seq2Seq 模型实现翻译系统
第5章 海内存知己,天涯若比邻:机器翻译
5.1? 统计机器翻译
5.1.1 SMT 介绍
5.1.2 SMT 模型
5.1.3 SMT 的训练和解码
5.2? 神经机器翻译
5.2.1 NMT 的特点和工作流程
5.2.2 NMT 的训练和解码
5.2.3 基于 NMT 的简易翻译系统
第6章 会当凌绝顶,一览众山小:DeepSeek 的核心 Transformer 模型
6.1? Transformer 模型介绍
6.1.1 Transformer 模型的基本概念
6.1.2 Transformer 模型的优势
6.1.3 Transformer 模型的核心组件
6.1.4 机器翻译任务中的 Transformer 模型
6.2? 多头注意力机制和多头潜在注意力
6.2.1 多头注意力机制
6.2.2 多头潜在注意力
6.3? 混合专家架构
6.3.1 MoE 架构介绍
6.3.2 MoE 架构的特点
6.3.3 MoE 架构的应用
6.3.4 DeepSeek 中的 MoE 架构介绍
第7章 大漠孤烟直,长河落日圆:多模态模型的架构和训练
7.1? 多模态技术简介
7.1.1 多模态介绍
7.1.2 多模态技术的发展历史
7.2? DeepSeek 的多模态大模型
7.2.1 DeepSeek 多模态大模型的发展历程
7.2.2 架构介绍
7.2.3 多模态理解
7.2.4 视觉生成路径
7.2.5 自回归 Transformer 模型
7.2.6 三阶段训练策略
7.3? 训练策略
7.3.1 多任务学习
7.3.2 全量微调
7.3.3 对比学习
7.3.4 参数高效微调
7.3.5 迁移学习
7.3.6 人类反馈强化学习
7.3.7 动态学习率调整
7.3.8 监督微调
第8章 学而时习之,不亦说乎:预训练模型的训练和微调
8.1? 预训练模型的训练和微调介绍
8.1.1 预训练
8.1.2 微调
8.1.3 预训练与微调的对比
8.2? CLIP 模型的微调
8.2.1 实例介绍
8.2.2 创建文本和图像配对数据集
8.2.3 创建模型
8.2.4 训练模型
8.2.5 模型微调
8.2.6 调试运行
8.3? 使用 KTO 微调 DeepSeek-R1-Distill Qwen 模型
8.3.1 KTO 的概念
8.3.2 DeepSeek-R1-Distill-Qwen 模型介绍
8.3.3 具体实现
第9章 千帆过尽,始见真章:DeepSeek API 应用开发实战
9.1? DeepSeek API 开发基础
9.1.1 DeepSeek API 介绍
9.1.2 DeepSeek API 基本教程
9.1.3 基于 DeepSeek API 的对话应用程序
9.2? DeepSeek 的基本接入实战
9.2.1 Chatbox 接入实战
9.2.2 NextChat 接入实战
9.3? 社交媒体工具接入实战
9.3.1 基于 DeepSeek 的微信聊天 机器人
9.3.2 基于 DeepSeek 的 QQ 机器人
9.4? 将 DeepSeek 接入到 Office
9.4.1 OfficeAI 介绍
9.4.2 在 Word 中应用 DeepSeek
9.4.3 在 Excel 中应用 DeepSeek
9.5? 将 DeepSeek 接入 VS Code
9.5.1 Continue 插件基础
9.5.2 将 DeepSeek 接入 VS Code 316
9.5.3 调用 DeepSeek 生成代码
9.5.4 DeepSeek 代码生成和补全
第 10 章 纸上得来终觉浅,绝知此事要躬行:基于 DeepSeek 的 Web 知识库系统
10.1? 项目介绍
10.1.1 背景介绍
10.1.2 市场需求
10.1.3 主要功能
10.1.4 技术栈
10.2? 配置文件和基础工具函数
10.2.1 导航栏配置
10.2.2 基础工具函数
10.2.3 API 交互工具函数
10.3? 组件
10.3.1 页面布局组件
10.3.2 聊天组件
10.4? 调试运行
內容試閱
DeepSeek专注于开发先进的大语言模型(Large Language Model,LLM)和相关技术。DeepSeek的诞生既是对全球人工智能浪潮的深刻响应,也是中国在大规模语言模型研发领域迈出的坚实步伐。
DeepSeek 不仅融合了最先进的视觉、语言以及跨模态交互技术,还通过高效的模型训练与推理机制,实现了复杂任务的精准处理和快速响应。DeepSeek 为研究人员和开发者构建了一座连接理论与实践的桥梁,极大地降低了高性能 AI 技术的应用门槛,推动了前沿技术在各行各业中的广泛应用和产业化进程。
本书的出版缘由
近年来,大模型技术迅猛发展,推动了自然语言处理(Natural Language Processing,NLP)、计算机视觉(Computer Vision,CV)及多模态(Multimodal)学习等领域的突破性进展。DeepSeek作为先进的大模型架构之一,在文本理解、生成、翻译以及多模态交互等任务中展现出强大能力,受到人工智能研究者、开发者和企业的广泛关注。在此背景下,DeepSeek 等大模型展现出巨大潜力与广泛影响力。然而,与之相伴的还有一系列需求与挑战,体现在以下几个方面。
◎? 系统性学习大模型技术的书籍相对缺乏:开发和优化类似 DeepSeek 这样的大模型需要深入理解其底层架构、训练方法、优化策略及应用落地方案,但相关技术学习门槛较高,系统性学习资料有限。本书填补了这一空白,帮助读者从基础入门,逐步掌握 DeepSeek 类大模型的开发与应用。
◎? 企业对大模型人才的需求增加:许多企业希望构建自己的大模型或基于现有模型进行优化,以满足特定业务需求。然而,大模型的训练、优化及部署涉及复杂的工程实现和算力资源管理,市场上具备该能力的技术人才极为稀缺。本书通过系统讲解 DeepSeek 类大模型的技术架构、训练方法、推理优化及应用开发,帮助开发者和工程师提升技能,满足市场需求。
◎? 学术界与研究机构的技术需求:随着大模型相关研究成为人工智能领域的热门课题,许多高校和研究机构都在探索如何优化大模型的计算效率、提升模型可解释性并拓展其应用场景。本书为研究者提供全面的技术解析,帮助他们深入理解 DeepSeek,并探索其在不同任务中的应用。
◎? 创业者与技术爱好者的需求:随着开源大模型的兴起,越来越多的创业公司和独立开发者希望基于现有的大模型架构开发新应用,或训练适用于特定领域的专属模型。然而,缺乏系统性的技术指导往往成为他们面临的主要挑战。本书通过理论结合实践,帮助创业者和技术爱好者快速掌握大模型的开发方法,并提供实际案例指导,助力他们高效落地 AI 应用。
◎? 推动国产大模型生态发展:DeepSeek 等国产大模型的崛起,标志着我国在大模型技术领域取得了突破性进展。为了促进国产大模型的生态建设,需要更多技术人才参与其中,推动模型优化与应用拓展。本书通过深入讲解 DeepSeek 的架构和应用,帮助开发者更好地理解和应用国产大模型,助力国内 AI 产业的发展。
综上所述,本书填补了市场对于 DeepSeek 类大模型开发知识的需求,适合人工智能领域的开发者、研究者、企业工程师、创业者及 AI 爱好者,为他们提供完整的学习路径,助力大模型技术的创新和落地应用。
本书的特色
◎? 系统讲解大模型开发:本书从基础概念到高级应用,系统讲解 DeepSeek 类大模型的开发流程,包括数据预处理、特征提取、文本分类、语言生成、机器翻译、多模态学习、模型训练与优化、API 应用开发等,帮助读者全面掌握大模型的核心技术。
◎? 理论与实践相结合:本书不仅详细解析了 Transformer 模型等核心技术,还通过代码实例、案例分析和实战演练,帮助读者将理论知识转化为实际开发能力,快速上手大模型训练与应用。
◎? 覆盖多模态与前沿技术:除了文本处理和传统 NLP 任务,本书还介绍了 DeepSeek 的多模态架构,包括视觉理解、跨模态学习、混合专家(Mixture-of-Experts,MoE)等前沿技术,帮助读者了解大模型在图像、文本、语音等领域的融合应用。
◎? 深入解析优化策略:针对大模型的训练成本高、计算资源需求大等问题,本书介绍了多任务学习、参数高效微调(Parameter-Efficient Fine-Tuning,PEFT)、人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF)、动态学习率调整等优化策略,帮助读者提升模型性能、降低训练成本。
◎? 实战驱动,直击行业应用:本书不仅讲解 DeepSeek API 的应用开发,还涵盖基于 DeepSeek的聊天机器人、办公自动化、代码生成、知识库系统等多个应用场景,助力开发者将大模型技术落地到实际业务中。
◎? 助力国产大模型生态发展:作为一本围绕 DeepSeek 展开的技术书籍,本书有助于开发者更好地理解和应用国产大模型,推动国内大模型生态的创新和发展。
总之,本书凭借系统全面的讲解、丰富的实战案例和前沿技术解析,帮助读者快速掌握DeepSeek 类大模型的开发与优化方法,为人工智能的研究与应用提供强有力的技术支持。

本书适合哪些读者
◎? 人工智能研究者:适合从事自然语言处理、大模型研究的学者,帮助其深入理解DeepSeek及其优化策略。
◎? 开发者与工程师:适合希望掌握大模型开发、训练、优化及应用部署的 AI 工程师、算法工程师和软件开发人员。
◎? 大数据与机器学习从业者:适合在数据科学、机器学习领域工作的技术人员,提升其对大模型特征提取、文本处理、模型优化等核心技术的理解。
◎? 企业技术团队:适合希望将大模型技术应用到实际业务场景(如智能客服、自动翻译、知识管理、代码生成等)的企业 AI 团队。
◎? 对大模型感兴趣的学习者:适合对人工智能、大模型技术感兴趣的学生或自学者,帮助他们建立系统的认知,并快速上手 DeepSeek 相关开发。
总之,无论是 AI 初学者还是有经验的开发者,本书都能提供深入的理论解析与实战案例,帮助他们掌握大模型开发的核心知识,并将其应用到实际项目中。
致谢
在本书的编写过程中,作者得到了北京大学出版社编辑的大力支持。正是他们的严谨、耐心和高效,才使本书能够在这么短的时间内顺利出版。对此,我深表感谢。
同时,也衷心感谢家人在整个写作期间给予的巨大支持与理解。他们的陪伴与鼓励是我坚持完成本书的重要动力。
由于作者水平有限,书中难免存在纰漏与不足之处,恳请广大读者不吝赐教,提出宝贵的意见与建议,以便在后续版本中不断完善与改进。
最后,感谢您选择并阅读本书。希望本书能成为您编程与技术探索路上的得力向导,并助您在学习与实践中不断进步!祝您阅读愉快!

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.