新書推薦:

《
天才基本法
》
售價:HK$
62.3

《
歧路彷徨:明代小读书人的选择与困境
》
售價:HK$
113.3

《
穿衣自由?——时尚背后的文化与抗争
》
售價:HK$
69.6

《
二战战术手册:美军快速航母特混舰队和装甲步兵战术
》
售價:HK$
107.8

《
李小龙基本中国拳法
》
售價:HK$
49.5

《
会速算的人,人生都不会太差
》
售價:HK$
52.8

《
我们的中国 揭秘立体翻翻书+地图 精装硬壳儿童3D立体书 小学生中国地理百科 少儿百科知识翻翻书启蒙读物
》
售價:HK$
162.6

《
黄帝内经·灵枢 中医书籍基础理论素问入门图解养生原文注解皇帝内经中医书籍
》
售價:HK$
64.9
|
編輯推薦: |
1. 美国人工智能科学院院士力作:5大认知层级拆解AI进化法则,从数据到意图的智能跃迁方法论
2. AI开发者宝典:DeepSeek架构详解,从模型选型到部署落地的全流程指南
3. 千万级采购避坑指南:开源/闭源选择 成本控制 多模型协同,企业级大模型部署实战策略
4. 比ChtaGPT更懂中国场景:医疗/金融/法律等20 领域DeepSeek优化案例与落地密码
5. 工作效率100%提升:揭示国产DeepSeek千亿参数架构设计与白盒测评体系
|
內容簡介: |
本书是系统讲解DeepSeek大模型的技术指南,结合数据、信息、知识、智慧、意图白盒测评这一前沿理念,详 细阐述如何在大模型时代实现模型选取、定制优化与多模型协同,从而打造出最适合实际应用需求的智能系统。 本书共12章,分别从大模型时代的来临、DeepSeek的核心技术与创新突破、DIKWP白盒测评理念详解、模型 择优、大模型优化方法与实践指南、DeepSeek实战优化策略、大模型的协同与互补、DeepSeek与国内外主要大模型 及其AI智能体的对比分析、行业应用案例分析等方面进行阐述,帮助读者深入理解DeepSeek的工作机制,并掌握其 在大规模预训练、推理优化及应用部署中的关键技术。 本书旨在为广大人工智能爱好者、技术开发者和企业决策者提供一部既具理论深度又通俗易懂的指导手册,也 适合作为大、中专院校人工智能相关专业的教学参考书。
|
關於作者: |
段玉聪,海南大学计算机学院教授,国际先进技术与工程院院士、美国国家人工智能科学院通讯院士、世界人工意识协会理事长、中美硅谷发展促进会名誉会长、中欧科学家论坛共同主席、中国科协海智特聘专家、中国科技产业促进会科技战略专家咨询委员会副主任、中国工程院咨询研究专家、世界人工意识大会主席、人工智能DIKWP国际测评标准委员会主任。连续4年入选斯坦福顶尖科学家终身榜和年度榜,发表论文300余篇,已授权中国及国际发明专利110余项。
朱绵茂 ,海南开放大学宣传统战部长、教授、博导,是国际金融法、人工智能法、自由贸易港法和国家安全学方向的博导,系我国首批国家安全学博导。
|
目錄:
|
引言:
大模型时代的来临
1.1 智能涌现的契机 002
1.1.1 初创与技术探索 002
1.1.2 用户热情与需求激增 004
1.1.3 社会变革与产业升级 005
1.1.4 国际竞争与技术自主 006
1.2 DeepSeek 横空出世 006
1.2.1 起源与发展历程 006
1.2.2 低成本高性能的技术秘密 007
1.2.3 国际影响与市场震荡 007
1.2.4 案例解读与未来展望 008
1.3 为什么需要新理念 008
1.3.1 黑盒测评的局限 009
1.3.2 白盒测评的提出与意义 009
1.3.3 白盒测评的实践意义 009
1.3.4 白盒测评在行业应用中的潜力 010
1.4 总结 010
DeepSeek解析:
核心技术与创新突破
2.1 DeepSeek 的发展路径 012
2.1.1 初创与技术探索 012
2.1.2 里程碑事件:发布DeepSeek-V3 版本 013
2.1.3 专用模型的推出:DeepSeek-R1 015
2.2 模型架构与规模 016
2.2.1 混合专家(MoE)架构解析 016
2.2.2 参数规模与计算效率 017
2.2.3 内部机制剖析 018
2.3 突破性能瓶颈 020
2.3.1 低成本硬件的高效利用 020
2.3.2 英伟达H800 GPU的运用与成本 控制 020
2.3.3 模型蒸馏技术的应用 021
2.4 性能对比与评价 022
2.4.1 权威测评指标 022
2.4.2 DeepSeek与国内外顶尖模型的 对比 023
2.5.1 开源策略的优势 026
2.5.2 插件生态与交流合作 027
2.5.3 开源对企业应用的推动作用 027
2.6 总结 028
DIKWP 白盒测评理念详解
3.1 黑盒测评与白盒测评:从结果到过程的 转变 030
3.1.1 传统黑盒测评的定义与局限 030
3.2.1 数据层(Data):感知与原始信息的 获取 032
3.2.2 信息层(Information):信息提取与 初步处理 034
3.2.3 知识层(Knowledge):信息组织与 系统构建 035
3.2.4 智慧层(Wisdom):高层次推理与 问题解决 037
3.2.5 意图层(Purpose):目标识别与 行为调控 038
3.3 DIKWP 测评体系的设计与实施 040
3.3.1 测评设计理念与目标 040
3.3.2 四大模块详细设计 041
3.3.3 测评流程与标准 051
3.4 测评结果分析:各大模型在 DIKWP 体系下 的表现 052
3.4.1 感知与信息处理模块测试 052
3.4.2 知识体系构建与推理模块测评 054
3.4.3 智慧应用与问题解决模块测评 055
3.4.4 意图识别与行为调整模块测评 057
3.4.5 测评结论与行业启示 058
3.5 意义与未来展望:从“会想”到“会行动” 的新纪元 059
3.5.1 为研究者与开发者带来的全新 视角 059
3.5.2 引领人工智能迈向“自觉”时代 059
3.5.3 多模型协同与定制化优化的新 方向 059
3.5.4 未来展望:从“会想”到 “会行动”060
3.6 总结 060
模型择优:
如何选择合适的大模型
4.1 明确任务需求 062
4.1.1 任务场景及核心需求 062
4.1.2 结合DIKWP框架分析需求侧 重点 064
4.2 对比模型强项与弱项 065
4.2.1 市场主流模型对比概述 065
4.2.2 最新测评数据支撑 065
4.3 模型选择策略 066
4.3.1 分步选型流程 067
4.3.2 选型策略示例 069
4.3.3 多模型共存与组合策略 071
4.3.4 成本、安全与数据隐私考量 073
4.4 开源 vs 封闭:选型中的多维度比较 074
4.4.1 开源模型的详细优劣分析 074
4.4.2 封闭模型的详细优劣分析 075
4.4.3 给企业决策者的选型建议 076
4.5 成本、安全与长期优化的综合考量 076
4.5.1 成本评估 076
4.5.2 数据安全与隐私保护 077
4.5.3 技术生态与未来优化 078
4.6 综合决策与实践建议 078
4.6.1 决策流程解析 078
4.6.2 实践建议 078
4.7 未来趋势与展望 079
4.7.1 模型轻量化与垂直化 080
4.7.2 多模型协同与智能调度 080
4.7.3 数据安全与隐私保护的不断升级 080
4.7.4 成本与资源利用的最优化 080
4.7.5 开源与闭源并存的新生态 081
4.8 总结 081
大模型定制:
优化方法与实践指南
5.1 为何要定制 084
5.1.1 行业与企业需求的多样性 084
5.1.2 定制化的意义与价值 085
5.2 微调 085
5.2.1 微调的基本概念 085
5.2.2 微调的整体流程 086
5.2.3 微调的最佳实践 088
5.2.4 微调过程中的常见问题及解决 方案 089
5.3 提示工程 090
5.3.1 提示工程的基本原理 090
5.3.2 提示工程的策略与技巧 090
玩透 DeepSeek
认知解构 技术解析 实践落地
5.3.3 提示工程的实际案例 092
5.3.4 提示工程在意图对齐中的应用 093
5.4 人类反馈与对齐 094
5.4.1 人类反馈强化学习的基本原理与 流程 094
5.4.2 ChatGPT中的RLHF成功经验 095
5.4.3 如何在DeepSeek等模型中引入 RLHF 096
5.4.4 RLHF面临的挑战 097
5.5 知识增强与工具使用 098
5.5.1 检索增强的概念 098
5.5.2 构建与集成知识库 099
5.5.3 工具调用与插件机制 100
5.5.4 实际案例:企业定制问答系统 101
5.6 多模态扩展 101
5.6.1 多模态技术的重要性 102
5.6.2 多模态扩展的实现方法 103
5.6.3 多模态扩展的案例分析 104
5.6.4 多模态技术的未来 104
5.7 效果测评与迭代 105
5.7.1 定制优化是一个反复迭代的过程 105
5.7.2 测评方法与指标设计 106
5.7.3 自动化测评与反馈机制 108
5.7.4 实际案例:金融智能投顾系统的迭代 优化 109
5.7.5 形成迭代改进闭环的重要性 110
5.8 DeepSeek 入门实战 112
5.8.1 DeepSeek在线版 112
5.8.2 DeepSeek本地部署教程 114
5.9 总结 119
深入浅出:
DeepSeek实战优化策略 6.1 模型能力剖析 122
6.2 定制需求场景构建研究——以“数字家庭医生” 为例 122
6.2.1 场景背景与行业需求 122
6.2.2 具体需求分析 123
6.3 数据准备与微调实践 124
6.3.1 数据准备 124
6.3.2 微调过程实施 125
6.3.3 微调效果预期 126
6.4 提示与规则设计 126
6.4.1 系统提示设计的重要意义 126
6.4.2 系统提示的设计原则 126
6.4.3 少量示例引导方法研究 127
6.4.4 动态规则机制 127
6.5 性能测试与调优 128
6.5.1 模拟测试环境构建 128
6.5.2 测试指标设定 128
6.5.3 测试结果反馈与问题诊断 129
6.6 总结经验与闭环构建 129
6.6.1 数据量与质量的决定性影响 129
6.6.2 领域专家参与的必要性分析 130
6.6.3 微调与提示工程的协同优化 130
6.6.4 RLHF与外部工具的集成应用 130
6.6.5 多模态扩展与协同应用 130
6.6.6 迭代优化闭环构建 131
6.7 总结 131
模型组合:
大模型的协同与互补
7.1 单一模型的局限性 134
7.1.1 单一模型于不同任务间表现差异 显著 134
7.1.2 单一模型的缺陷凸显组合策略的 必要性 135
7.2 多模型组合模式 135
7.2.1 流水线式组合模式 135
7.2.2 专家分工式组合模式 136
7.2.3 投票集成式组合模式 137
7.2.4 概率集成与模型嫁接 138
7.2.5 混合专家模型 139
7.3 模型协调与控制 140
7.3.1 协调框架的构建 140
7.3.2 上下文共享与信息融合 140
7.3.3 动态路由与调度 140
7.3.4 实时监控与反馈控制 141
7.4 应用案例:智能手术机器人系统 141
7.4.1 案例背景 141
7.4.2 系统工作流程 142
7.5 应用案例:AI 智能体时代协议 143
7.5.1 知乎芝士平台协议分析 144
7.5.2 个性化协议设计思路与原则 144
7.5.3 协议实施的技术框架与实现路径 145
7.6 协同的挑战 146
7.6.1 模型输出冲突 146
7.6.2 延迟与计算成本 147
7.6.3 系统复杂度与维护 148
7.7 展望群智 AI 149
7.7.1 多样性融合 149
7.7.2 自主决策与智能调度 150
7.7.3 经济高效的应用场景 150
7.7.4 新型应用场景 150
7.7.5 未来研究方向 150
7.8 总结 151
DeepSeek与国内外主要大模型及 其 AI 智能体的对比分析
8.1 DeepSeek 和 Manus 之间的比较 分析 154
8.1.1 技术架构 154
8.1.2 功能定位 156
8.1.3 应用场景 157
8.1.4 结论 157
8.2 DeepSeek 与 ChatGPT-4 的比较 分析 158
8.3 总结 161行业应用案例分析
9.1 行业应用案例 164
9.1.5 其他应用案例 175
9.2 综合评估和案例对比 177
9.2.1 数据层评估 177
9.2.2 信息层评估 179
9.2.3 知识层评估 181
9.2.4 智慧层评估 184
9.2.5 意图层评估 187
9.2.6 行业案例对比总结 190
9.3 行业应用策略分析与展望 192
9.3.1 案例综合分析 192
9.3.2 行业应用的前景展望 194
9.3.3 挑战与改进 196
9.3.4 未来发展方向 198
9.4 总结 200
企业与机构定制和采购 LLM的白盒 测评指南
10.1 白盒测评方法论 203
10.1.1 框架概述 203
10.1.2 测评流程 205
10.2 机构采购 LLM 的关键考量 208
10.2.1 数据安全 208
10.2.2 成本控制 209
10.2.3 可扩展性 210
10.3 白盒测评在采购过程中的案例展示 211
10.4 白盒测评在采购过程中的流程详解 212
10.4.1 模型选型案例 212
10.4.2 合同验收案例 213
10.5 构建反馈认知通道 214
10.6 总结 216最佳实践与常见误区
11.1 大模型应用的十大最佳实践 220
11.1.1 明确目标 220
11.1.2 选对模型 221
11.1.3 循序优化 222
11.1.4 评估驱动 223
11.1.5 数据为王 224
11.1.6 融合专业知识 225
11.1.7 注重用户反馈 226
11.1.8 保证安全与伦理 227
11.1.9 成本效益平衡 228
11.1.10 拥抱开源生态 229
11.2 常见误区警示 229
11.2.1 盲目迷信参数规模 230
11.2.2 忽略上下文长度约束 230
11.2.3 缺乏充分测评就上线 231
11.2.4 过度拟合 232
11.2.5 忽视用户反馈 232
11.2.6 安全与伦理风险 233
11.3 策略复盘 234
11.3.1 AI家庭医生在医疗健康领域的 应用 234
11.3.2 复盘和启示 238
11.4 总结 239
结语:
未来展望与读者行动指南
|
內容試閱:
|
站在人类文明史的转折点,我们正见证一场前所未有的智能革命。从AlphaGo的
惊艳亮相到ChatGPT的全民狂欢,人工智能技术以令人惊叹的速度重塑着人类社会
的认知边界。在这场波澜壮阔的技术变革中,大语言模型无疑是最具代表性的突破之
一——它不仅是算法与算力的结晶,更是人类探索智能本质的里程碑。
本书的写作源于一个根本性矛盾:当大模型参数规模突破万亿量级,当AI生成内
容开始渗透教育、医疗、法律、行政管理等专业领域时,传统“黑盒式”技术评估体
系已无法满足社会对可信AI的迫切需求。我们深刻认识到,单纯关注输出结果的测评
方法,就像仅凭考试成绩评判学生能力,往往会导致对机器智能认知的系统性偏差。
正是这种反思,催生了数据—信息—知识—智慧—意图(Data-Information-Knowledge
Wisdom-Purpose,DIKWP)白盒测评体系——这套方法论不仅解构了机器认知的底层
逻辑,更为大模型技术的健康发展提供了评估基准。
在技术演进图谱中,DeepSeek横空出世具有特殊意义。这个来自中国的AI模型,
以“在千亿参数规模中实现最优成本效能比”的突破性表现,打破了“算力霸权决定
技术霸权”的固有认知。其混合专家架构与动态稀疏激活机制的创新设计,为全球大
模型发展提供了全新范式。我们选择DeepSeek作为技术载体,不仅因其代表了中国
AI研究的最高水平,更因它在模型透明度与可解释性方面的持续探索,与DIKWP理
念形成了完美共振。
本书面向以下读者:技术开发者将获得从模型微调到多模态协同的完整工具链;
企业决策者可掌握价值千万的AI选型评估框架;哲学爱好者则能透过技术表象,思考
意识本质的终极命题;普通读者可以通过本书了解最新人工智能技术的发展脉络,以
及其对人类社会发生的深刻影响。我们刻意摒弃艰深公式,代之以300 可视化图表和
可复现的代码案例,力求在学术严谨性与实践指导性间找到最佳平衡点。
在此,特别感谢DIKWP人工意识国际团队的贡献,团队人员有海南大学的郭振东、
弓世明、吴坤光、唐福亮、王玉星、黄帅帅、褚泽世、华若宇、杨爱单妮、靳东鹏、
王卓然、朱厚宏等。他们在章节撰写、内容修订、文献校对及出版过程中倾注了宝贵
心血。同时,由衷感谢北京大学出版社的专业支持,正是跨学科协作,使本书在内容
架构、知识呈现与数字衍生品开发上均树立了行业标杆。
智能时代的黎明已然到来,但朝阳的方向由我们共同决定。翻开这本书,您将获
得的不仅是驾驭大模型的技术密钥,更是参与塑造人类文明新形态的入场券。让我们
携手穿越技术的迷雾,在机器智能的璀璨星河中,找寻属于人类的认知坐标。
段玉聪 朱绵茂 梅映天 庞兴梅
|
|