登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書

『簡體書』RAG实践权威指南:构建精准、高效大模型之道

書城自編碼: 4120544
分類:簡體書→大陸圖書→計算機/網絡人工智能
作者: 宁星星
國際書號(ISBN): 9787111781790
出版社: 机械工业出版社
出版日期: 2024-12-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 97.9

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
大清为何轰然倒塌:一本让读者又爽又气、又哭又笑的历史书
《 大清为何轰然倒塌:一本让读者又爽又气、又哭又笑的历史书 》

售價:HK$ 74.8
中国古代等级制度
《 中国古代等级制度 》

售價:HK$ 173.8
中国轮船航运业的兴起(樊百川著作集)
《 中国轮船航运业的兴起(樊百川著作集) 》

售價:HK$ 184.8
日本中世战争史:武士的命运与下克上【汗青堂丛书151】
《 日本中世战争史:武士的命运与下克上【汗青堂丛书151】 》

售價:HK$ 79.2
清季的洋务新政(全二卷)
《 清季的洋务新政(全二卷) 》

售價:HK$ 418.0
精力管理:有效地使用时间和专注力
《 精力管理:有效地使用时间和专注力 》

售價:HK$ 54.8
大争之世:论中国文明重建
《 大争之世:论中国文明重建 》

售價:HK$ 75.9
AI动漫游戏绘画设计
《 AI动漫游戏绘画设计 》

售價:HK$ 74.8

編輯推薦:
推荐理由(权威作者):由华大生命科学研究院资深NLP专家宁星星撰写,作者在RAG系统、大模型应用等领域有深厚积累,实战经验丰富。
从零到实战:手把手教学,帮助读者从基础认知进阶到企业级RAG系统构建,结合LangChain、FAISS等工具链提供可落地的代码实践。
技术体系完整:系统讲解RAG架构、核心组件与全流程技术,覆盖数据处理、语义检索、生成优化、模型推理及评估调优等关键环节。
聚焦落地难题:深入解析知识库维护、模块协同、资源优化等实际挑战,提供鲁棒性、安全性和实时更新等增强策略,提升系统稳定性与可信度。
面向未来发展:探讨跨模态融合与动态知识更新等前沿方向,为研究者和开发者提供技术演进路径与创新思路。
內容簡介:
本书由华大生命科学研究院资深NLP专家撰写,旨在带你从零构建高效的企业级RAG系统。本书全面解析RAG原理与实战,涵盖架构与组件、高阶技术与实践、检索与问答模块优化策略、模型推理等核心技术,并深入讲解三大落地优化技术,以及高阶变体与能力增强措施。 來源:香港大書城megBookStore,http://www.megbook.com.hk
本书共8章。第1章介绍RAG技术基础,帮助读者建立对RAG技术的全面认知。第2章介绍RAG系统的核心组件与实践,帮助读者掌握核心技术与基于Python库的实践。第3章介绍高阶RAG技术与实践的细节,帮助读者掌握进阶技术。第4章介绍检索与问答模块的优化,全方位讲解优化策略。第5章介绍模型推理技术,加速RAG技术的落地。第6章介绍RAG系统在实际应用中的鲁棒性、安全性和公平性优化技术,提升RAG系统的整体性能与可信度。第7章介绍RAG技术的高阶变体,以充分挖掘RAG技术的应用潜力。第8章介绍实时知识更新与跨模态能力增强,展望RAG技术未来应用的方向。
關於作者:
宁星星:华大生命科学研究院(BGI)生物智能研究所资深NLP算法工程师,目前从事RAG系统、Agent智能系统、生命科学垂直领域大模型等相关研发工作。拥有多年NLP算法相关开发经验,擅长大模型、AIGC、智能问答等相关技术,并多次获得全国性NLP与知识图谱相关竞赛奖项。著有《语义解析:自然语言生成SQL与知识图谱问答实战》一书。
目錄
目  录
前言
第1章 RAG技术基础 / 1
1.1 为什么需要RAG技术 / 1
1.2 工作流程与核心技术解析 / 2
1.2.1 工作流程 / 2
1.2.2 核心技术 / 4
1.3 工作范式 / 6
1.4 价值与实际应用场景 / 8
1.5 计算资源与数据存储需求 / 9
1.5.1 计算资源的需求 / 10
1.5.2 数据存储的需求 / 11
1.6 面临的主要挑战 / 13
第2章 RAG系统的核心组件与
实践 / 16
2.1 向量数据库 / 16
2.1.1 Elasticsearch / 17
2.1.2 FAISS / 18
2.1.3 Milvus / 21
2.2 检索系统 / 26
2.2.1 基于知识图谱查询 / 26
2.2.2 基于关系型数据库查询 / 34
2.2.3 基于向量数据库查询 / 36
2.3 生成系统 / 42
2.3.1 Transformer / 42
2.3.2 GPT / 47
2.4 RAG系统基准测试工具 / 49
2.4.1 评测数据集 / 49
2.4.2 常用的评测基准与步骤 / 55
2.5 基于常用Python库的RAG
实践 / 64
2.5.1 基于Hugging Face Transformers库 / 64
2.5.2 基于PyTorch和
TensorFlow / 67
2.5.3 基于LlamaIndex / 69
2.5.4 基于LangChain / 71
第3章 高阶RAG技术与实践 / 75
3.1 切片与向量化技术 / 75
3.1.1 切片 / 75
3.1.2 向量化 / 77
3.1.3 向量存储与检索 / 78
3.1.4 优化切片与向量化策略 / 79
3.1.5 实战:从文本到向量 / 80
3.2 检索技术 / 82
3.2.1 检索流程及优化策略 / 82
3.2.2 关键词检索 / 88
3.2.3 语义检索 / 94
3.2.4 密集段落检索 / 99
3.2.5 混合检索 / 102
3.2.6 重排序 / 104
3.3 高级检索策略 / 112
3.3.1 假设性问题和假设性
回答策略 / 112
3.3.2 扩大检索语境 / 121
3.4 生成模型的选型与提示词工程 / 128
3.5 检索技术与生成技术的融合 / 131
3.5.1 RAG-Token模型 / 131
3.5.2 RAG-Sequence模型 / 132
第4章 检索与问答模块优化 / 134
4.1 数据预处理和管理优化 / 134
4.1.1 数据清洗 / 134
4.1.2 数据存储和访问优化 / 135
4.2 检索模块的优化 / 141
4.2.1 嵌入模型的训练优化 / 141
4.2.2 文档解析技术的优化 / 144
4.2.3 同义词扩展 / 149
4.2.4 查询重写 / 154
4.3 问答模块的优化 / 158
4.3.1 问答能力的优化 / 158
4.3.2 增强拒答能力 / 168
第5章 模型推理优化 / 175
5.1 推理加速技术 / 175
5.1.1 量化 / 175
5.1.2 剪枝 / 177
5.1.3 知识蒸馏 / 178
5.2 分布式推理 / 181
5.2.1 分布式推理技术 / 182
5.2.2 分布式推理算法 / 186
5.2.3 常见的分布式推理系统 / 188
5.2.4 分布式推理优化策略 / 189
5.3 边缘计算优化 / 191
第6章 鲁棒性、安全性和公平性
优化 / 194
6.1 模型鲁棒性优化 / 194
6.1.1 对抗训练 / 194
6.1.2 模型正则化 / 197
6.1.3 随机自我集成 / 198
6.1.4 防御模块 / 202
6.2 模型安全性优化 / 204
6.2.1 数据匿名化和加密 / 204
6.2.2 访问控制 / 207
6.2.3 验证查询和输出内容 / 208
6.2.4 保护向量数据库 / 210
6.3 模型公平性优化  / 212
6.3.1 检测模型偏见的方法 / 212
6.3.2 减少模型偏见的策略 / 214
第7章 RAG技术的高阶变体 / 218
7.1 长上下文的困境突围:
LongRAG / 218
7.1.1 原理解析 / 219
7.1.2 源码解析:LongRAG的
深度剖析 / 220
7.2 知识图谱的优势融合:
GraphRAG / 223
7.2.1 原理解析 / 224
7.2.2 源码解析:GraphRAG的深度
剖析 / 225
7.3 垂直领域的定向增强:
GeneRAG / 229
7.3.1 原理解析 / 229
7.3.2 源码解析:GeneRAG的深度
剖析 / 230
第8章 实时知识更新与跨模态能力
增强 / 235
8.1 实时知识更新 / 235
8.1.1 数据实时获取的方法 / 235
8.1.2 知识库动态更新 / 238
8.1.3 自动化数据管道 / 239
8.2 跨模态能力增强 / 240
8.2.1 多模态向量嵌入 / 240
8.2.2 多模态内容生成 / 243
附录 相似度计算 / 249
內容試閱
前  言
为什么写作本书
自2022年OpenAI推出ChatGPT以来,大模型技术已进入全面应用落地的新阶段。然而,随着这些模型在各领域的深入应用,一系列技术挑战也随之浮现,例如如何在保证生成质量的同时减少“幻觉”,如何快速适配垂直领域的知识需求,以及如何降低系统的计算资源消耗。面对这些挑战,RAG(Retrieval Augmented Generation,检索增强生成)技术应运而生,成为突破大语言模型局限性的关键解决方案。
通过结合外置知识库与动态检索机制,RAG技术能够实时为生成模型补充最新信息,显著提升其可靠性和知识覆盖面。该技术不仅解决了“幻觉”问题,还增强了模型在特定领域的适用性,使得生成内容更加准确和一致。作为一种融合创新技术,RAG在客户服务、内容生成、教育与培训、法律咨询等领域已展现出巨大的应用潜力。因此,RAG技术不仅是未来AI应用发展的核心助力,更是推动产业智能化升级的重要工具。
作为一名从事NLP(自然语言处理)研究多年的开发者,我在2018年初次接触语义解析任务时,便被AI技术的潜力深深吸引。在随后的职业生涯中,我经历了从传统机器学习到深度学习框架的技术迁移,也见证了预训练模型的兴起及其带来的行业变革。尤其是从2023年起,我的研究重点逐渐转向LLM与RAG技术的结合和优化。在这个过程中,我深刻体会到尽管RAG技术已经展现出巨大潜力,但仍有不少从业者因技术门槛较高而难以系统掌握这一领域的核心知识。这正是我撰写本书的初衷—希望能够帮助更多研究者与工程师系统地理解RAG技术的理论与实践。
本书读者对象
本书不仅适合初学者用来构建对RAG技术的系统认知,也能为高级开发者在实际应用中提供深入参考和创新灵感。
研发工程师:如AI、医疗、金融相关领域的研发工程师,阅读本书后可在研究型或者实际项目中应用RAG技术,以提升产品智能化水平和业务落地效率。
NLP工程师:从事与NLP相关工作的工程师,阅读本书后可探寻基于大模型的方法来改进现有系统或开发新的应用。
技术爱好者:对于那些刚开始接触AI领域并对深入了解和实践RAG技术感兴趣的初学者,本书将帮助他们全面认识RAG的技术体系和落地价值。
应用场景探索者:正在探索如何将大模型与知识库结合的人,如希望在智能问答、内容生成、知识管理等实际场景中应用RAG技术的专业人士。
本书特色
1.覆盖全技术链条
从基础理论到系统构建,再到性能优化与应用场景,本书内容完整覆盖了RAG技术的全链条,帮助读者形成对RAG技术的系统性认知。
数据层面:讲解如何进行数据预处理、知识库构建、向量化表示及存储优化。
检索层面:介绍多种检索策略(如关键词检索、语义检索、混合检索)及其性能权衡方法。
生成层面:解析生成模型的工作原理,包括Transformer架构、微调方法和提示工程优化。
评估与优化:深入讨论RAG系统的性能评估指标,如检索准确性、生成质量、响应速度等,以及提升这些指标的优化技术。
落地应用:提供丰富的行业案例,如智能问答、内容生成、医疗知识库管理等,展示RAG技术在实际应用中的落地路径。
2.面向未来发展
RAG技术仍在快速演进中,本书不仅关注当前的技术实现,还展望了它在未来可能的应用与发展方向,为读者提供持续研究的灵感。
实时知识更新:探讨如何通过实时数据采集和知识库动态更新,解决大语言模型知识滞后的问题。
跨模态能力增强:介绍文本、图像、视频等多模态数据的融合技术,展示RAG在跨模态生成中的潜力。
如何阅读本书
第1章介绍RAG技术基础,包括为什么需要RAG技术、工作流程与核心技术解析、工作范式、价值与应用场景、计算资源与数据存储需求、面临的主要挑战,为读者奠定理论基础。
第2章介绍RAG系统的核心组件与实践,深入剖析RAG的关键模块,如向量数据库、检索系统、生成系统、RAG基准测试工具,并提供基于常用Python库的RAG实践案例。
第3章介绍高阶RAG技术与实践的细节,探讨切片与向量化技术、检索技术、高级检索策略、生成模型的选型与提示词工程,以及检索技术与生成技术的融合。
第4章介绍RAG系统的检索与问答模块的优化方法,从数据预处理和管理优化、检索模块的优化到问答模块的优化等,全方位讲解优化策略。
第5章介绍如何通过多种技术手段优化和增强RAG模型的推理能力,涵盖推理加速技术、分布式推理,以及边缘计算的高效优化实践。
第6章围绕RAG系统在实际应用中的鲁棒性、安全性与公平性优化进行深入探讨,重点分析如何通过技术手段提升系统的整体性能与可信度。
第7章探讨RAG技术的高阶变体,即在长上下文困境突围、知识图谱优势、融合及垂直领域定向增强中的创新性发展,介绍如何通过新型架构设计和算法优化挖掘RAG技术的潜力。
第8章聚焦实时知识更新和跨模态能力增强,展望RAG技术的未来应用。
勘误与支持
虽然笔者已尽最大努力确保内容准确无误,但难免存在疏漏。如你在阅读过程中发现任何问题,欢迎通过1042883276@qq.com与我联系。
致谢
本书的撰写是一段充满挑战与收获的旅程,写作的过程离不开许多人的支持和帮助。
在本书撰写过程中,我深深体会到家人支持的重要性。感谢我的妻子Yvonne,她在我专注于写作时承担了更多的家庭责任;感谢我的女儿Alina,她用天真的笑容和纯真的话语给予我无尽的灵感和动力。在本书出版之际,“蛇宝宝”Eric也顺利出生了。正是因为有他们的支持,我才能全身心投入到这项工作中。
最后,致敬所有曾经参与和推动RAG技术发展的研究者与工程师们,他们的创新与努力奠定了这项技术的基础,并为后来的探索者铺平了道路。我也希望本书能够为更多人理解与应用RAG技术提供帮助,并成为推动技术进步的一块基石。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.