新書推薦:

《
逊清奉天残留特权研究
》
售價:HK$
151.0

《
分职文昌:中国古代尚书省及六部体制研究
》
售價:HK$
115.6

《
弗里德里希二世皇帝:一部传记
》
售價:HK$
221.8

《
阿非利加征服者:比拿破仑更伟大的西庇阿
》
售價:HK$
69.6

《
营救里斯本丸
》
售價:HK$
66.1

《
鸟瞰最美国保全书(刷边版)
》
售價:HK$
1177.6

《
上海市民生活记忆
》
售價:HK$
83.2

《
分肥游戏:古代中国权力分配规则
》
售價:HK$
70.6
|
編輯推薦: |
本书以“零门槛、深探索”为理念,为读者揭开LLM的本质逻辑。无须编程与公式,从技术演化到实战应用,从单兵作战到多智能体协作,从手机端运行到超算集群的奥秘,书中以生活化的案例与类比,将晦涩概念转化为鲜活认知。你将理解:为何LLM像“超级词典+概率魔术师”如何通过提问技巧唤醒它的潜能;当它与数据库、科研工具联动时,如何成为你的“数字外脑”更重要的是,书中直面技术风险,引导你清醒看待AI的边界与价值。 这是一场为普通人定制的认知升级之旅。通过八章循序渐进的探索,你将不再被“黑箱”困扰,而是手握原理与工具,成为技术时代的“主动对话者”。
|
內容簡介: |
本书旨在帮助非计算机专业本科生快速掌握大语言模型(LLM)的入门知识和实用技术。全书共8章,阐述了LLM如何助力解决日常生活与科研中的难题,并深度挖掘了提示工程、检索增强技术以及LLM在智能体领域的应用等实用技巧。同时,书中还涵盖了LLM的应用环境、风险与安全技术,强调理性使用LLM技术的重要性。借助简洁易懂的语言和实际案例,读者既能洞悉LLM的核心理念,又能熟练驾驭其实战应用,深切感受科技创新如何无缝融入日常学习、工作和生活,助力快速获取信息和提高工作效率。本书适合作为普通高等学校非计算机专业本科生人工智能类通识课或选修课教材或参考书,也可供对大语言模型技术与应用感兴趣的读者参考阅读。
|
關於作者: |
李倩,山东大学助理研究员,硕士生导师。中国计算机学会(CCF)自然语言处理专委会执行委员、信息系统专委会执行委员,中国中文信息学会(CIPS)社会媒体处理专委会委员、青年工作委员会委员,入选腾讯犀牛鸟菁英人才培养计划。主要研究方向为知识图谱与大语言模型,在TKDE、TNNLS等CCF A、B类和中科院一区刊物及ACL、IJCAI、EMNLP国际顶级会议上发表高水平论文10余篇,主持1项国家自然科学基金青年项目、1项中央高校基本科研项目、1项山东大学本科教育教学改革项目。崔立真,山东大学教授,博士生导师,软件学院院长,电子商务交易技术国家工程实验室副主任。中国计算机学会(CCF)协同计算专委会副主任,数据库专委会常务委员,软件工程教指委委员。主要研究方向为软件与数据工程。国家重点研发计划项目首席科学家,主持国家重点研发计划项目和课题、国家自然科学基金重点项目等。以第一完成人获国家教学成果二等奖、山东省科技进步奖一等奖。刘磊,山东大学齐鲁青年学者特聘教授,泰山学者青年专家,博士生导师,国家重点研发计划项目负责人,山东大学软件学院数据科学与大数据技术系副主任,中国计算机学会高级会员,中国计算机学会青年计算机科技论坛济南主席。主要研究方向为大模型多智能体、网络智能、5G网络切片与网络虚拟化资源调度优化。
|
目錄:
|
目 录知名LLM推荐语前言致谢第1章 导论11.1 自然语言11.1.1 歧义性11.1.2 简略性21.1.3 易变性21.2 语言模型31.2.1 基于规则的语言模型31.2.2 统计语言模型41.2.3 神经网络语言模型41.2.4 预训练语言模型71.2.5 大语言模型91.3 技术成熟度曲线121.4 总结131.5 习题14第2章 语言模型基础技术152.1 统计语言模型152.2 神经网络语言模型162.2.1 Word2Vec模型172.2.2 RNN模型172.3 预训练语言模型182.3.1 编码器-解码器架构182.3.2 注意力机制192.3.3 Transformer架构212.3.4 MoE架构222.4 大语言模型252.4.1 大语言模型之大252.4.2 ChatGPT—闭源典型代表262.4.3 LLaMA—开源典型代表272.5 多模态大语言模型292.5.1 多模态定义292.5.2 多模态大语言模型的架构302.5.3 应用领域322.6 大语言模型的开发与使用模式332.6.1 预训练微调模式332.6.2 提示指令模式342.7 总结352.8 习题35第3章 大语言模型的使用373.1 基本概念373.1.1 提示学习373.1.2 提示词范式373.1.3 提示工程的优势383.2 提示词的优化技巧393.2.1 清晰准确表述393.2.2 赋予身份角色403.2.3 留出思考时间413.2.4 提供相似示例423.2.5 情感物质激励423.2.6 结构化提示词423.3 思维链443.3.1 基本范式443.3.2 零样本思维链453.3.3 多思维链463.4 高级思维链473.4.1 思维树483.4.2 思维图493.5 总结503.6 习题51第4章 大语言模型的多工具524.1 RAG基本概念524.1.1 必要性524.1.2 发展历程534.2 初级RAG534.3 高级RAG554.3.1 预检索564.3.2 后检索564.3.3 优缺点564.4 模块化RAG564.4.1 模块组564.4.2 模式组574.4.3 优缺点574.5 检索自由型RAG584.6 知识图谱型RAG594.6.1 知识图谱概念594.6.2 知识图谱构建614.6.3 GraphRAG624.6.4 LightRAG654.7 总结674.8 习题67第5章 大语言模型的多智能体695.1 智能体基本概念695.1.1 智能体的定义695.1.2 智能体的特征695.1.3 智能体的行动力705.2 LLM作为智能体大脑715.2.1 LLM出现前的智能体715.2.2 LLM出现后的智能体725.3 单智能体模式745.3.1 单智能体特点745.3.2 ReAct框架745.3.3 ReAct示例765.3.4 ReAct特点765.4 多智能体模式775.4.1 多智能体特点775.4.2 两智能体系统785.4.3 三智能体模式795.5 群体智能体智能815.5.1 群体智能体特点815.5.2 ChatDev框架815.5.3 ChatDev示例835.6 生成式智能体845.6.1 生成式智能体特点845.6.2 斯坦福AI小镇简介845.6.3 斯坦福AI小镇框架865.7 总结885.8 习题88第6章 大语言模型的多载体906.1 超大型云服务器906.1.1 基本配置906.1.2 适配的语言模型916.2 小型服务器926.2.1 基本配置926.2.2 适配的语言模型946.3 手机端966.3.1 基本配置966.3.2 MiniCPM模型976.4 数据库端1006.4.1 基本配置1006.4.2 HeatWave GenAI1016.5 端云协同1026.5.1 端云协同部署1026.5.2 适配的语言模型1026.5.3 技术挑战1036.6 软硬件适配与协同优化1046.6.1 现存软硬件配置1046.6.2 大模型的软硬件适配1056.6.3 大模型的软硬件协同优化1076.7 总结1086.8 习题108第7章 大语言模型的风险及安全技术1107.1 LLM面临的风险1107.1.1 幻觉问题1107.1.2 偏见歧视1127.1.3 隐私泄露1137.1.4 伦理问题1157.2 LLM的安全技术1157.2.1 减少幻觉和偏见1157.2.2 防御提示注入攻击1167.2.3 减少外部工具威胁1167.2.4 严查伦理问题1177.3 硅基人工智能已/将具有意识1177.3.1 碳基生物1177.3.2 硅基人工智能1187.3.3 硅基人工智能是否已/将具有意识1197.4 总结1207.5 习题121第8章 大语言模型的调用方式1228.1 在线LLM的网页调用1228.1.1 DeepSeek1228.1.2 星火认知1248.1.3 文心一言1268.1.4 通义千问1288.1.5 混元1308.1.6 豆包1328.1.7 ChatGPT1348.1.8 DALL·E1378.1.9 PixVerse1388.2 在线LLM的API调用1408.2.1 基础设置1408.2.2 DeepSeek1418.2.3 星火认知1428.2.4 文心一言1438.2.5 通义千问1448.2.6 混元1458.2.7 ChatGPT1478.3 开源LLM的代码调用1478.3.1 DeepSeek1478.3.2 Qwen1498.3.3 ChatGLM1518.3.4 MOSS1518.3.5 LLaMA1528.4 总结1538.5 习题153附录155附录A 实验155附录B 习题参考答案156参考文献160
|
內容試閱:
|
前 言在浩瀚的数字宇宙中,有一股力量正悄然重塑我们的认知边界,它如同智慧的星辰,引领我们穿越未知的迷雾,探索知识的无尽深渊。这便是大语言模型,简称LLM,一个集深度学习、自然语言处理与人工智能之大成的模型。LLM,其实早已悄然融入我们的日常生活。它可能是口袋里的语音助手,也可能是在线购物时的个性化推荐系统。想象一下,你与一台机器对话,它不仅能回应你的每一个问题,还能理解你的情绪,甚至创作出令人动容的诗篇。这样的场景,已不再是遥不可及的科幻梦想,而是LLM带给我们的现实馈赠。本书将带领读者踏上一场关于LLM的深度探索之旅。对于非计算机专业的你来说,这项技术或许曾显得神秘莫测。但请放心,这本书专为那些对科技充满好奇但非计算机专业的读者而写。它不会让你深陷复杂的编程世界,也不会让你被复杂的数学公式所困扰,而是使用最直观、最贴近现实的语言带你轻松步入LLM的世界。因此,本书从“用”的角度出发,即使用LLM解决日常生活与科研中的问题。本书的总体架构如下:第1章 导论,介绍自然语言、语言模型演变史。第2章 语言模型基础技术,介绍统计语言模型、神经网络语言模型、预训练语言模型、大语言模型、多模态大语言模型以及大语言模型的开发与使用模式。第3章 大语言模型的使用,介绍LLM的使用技巧和推理策略。第4章 大语言模型的多工具,介绍如何利用外部工具增强LLM的性能。第5章 大语言模型的多智能体,介绍多LLM群体互动。第6章 大语言模型的多载体,介绍支持LLM训练与运行的超大型云服务器、小型服务器、手机、数据库等载体。第7章 大语言模型的风险及安全技术,介绍LLM面临的风险和安全技术与防护措施,让人们认清LLM的工具属性,冷静客观地使用LLM。第8章 大语言模型的调用方式,介绍网页调用、API调用以及代码调用。本书将带你深入LLM的核心,揭示其思维模式以及如何在我们的生活中扮演隐形英雄的角色,揭开其神秘面纱,让你不仅知其然,更知其所以然。这是一场智慧与创新的盛宴,一场技术与生活的完美融合。愿你在阅读的过程中,收获智慧的火花,体验LLM的无尽魅力。相关代码、示例、PPT等资源将陆续更新在本书的网站中。我们已尽力排查并修正书中错误,然深知自身认知尚存不足,目前内容中或仍存在错误。在此,我们怀着万分诚恳之心,恳请读者不吝批评指正。作者2025年2月
|
|