新書推薦:

《
病菌、观念与社会:病菌如何影响现代生活
》
售價:HK$
85.8

《
经过检视的人生 从苏格拉底到尼采
》
售價:HK$
66.0

《
阿尔喀比亚德斯 I(柏拉图全集)
》
售價:HK$
107.8

《
百家争鸣与中华文明的哲学突破
》
售價:HK$
115.5

《
孟子学术流传与秦汉价值重构
》
售價:HK$
110.0

《
中国早期城市与文明起源 一部中国早期城市发展简史,解读城市与文明交织共生的规律
》
售價:HK$
96.8

《
只要我还在创作 角谷美智子访谈录
》
售價:HK$
74.8

《
国医大师邓铁涛 治未病从孩子抓起 中医治未病 二十四节气顺时调养 常见病预防 中医健康体检 广东科技
》
售價:HK$
54.9
|
| 編輯推薦: |
《生成式AI开发揭秘:大模型详解》是一本介绍生成式AI开发技术的全景图书,从生成式AI基本概念开始带领读者逐步走上AI开发之路,一步一步揭开生成式AI开发的神秘面纱。阅读本书并不需要专业的人工智能技术背景,只要对机器学习有最基本的理解,并且有一定的编程经验即可读懂书中大部分内容。
《生成式AI开发揭秘:大模型详解》详细介绍了基于大模型的生成式AI应用与开发技术,涵盖了自然语言处理、语音识别以及计算机视觉与图像生成等不同领域。在比对生成式AI与判别式AI的基础之上,本书详细讲解了大模型的基础知识及相关应用技巧。转换器架构是当代生成式AI与大模型的重要技术基础,本书从文本向量化入手深入剖析了其中的各项核心技术。转换器架构不仅在自然语言处理领域占据统治地位,在音频、图像等多模态数据上也展现了巨大的潜力。本书分三章介绍了大模型在这些领域能够处理的各种任务,并通过大量示例讲解了大模型处理相关任务时的代码实现。这些示例主要基于Hugging Face的transfomers、diffusers等开源库,并讲解了模型加载、数据预处理以及流水线等机制。除了直接使用大模型处理数据以外,本书还介绍了
|
| 內容簡介: |
《生成式AI开发揭秘:大模型详解》采用了通俗易懂的语言来详细讲解了基于大模型的生成式AI开发技术,涵盖自然语言处理、语音识别及计算机视觉与图像生成等不同领域。 ?在比对生成式AI与判别式AI的基础之上,讲解了大模型的基础知识及相关应用技巧,从文本向量化入手深入剖析了转换器(transformer)架构的各项核心技术,通过丰富的示例阐述了大模型处理相关任务时的代码实现、模型加载、数据预处理和流水线等机制。 ?深入探讨了在大模型部署过程中对算力及存储需求的估算方法,揭示了模型性能与模型规模之间的幂律关系。 ?详细介绍了大模型的分布式预训练技术与高效的参数微调方法,还针对大模型对齐人类偏好的一些技术和算法进行了专门讲解。 ?为了降低加载和运行大模型的门槛,本书大部分示例会选用经过优化后的压缩模型,可直接在普通电脑上运转起来,以降低读者学习过程中的实验成本。
不论对于机器学习领域的研究者,还是生成式AI的开发者,本书都是良好的参考读物和入门教程。
《生成式AI开发揭秘:大模型详解》是一本介绍生成式AI开发技术的全景图书,从生成式AI基本概念开始带领读者逐步走上AI开发之路,一步一步揭开生成式AI开发的神秘面纱。阅读本书并不需要专业的人工智能技术背景,只要对机器学习有最基本的理解,并且有一定的编程经验即可读懂书中大部分内容。
|
| 關於作者: |
|
田雪松,AI算法工程师,有15年软件开发经验,10多年软件技术培训经验,2004年出版图书《J2EE网络编程标准教程》。曾经给惠普、佳能、IBM、花旗、渣打、华为、北电、方正、中石油、中石化、中国移动、建设银行、工商银行、中国银行等多家大型企业培训Java、设计、管理、需求等方面的课程。近年来主要从事微服务、大数据等高并发、高性能的业务系统开发,有丰富的软件研发经验。曾任职阿里巴巴高级开发专家,现就职于爱立信。
|
| 目錄:
|
《生成式AI开发揭秘:大模型详解》采用了通俗易懂的语言来详细讲解了基于大模型的生成式AI开发技术,涵盖自然语言处理、语音识别及计算机视觉与图像生成等不同领域。 在比对生成式AI与判别式AI的基础之上,讲解了大模型的基础知识及相关应用技巧,从文本向量化入手深入剖析了转换器(transformer)架构的各项核心技术,通过丰富的示例阐述了大模型处理相关任务时的代码实现、模型加载、数据预处理和流水线等机制。 深入探讨了在大模型部署过程中对算力及存储需求的估算方法,揭示了模型性能与模型规模之间的幂律关系。 详细介绍了大模型的分布式预训练技术与高效的参数微调方法,还针对大模型对齐人类偏好的一些技术和算法进行了专门讲解。 为了降低加载和运行大模型的门槛,本书大部分示例会选用经过优化后的压缩模型,可直接在普通电脑上运转起来,以降低读者学习过程中的实验成本。
不论对于机器学习领域的研究者,还是生成式AI的开发者,本书都是良好的参考读物和入门教程。
《生成式AI开发揭秘:大模型详解》是一本介绍生成式AI开发技术的全景图书,从生成式AI基本概念开始带领读者逐步走上AI开发之路,一步一步揭开生成式AI开发的神秘面纱。阅读本书并不需要专业的人工智能技术背景,只要对机器学习有最基本的理解,并且有一定的编程经验即可读懂书中大部分内容。
|
| 內容試閱:
|
前 言 相信大多数人了解生成式AI,都是从类似ChatGPT、DeepSeek这样的AI助手开始的。这虽然能让人直观地感受生成式AI,但却很容易让人误以为它们只会聊天。即使是知道它们还可以绘制图片、生成音频和视频,也往往会以为它们的能力仅限于生成电子数据。这样的误解会让人以为这次的人工智能浪潮跟以往没什么不同,可能热闹了几年就重新回归停滞,更不会相信这次的生成式AI能够改变世界。然而本轮生成式AI所基于的大语言模型,不仅展现了超强的数据生成能力,还涌现出了以往任何模型都不具有的逻辑推理能力。大语言模型的这种涌现能力在2022年就引起了研究人员的极大兴趣,但直到DeepSeek以“深度思考”的形式在AI助手中将它们直接展现出来时,才让更多的人看到了它的威力。要知道逻辑推理能力是人类智力的核心部分之一,一旦大语言模型也拥有了这样的能力,它们在理论上就可以解决任何复杂问题。在此基础之上,人工智能就可以在许多行业的应用系统中扮演大脑的角色并进行逻辑上的决策,这为人工智能改变人类世界打开了无限的想像空间。 毫无疑问,生成式AI会在未来几年甚至几十年,成为继蒸汽机、电力和计算机之后,推动人类技术革命的最大驱动力之一。在这样的时代背景下,生成式AI的研究与投资都变得极为活跃。以2023年为例,尽管人工智能领域的整体投资有所下降,但生成式AI却吸引了超过230亿美元的投资,是上一年投资额的9倍,达到了2019年投资额的30倍[ HAI Stanford University, 2024, Artificial Intelligence Index Report 2024]!麦肯锡在2023年预测,生成式AI每年将为全球经济带来2.6万亿至4.4万亿美元的增长[ Chui et al., 2023, McKinsey: The economic potential of generative AI - The next productivity frontier],要知道全英国2021年全年的GDP也只有3.1万亿美元。这个预测还只是基于63种生成式AI应用场景,如果将所有领域都考虑进来,预测结果可能还要翻倍。 由生成式AI引领的这一轮人工智能浪潮正在悄然地改变着我们的生活,并且实现了以往任何一次人工智能浪潮都不曾有过的重大突破。不管我们愿意不愿意,生成式AI都会慢慢地融入到我们的生活中。那么究竟什么是生成式AI,生成式AI与以往人工智能又有什么不同呢?如果不想被动地接受技术变革,我们就应该尽早地了解生成式AI。与此同时,生成式AI与各行各业相结合的过程也已经开启,在未来一二十年间会涌现大量基于生成式AI的应用开发需求。这就像是互联网与各行各业相结合的过程,在改变行业发展轨迹的同时也会造就大量的创新机遇。那么如何参与到这一行业变革的进程中来?生成式AI开发又需要具备哪些专业素质?显然,成为掌控生成式AI开发的专业人士,无疑会在这一轮产业革命中占据更多的主动权。 本书正是这样一本介绍生成式AI开发技术的全景图书,从生成式AI基本概念开始带领读者逐步走上AI开发之路。阅读本书并不需要专业的人工智能技术背景,只要对机器学习有最基本的理解,并且有一定的编程经验即可读懂书中大部分内容。当然在介绍生成式AI底层实现技术时,仍然不可避免地会引入一些难以理解的算法和公式。我们会尝试用最通俗易懂的语言介绍它们,一步一步揭开生成式AI开发的神秘面纱。对于存在晦涩难懂的技术讲解或算法公式的章节,本书采用星号分级标注的方法指导读者学习。一星(*)标注的章节是比较难懂的部分,但它们对于生成式AI整体学习很重要。读者在学习这部分内容时如果不能一次性读懂,可以在粗读一遍后就学习后面的内容。复杂的算法或公式往往需要长时间的理解和消化,相信在通读本书全部内容后,再回过头细细研读就会有完全不一样的感受了。两星(**)标注的内容是难度较大的扩展知识,这些内容一般都涉及非常复杂的算法和公式,但并不影响生成式AI的开发与应用。读者在阅读这部分内容时不用花太多时间研究细节,能明白其中的大体意思就已经很好了。 本书整体上可分为三个大的部分,第1~3章介绍了生成式AI的基本知识,第4~7章主要讲解生成式AI的应用与开发知识,而第8~10章则介绍了特定于大模型的一些知识,包括它们的部署、评估、训练与微调等技术问题。为了降低加载和运行大模型的门槛,本书前7章的大部分示例会选用经过优化后的压缩模型。这些模型可直接在普通电脑上运转起来,虽然运行速度可能会比较慢,但对于学习生成式AI和大模型却再适合不过了,可大幅降低学习过程中的实验成本。第8~10章的部分示例虽然需要GPU,但它们在生成式AI开发中并非必要内容。读者可大致了解其中的内容,待拥有相关算力平台后再深入研读。 为了能够给读者奉上高质量的生成式AI学习资料,笔者在编写本书时翻阅了大量资料,并研读了数十篇生成式AI相关的技术文献。这些资料和文献在本书相关内容中都以引用的形式列出,以方便读者在学习时比照阅读。本书所有示例也已在github和gitee上同时开源,读者可以使用Git工具直接下载运行。尽管如此,书中内容仍难免会有不明确、不清晰甚至错误的描述。由于篇幅和时间所限,本书也可能会遗漏一些读者感兴趣的技术内容。此外,生成式AI仍处于快速演进的发展时期,但受图书出版周期的限制,本书介绍的一些技术在读者阅读时很可能已经发生改变。凡此种种还请读者海涵并不吝赐教,敬请将勘误或意见建议,反馈至笔者邮箱txs_books@163.com,以期后期再版图书时予以订正或补充。众人拾柴火焰高,希望本书能在读者和笔者的共同努力下,真正帮助到有志于从事AI研发的从业人员,为中国人工智能的普及与发展尽绵薄之力! 最后,我想由衷感谢为本书最终出版付出大量心血的编校人员,是你们的辛勤工作才让本书得以提早问世!同时也要感谢我的家人,你们的鼓励与支持是我完成本书创作的最大动力!
|
|