新書推薦:
《
环境、社会、治理(ESG)信息披露操作手册
》
售價:HK$
261.8
《
桑德拉销售原则 伍杰 [美]大卫·马特森
》
售價:HK$
96.8
《
理论的意义
》
售價:HK$
74.8
《
悬壶杂记:医林旧事
》
售價:HK$
52.8
《
谁之罪?(汉译世界文学5)
》
售價:HK$
52.8
《
民国词社沤社研究
》
售價:HK$
140.8
《
帕纳索传来的消息(文艺复兴译丛)
》
售價:HK$
108.9
《
DK威士忌大百科
》
售價:HK$
294.8
|
編輯推薦: |
AIGC是热点,可以帮我们做很多工作,甚至有些工作可以由AIGC来做
|
內容簡介: |
本书以通俗易懂的方式从各个层面介绍了AIGC的基础知识,并辅以大量案例引领读者了解AIGC的应用实践,让读者可以更快速地利用AIGC改善工作和生活。 第1章从AI发展历史到资本市场近况阐述了AIGC产业的概况,第2章介绍了AIGC相关技术,第3章介绍了文本类AIGC技术的发展及其在传媒、教育、办公等场景中的应用,第4章介绍了声音类AIGC技术的发展及其在音乐、仿真等领域中的应用,第5章介绍了图片类AIGC的发展及其在图片生成、图片处理、图片识别等领域中的应用,第6章介绍了视频类AIGC的发展及其在视频生成、数字人等领域中的应用,第7章介绍了AIGC上下游产业链(包括芯片、VR等相关设备、元宇宙建模)的概况,第8章提出了AIGC对人类文明发展产生的影响,并对普通人如何应对AIGC带来的\生产力爆炸”提出方法论。
|
關於作者: |
a15aa15a是一个Creator DAO(创作者去中心化组织),致力于以DAO的形式来产出新科技领域的内容,降低普通人了解科技的门槛。a15a已出版多本新科技科普书籍,并计划推出更多体系化课程和讲座。a15a的主要成员是区块链和人工智能领域的专家、从业者、研究人员和学生,以及法律合规领域的专业人士。在抖音、知乎、小红书、推特等平台上搜索“a15a”即可找到a15a官方账号。贾雪丽上海技术交易所专家库专家,代尔夫特理工大学硕士,先后就职于 ING 银行、中国平安、光大集团等金融科技企业,拥有丰富的人工智能、隐私计算及区块链等项目经验,申请人工智能相关发明专利 60 余项,在INTERSPEECH会议上发表论文一篇,参与撰写多个隐私计算行业报告和白皮书。0xAres利物浦大学硕士,曾先在投资公司工作,后就职于知名公链。从业期间主持制作过多个区块链系列课程,举办过多次“黑客松”,长期致力于区块链的科普教育,有Web3.0行业全领域孵化经验,乐于通过多种形式的内容创作传播Web3.0共识;2021年组建创作者去中心化组织a15a并开始编写新科技领域的科普书籍,主编了《一本书读懂Web3.0:区块链、NFT、元宇宙和DAO》和《一本书读懂NFT:区块链通证、元宇宙资产、Web3.0营销和数字化身份》。张炯星图比特创始人兼CEO,中国通信工业协会信息化科技创新专业委员会委员,上海技术交易所专家库专家;曾就职于IBM,拥有丰富的金融科技从业经验,长期服务中国人民银行、中国工商银行等大型金融机构,擅长技术融合、产业创新,对以区块链、人工智能为代表的数字经济技术有深刻的理解;拥有人工智能和数字资产相关专利8项,参与撰写了《一本书读懂Web3.0:区块链、NFT、元宇宙和DAO》和《一本书读懂NFT:区块链通证、元宇宙资产、Web3.0营销和数字化身份》。
|
目錄:
|
第1章 我们为什么要关注AIGC
1.1 从人工智能到人工智能生成内容
1.2 巨头如是说
1.2.1 国外“大厂”在AIGC领域的布局
1.2.2 国内“大厂”在AIGC领域的布局
1.3 资本狂潮
1.4 异军突起的独角兽企业
1.4.1 OpenAI
1.4.2 Stability AI
1.4.3 Scale AI
1.5 行业“大牛”:谁是下一个“乔布斯”
第2章 AIGC相关技术介绍
2.1 规则系统
2.2 变分自编码器
2.3 生成对抗网络
2.3.1 GAN模型训练原理
2.3.2 CGAN模型
2.3.3 基于模型架构的衍生
2.3.4 基于损失函数的衍生
2.3.5 图像生成领域的衍生
2.4 Transformer模型架构
2.5 基于Transformer模型架构的LLM
2.5.1 基于编码器的LLM
2.5.2 基于解码器的LLM
2.5.3 基于编码器和解码器的LLM
2.5.4 BERT模型与GPT模型对比
2.6 扩散模型
2.6.1 扩散模型原理
2.6.2 DALL?E 2模型
2.6.3 Stable Diffusion模型
2.7 其他模型
2.8 LLM的前景光明
第3章 下笔如有神:文本类AIGC
3.1 何为“智能”
3.2 拆解文本生成技术原理
3.2.1 1950—1970年,NLP初露锋芒
3.2.2 1980—2010年,NLP的寒冬与机遇并存
3.2.3 2010—2019年,技术迸发与沉淀
3.2.4 2019年至今,AIGC进入寻常百姓家
3.3 文本类AIGC在传媒场景中的应用
3.3.1 社交媒体文案:Jasper
3.3.2 新闻写作:Quakebot、CNET
3.3.3 剧本撰写:海马轻帆
3.4 文本类AIGC在教育场景中的应用
3.4.1 文章撰写:EssayGenuis
3.4.2 出题和做题:高校联合团队开发的AI程序
3.4.3 青少年教育:Cognii
3.5 文本类AIGC在办公场景中的应用
3.5.1 搜索引擎优化:Kafkai
3.5.2 营销文案:Copysmith
3.5.3 电子邮件:Compose.ai
3.5.4 代码撰写:GitHub Copilot
3.6 文本类AIGC的其他热门场景
3.6.1 AI聊天机器人
3.6.2 AIGC搜索引擎:Perplexity AI
3.7 万众瞩目的ChatGPT
3.7.1 ChatGPT是什么
3.7.2 ChatGPT的海量应用场景
3.7.3 GPT-4模型:截至2023年3月强的AI模型
3.7.4 ChatGPT对普通人意味着什么
3.8 文本类AIGC的未来
第4章 “声临其境”:声音类AIGC
4.1 从让机器开口说话开始
4.1.1 18至19世纪的尝试
4.1.2 20世纪30年代,语音合成技术的萌芽
4.1.3 20世纪50年代,计算机语音合成系统的起源
4.1.4 20世纪末,传统的语音合成方法
4.1.5 2016年,AIGC打破语音合成技术的发展瓶颈
4.1.6 2017年,语音合成技术迎来研究热
4.2 音乐类AIGC
4.2.1 从留声机到个人计算机制作的电子音乐
4.2.2 早期的音乐类AIGC
4.2.3 端到端模型大展身手
4.2.4 歌声合成
4.2.5 音频延续
4.3 人声类AIGC
4.3.1 变声器
4.3.2 语音助手
4.3.3 有声内容创作
4.3.4 智能电话机器人
4.3.5 教育
4.3.6 无障碍沟通
4.4 声音类AIGC的未来
4.4.1 业内观点
4.4.2 声音类AIGC的局限性和未来展望
第5章 如你所见:图片类AIGC
5.1 从计算机艺术到算法模型艺术
5.1.1 20世纪70年代,艺术家的午夜花园
5.1.2 2012年,一次有突破意义的尝试:猫脸的识别与生成
5.1.3 2014年,GAN模型问世
5.1.4 2017年,梦始于Transformer模型
5.1.5 2021年,文本与图片进行匹配:CLIP模型和文字提示词
5.1.6 2020—2022年,图片生成技术开启AI绘画元年:扩散模型
5.2 AI绘画
5.2.1 主流的AI绘画工具介绍
5.2.2 生成图片类AIGC的方式
5.2.3 Prompt词组
5.3 图片处理
5.3.1 AI修图
5.3.2 图片增强
5.3.3 分割抠图
5.4 图片类AIGC的衍生应用:AI识图和AI鉴图
5.4.1 人脸和人体识别
5.4.2 通用图片识别
5.4.3 是否由AI绘画工具创作
5.5 实用、有趣的图片世界
5.5.1 头像生成
5.5.2 模拟场景
5.5.3 PPT生成
5.5.4 设计
5.5.5 稿件配图
5.5.6 更多场景
5.6 图片类AIGC的未来
5.6.1 局限性和发展预测
5.6.2 怎么看AI艺术
5.6.3 笔者的一些浅见
第6章 众所周知,视频是不能PS的:视频类AIGC
6.1 视频生成技术的发展历程
6.1.1 早期探索
6.1.2 2014—2016年,视频生成起步:无条件视频生成
6.1.3 2017年,潘多拉的魔盒:人像视频生成
6.1.4 2018—2019年,视频生成视频技术的突破
6.1.5 2021年,文本生成视频技术的发展
6.1.6 2022年,扩散模型进军视频生成领域
6.2 视频生成工具
6.2.1 数字人视频生成工具
6.2.2 视频编辑工具
6.2.3 文本生成视频工具
6.3 视频生成应用
6.3.1 高清内容生成
6.3.2 快速拆条和视频摘要生成
6.3.3 场景植入
6.3.4 视频卡通化
6.3.5 文本生成视频
6.3.6 数字人视频生成
6.3.7 人脸视频生成
6.4 数字人:仿生人与电子羊
6.5 视频类AIGC的未来
6.5.1 局限性
6.5.2 未来预测
第7章 AIGC的相关产业和生态发展
7.1 芯片:算力决定智力
7.1.1 在AIGC领域中,现在用什么芯片
7.1.2 随着AIGC的发展,对芯片会有什么新的需求
7.2 AIGC展示端口:AR/VR/MR/XR设备
7.2.1 AR设备
7.2.2 VR设备
7.3 模型类AIGC应用在元宇宙里自动化建模
7.3.1 拍视频就可以得到模型?基于视频自动化生成模型
7.3.2 元宇宙版的神笔马良,基于文本自动化生成三维模型
7.3.3 穿越空间,虚拟直播空间建设
7.3.4 元宇宙的化身——数字人生成技术
7.3.5 把实物带到元宇宙中,基于三维激光扫描设备的文物逆向建模
7.4 AIGC应用的未来
第8章 AI文明的降临已开启倒计时
8.1 何谓内容
8.2 AIGC的版权争议
8.3 普通人的AIGC时代生存建议
8.3.1 生产力工具:“人工” “智能”=强“打工人”
8.3.2 做AIGC应用的老师,为人类的“群体智慧”做贡献
8.3.3 向AIGC应用学习逻辑,同时关注创新
后记
|
內容試閱:
|
本书于2022年9月开始筹备编写,至2023年3月完结。在此期间,我们见证了ChatGPT的崛起,也见证了AIGC在全球范围内引起热议。
ChatGPT有多火?或许我可以用自己真实经历的一天来简单说明。
2023年2月14日,我在北京财富中心坐电梯,电梯中的3位中年人在争论ChatGPT是否可以代替人类写文字作业。10分钟之后,当我在餐厅吃饭时,坐在我旁边桌上的人也在讨论ChatGPT。晚上8点,我在健身的时候,健身教练问我是否知道ChatGPT,能否教他怎么使用ChatGPT生成健身文案。晚上10点,年逾60岁的长辈给我发微信消息,说ChatGPT近很火,或许可以帮助我写书。
不分年龄,不分职业,几乎所有的人都在关注ChatGPT和AIGC,并且迫切地希望将其应用到自己的工作中。
问题是,上面提到的四批人,很明显都没有使用过ChatGPT,甚至也没有使用过类似的“包壳产品”(许多所谓的AIGC应用其实连接的是ChatGPT的API)。他们对AIGC的认知大多来自碎片化信息,而这些信息可能已经传播了五六手,甚至七八手。
我想问的个问题是,是否所有人都可以公平地享受科技发展带来的生产力进步?
显然不是。有相当一部分人,或因为接收信息的渠道问题,或因为受教育程度的问题,或因为自身学习能力的问题等,没有办法或机会快速接触新技术,更没有办法直接将其应用于现实的生活和工作中享受科技带来的便利。
AIGC距离普通人很近,但其实也很远。更可怕的是,AIGC应用越完善,内容生产的社会必要劳动时间就越少,人工就越没有价值。全社会新增劳动岗位的速度很快就会跟不上AIGC应用取代人工的速度,而不会使用AIGC应用的劳动者可能将无法获得收入,无法进行消费,从而逐步被剥离出经济循环。
科技本身并不具有公平性。新科技的诞生需要以巨大资源聚集为前提,其应用落地更不会在全世界平均分布、等速进行。但是,人类文明需要公平。a15a的使命就是为尽可能多的普通人提供认识新科技的渠道,打破知识垄断,让科技普惠大众。基于这个目的,我们编写了本书,并尽可能地把AIGC的原理写得通俗易懂。第2章读起来可能会比较吃力,需要对AI有一定的了解,建议对AI技术了解较少的读者可以在阅读完其他章节之后再选择性阅读。
我的另外两个问题是:
科技带来的是一个什么样的世界?
科技真的会让世界变得更好吗?
我无法给出答案,且将这两个问题留给读者。
不过有一点毋庸置疑:世界正在被AIGC改变,并且变化的速度逐渐加快。若干年后回顾人类历史,或许此时的我们已经身处一次爆炸式生产力变革之中。
0xAres
2023年3月
|
|