新書推薦:
《
万千心理·我的精神分析之道:复杂的俄狄浦斯及其他议题
》
售價:HK$
104.5
《
荷马:伊利亚特(英文)-西方人文经典影印21
》
售價:HK$
107.8
《
我的心理医生是只猫
》
售價:HK$
49.5
《
巴拉吉预言
》
售價:HK$
74.8
《
股权控制战略:如何实现公司控制和有效激励(第2版)
》
售價:HK$
98.8
《
汉译名著·哲学经典十种
》
售價:HK$
761.2
《
成吉思汗传:看历代帝王将相谋略 修炼安身成事之根本
》
售價:HK$
61.6
《
爱丁堡古罗马史-罗马城的起源和共和国的崛起
》
售價:HK$
76.8
編輯推薦:
1.课证融合,紧贴实际2.项目教学,融会贯通3.注解详细,一目了然4.课后习题,加强巩固5.配套丰富,方便教学
內容簡介:
《数据分析与可视化》主要介绍目前非常流行的数据分析和数据可视化工具,首先介绍数据分析“三剑客”,即NumPy、Matplotlib和Pandas。NumPy侧重于科学计算,Matplotlib侧重于数据可视化,Pandas侧重于数据分析。然后介绍微软推出的交互式数据分析和可视化工具Power BI。《数据分析与可视化》分为上篇和下篇,上篇介绍使用Python实现数据的分析和可视化,通过4个项目介绍NumPy、Matplotlib和Pandas的使用。下篇共4个项目,介绍使用微软的Power BI Desktop实现数据的分析和可视化。《数据分析与可视化》适合作为高职院校大数据、人工智能等专业数据分析和可视化课程的教材,也可作为《人工智能数据处理》1+X证书的学习用书,同时也适合数据分析初学者、数据分析爱好者、数据分析工程师以及相关培训机构学员学习。
關於作者:
张涛,男,中国科学技术大学软件工程硕士,安徽信息工程学院特聘讲师,主持参与高等院校人工智能课程改革,课程研发任务。著有《从零开始学Scrapy网络爬虫》一书。拥有6年外企证券行业软件开发和管理经验、5年计算机相关教学改革和教学实施经验、3年人工智能领域教育教学设计和实施经验。
目錄 :
目录前言上篇 Python数据分析与可视化项目1 使用NumPy分析空气质量状况任务1.1 项目需求分析任务1.2 环境搭建1.2.1 开发环境介绍1.2.2 Anaconda下载和安装1.2.3 PyCharm集成开发环境下载和安装任务1.3 数据获取1.3.1 通过网络爬虫爬取1.3.2 直接从网站下载任务1.4 数据预处理1.4.1 读取数据1.4.2 合并多个数据集1.4.3 ndarray数据结构1.4.4 去除冗余数据1.4.5 数据持久化存储任务1.5 科学计算1.5.1 获取任意范围的样本数据1.5.2 计算特征的最小值、最大值和平均值1.5.3 统计不同空气质量等级的天数1.5.4 预测空气质量小结课后习题项目2 使用Matplotlib实现空气质量数据可视化任务2.1 项目需求分析任务2.2 折线图:展现AQI走势2.2.1 实现AQI走势折线图2.2.2 图形的优化和美化2.2.3 添加注释任务2.3 条形图:展现PM2.5走势2.3.1 条形图:某月PM2.5的走势情况2.3.2 堆叠条形图:相邻月份PM2.5值的比较2.3.3 并排条形图:PM2.5和PM10的比较任务2.4 散点图:展现内在相关性任务2.5 子图:展现图表的多样性任务2.6 饼图:展现部分和整体的关系小结课后习题项目3 使用Pandas分析股票交易数据任务3.1 项目需求分析任务3.2 数据获取和存储3.2.1 数据获取3.2.2 数据存储任务3.3 数据读取3.3.1 读取CSV文件中的数据3.3.2 读取Excel文件中的数据3.3.3 获取MySQL数据库中的数据任务3.4 数据简单处理3.4.1 常用属性3.4.2 查找数据3.4.3 组装数据3.4.4 添加数据3.4.5 修改数据3.4.6 删除数据任务3.5 数据深度处理3.5.1 数据去重3.5.2 缺失值处理3.5.3 数据转换任务3.6 统计分析3.6.1 汇总统计3.6.2 groupby:数据分组聚合3.6.3 agg:数据聚合3.6.4 apply:数据聚合3.6.5 transform:数据转换小结课后习题项目4 使用Pandas实现股票交易数据可视化任务4.1 项目需求分析任务4.2 折线图:展现股价走势任务4.3 散点图:展现股价影响因素任务4.4 条形图:展现同比成交量任务4.5 饼图:展现成交量占比关系任务4.6 K线图:展现股价走势小结课后习题下篇 Power BI数据分析与可视化项目5 空气质量状况分析任务5.1 项目需求分析任务5.2 环境搭建5.2.1 Power BI介绍5.2.2 Power BI Desktop的下载和安装5.2.3 Power BI Desktop操作界面介绍任务5.3 数据预处理5.3.1 导入数据5.3.2 筛选数据5.3.3 添加列5.3.4 合并列任务5.4 数据分析和可视化5.4.1 折线图:空气质量走势5.4.2 数据钻取5.4.3 条形图:空气质量走势比较5.4.4 饼图:空气质量优良占比5.4.5 关键影响者图:影响AQI的因素5.4.6 编辑交互5.4.7 筛选器5.4.8 切片器小结课后习题项目6 企业财务报表数据分析任务6.1 项目需求分析任务6.2 数据获取任务6.3 数据预处理6.3.1 导入数据6.3.2 删除数据6.3.3 处理缺失值6.3.4 逆透视数据表6.3.5 转换数据6.3.6 处理股票交易数据任务6.4 数据建模6.4.1 新建项目名称表6.4.2 使用DAX新建日期表6.4.3 创建表之间的关联任务6.5 数据分析和可视化6.5.1 度量值:计算关键指标6.5.2 卡片图:展示关键指标数据6.5.3 矩阵图:罗列关键数据6.5.4 瀑布图:分析营业总成本6.5.5 K线图:展现走势与趋势小结课后习题项目7 银行客户营销分析任务7.1 项目需求分析任务7.2 数据预处理任务7.3 数据分析和可视化7.3.1 仪表盘:订阅率7.3.2 折线和堆积柱形图:影响订阅率的因素7.3.3 簇状柱形图:是否回头客因素对订阅率的影响7.3.4 关键影响者图:影响订阅率的因素7.3.5 问答系统小结课后习题项目8 电商App用户购物行为分析任务8.1 项目需求分析任务8.2 下载并安装MySQL数据库服务器任务8.3 将数据导入到MySQL数据库中任务8.4 数据获取任务8.5 数据预处理任务8.6 数据分析和可视化8.6.1 多行卡:关键指标数据8.6.2 漏斗图:从浏览到购买的转化率8.6.3 折线图:不同时段的浏览量和购买量8.6.4 环形图:RFM模型小结课后习题附录 附录A NumPy常用属性和函数附录B Pandas常用属性和函数附录C DAX常用函数
內容試閱 :
前言 为抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国,国务院于2017年印发了《新一代人工智能发展规划》。规划指明在2030年要抢占人工智能领域制高点。为了实现这个目标,我国从小学教育、中学科目,到大学院校,将会逐步新增人工智能的课程,建设全国人才梯队。作为职业教育中坚力量的高职院校也迅速响应,陆续开设人工智能和大数据相关课程,但当前符合高职院校教学需求的教材比较缺乏。作为人工智能专业核心课程,数据分析与可视化课程的教材也比较缺乏。我们知道,人工智能离不开数据,数据是人工智能的“养料”,我们需要将没有“杂质”的、有价值的数据“喂给”计算机,这样计算机才能从数据中学到经验,达到智能的效果。因此,拿到数据后,首先需要对数据进行预处理,比如合并数据、缺失值处理、重复数据处理、转换数据等,还需要对数据进行分析和统计,找出隐藏在数据中的客观规律。当然,还需要通过可视化图表将数据形象地展现给用户。另外,随着职业教育1+X证书制度的全面展开,越来越多的学生将有机会参加各种职业资格证书的考试。因此课证需要融合,即学校开设的课程全面涵盖1+X证书的知识体系和重点内容,这样在相关专业课程完成后,学生就可以参加1+X证书考试,不必再花费大量时间进行培训和学习。由科大讯飞主导制定的《人工智能数据处理》等级证书,分为初级、中级和高级三个等级,其中初级和中级需要掌握数据预处理、数据分析与数据可视化的知识。本书主要涉及数据预处理、数据分析与数据可视化的相关知识,具体包括使用NumPy进行数据处理与科学计算、使用Pandas进行数据分析与可视化、使用Matplotlib进行数据可视化,以及使用Power BI进行数据分析与可视化,不仅能够满足高职院校专业课程的实施,而且与1+X证书知识体系相融合。本书特色1.课证融合,紧贴实际本书主要讲解数据预处理、数据分析与数据可视化的知识,不仅满足大数据、人工智能专业相关的专业核心课教学需求,而且符合《人工智能数据处理》1+X证书的考核要求,达到课证融合,并紧贴实际。2.项目教学,融会贯通每个项目都按项目实现的流程编排,首先提出项目需求,对项目进行分析,梳理项目流程和目标;然后在项目实现过程中引入新知识并及时运用到项目中,帮助读者融会贯通,提高解决实际问题的能力。3.注解详细,一目了然在上篇Python数据分析与可视化部分,Python程序代码中都做了详细的注释,读者理解起来会更加顺畅。另外,由于Power BI操作性较强,本书不仅提供了详细操作的截图,而且清晰地标注了图中需要操作的控件,便于读者准确操作。4.课后习题,加强巩固在每个项目的最后都提供课后习题,包括选择题、简答题、编程题和操作题,帮助读者巩固与提高所学知识。5.配套丰富,方便教学本书配套有微课视频,扫描书中二维码,即可观看;配有源代码、配套数据集,方便读者边学边做;还配有专业的电子课件、教学大纲、课时安排,以方便相关院校或培训机构的教学人员授课。 本书内容上篇 Python数据分析与可视化项目1 使用NumPy分析空气质量状况本项目基于通过网络爬虫或从相关网站得到的空气质量数据集,使用NumPy对数据集进行处理和科学计算,并通过统计和分析得到相关指标,为决策提供重要的科学依据。项目2 使用Matplotlib实现空气质量数据可视化本项目通过Matplotlib可视化工具,对项目1处理得到的空气质量数据进行可视化实现。形象地将数据通过折线图、条形图、散点图、子图和饼图展现出来,有助于洞察数据中蕴含的关系和规律。项目3 使用Pandas分析股票交易数据本项目基于从东方财富网中获取的股票交易数据,使用Pandas对数据集进行处理,并使用统计分析模块对数据进行统计分析,找出规律和趋势,为投资决策提供理论依据,降低投资风险。项目4 使用Pandas实现股票交易数据可视化本项目使用Pandas内嵌的可视化模块实现股票交易数据的可视化。可视化图形包括折线图、散点图、条形图、饼图和K线图。通过可视化图表能够更加客观、形象地找出规律和趋势。下篇 Power BI数据分析与可视化项目5 空气质量状况分析本项目使用Power BI Desktop实现空气质量数据集的数据预处理、数据分析和数据可视化功能。涉及的可视化图形有折线图、柱形图、饼图、关键影响者图,并通过数据钻取、编辑交互、筛选器和切片器与图表进行更深入、细致的交互。项目6 企业财务报表数据分析本项目使用Power BI Desktop实现股票交易数据集的数据预处理、数据建模、数据分析和数据可视化功能。涉及的可视化图形有度量值图、卡片图、矩阵图、瀑布图和K线图。项目7 银行客户营销分析本项目基于从UCI中获取的某银行电话直销活动的数据集,使用Power BI Desktop实现数据集的数据预处理、数据分析和数据可视化功能。涉及的可视化图形有仪表盘、折线和堆积条形图、簇状条形图、关键影响者图和问答系统。项目8 电商App用户购物行为分析本项目基于从阿里云天池获取的电商App用户购物行为数据集,将其持久化到My