新書推薦:

《
西周人的日常生活:中国贵族的蜕变之旅 西周人的一天 九鼎八簋的隐藏菜单
》
售價:HK$
107.8

《
近代中国政府与政治
》
售價:HK$
118.8

《
索恩丛书·蛮族之王:狄奥多里克与罗马帝国的黄昏
》
售價:HK$
174.9

《
世界银行营商环境成熟度方法论手册 2025年修订版 官方指导手册
》
售價:HK$
327.8

《
人形机器人:产业变革商业机遇与未来趋势
》
售價:HK$
96.8

《
没有人能让我不快乐
》
售價:HK$
46.2

《
汉匈战争三百年
》
售價:HK$
97.9

《
成为作家:提升创造力、自律性、谦逊和毅力的专业指南(写作不是天赋,作家可以培养,人人都可以实现自己的作家梦)
》
售價:HK$
64.9
|
編輯推薦: |
1.以基础入门为主线,满足职业院校学生对数据分析课程的需要; 2.突出动手实践,各个章节设计了实训环节,全书最后设计了综合实训项目——电影数据分析,带领读者全面掌握全书内容。 3.本书配套丰富的教学资源,包括PPT、教学大纲、源代码、数据集、教案、教学视频。
|
內容簡介: |
本书详细讲解Python数据分析的相关内容,共10章,第1~9章分别讲解数据分析概述、Python与数据分析、Python基础、NumPy数组与矢量计算、用NumPy进行简单的统计分析、数据可视化工具——Matplotlib、pandas数据分析基础、用pandas进行数据预处理、机器学习库scikit-learn入门;第10章用一个综合案例——电影数据分析项目,带领读者灵活掌握本书所讲内容。來源:香港大書城megBookStore,http://www.megbook.com.hk 本书可作为高等教育本、专科院校计算机相关专业的教材,也可作为Python数据分析爱好者的自学参考书。
|
關於作者: |
郑丹青,教授、高级工程师,湖南省计算机应用技术省级专业带头人,具有多年的计算机教学工作经验,有着近20年的企业软件项目开发经验,获得过株洲市科委的奖励。
|
目錄:
|
第 1章 数据分析概述 1 1.1 数据 1 1.1.1 数据的概念 1 1.1.2 数据的类型 2 1.2 数据分析 2 1.2.1 数据分析的概念 2 1.2.2 数据分析的过程 3 1.2.3 数据分析的作用 5 1.2.4 数据分析的常用工具 6 本章小结 6 思考练习 7 第 2章 Python与数据分析 8 2.1 Python简介 8 2.1.1 Python的特点 8 2.1.2 Python解释器 9 2.2 Python与数据分析的关系 9 2.3 Python数据分析常用的库 10 2.4 Python开发环境的搭建 11 2.5 Python集成开发环境的搭建 13 2.5.1 PyCharm的安装与使用 13 2.5.2 Jupyter Notebook的安装与使用 17 项目实践 23 本章小结 24 思考练习 24 第3章 Python基础 25 3.1 Python的基础语法 25 3.1.1 Python的语法规则 25 3.1.2 常量、变量与标准数据类型 29 3.1.3 编写Python程序 30 3.2 Python的数据类型 31 3.2.1 数字 31 3.2.2 字符串 32 3.2.3 Python的数据结构 36 3.2.4 列表 36 3.2.5 元组 41 3.2.6 字典 44 3.2.7 集合 49 3.3 Python的流程控制语句 51 3.3.1 if语句 51 3.3.2 while语句 52 3.3.3 for语句 53 3.3.4 range()函数的作用 54 3.3.5 break、continue、pass语句 55 3.4 Python的函数 56 3.4.1 自定义函数 56 3.4.2 设置函数参数 56 3.4.3 函数返回值 58 3.4.4 调用自定义函数 58 3.4.5 局部变量和全局变量 58 3.4.6 函数嵌套 60 3.4.7 匿名函数 61 项目实践 61 本章小结 63 思考练习 63 第4章 NumPy数组与矢量运算 65 4.1 NumPy概述 65 4.1.1 NumPy简介 65 4.1.2 NumPy的测试与安装 66 4.1.3 SciPy简介及其测试与安装 67 4.1.4 NumPy的简单应用:一维数组 相加 68 4.2 NumPy数组 69 4.2.1 创建数组 69 4.2.2 选取数组元素 70 4.2.3 数组的属性 70 4.2.4 创建数组的其他方法 71 4.2.5 NumPy的数据类型 72 4.3 NumPy数组操作 73 4.3.1 数组的索引和切片 74 4.3.2 修改数组形状 76 4.3.3 数组的展平 77 4.3.4 数组的转置和轴对换 78 4.3.5 数组的连接 79 4.3.6 数组的分割 80 4.3.7 数组转换 81 4.3.8 添加/删除数组元素 81 4.4 NumPy数组的矢量运算 83 4.4.1 数组的运算 83 4.4.2 通用函数 85 4.5 NumPy矩阵的创建、运算及操作 87 4.6 随机数的生成 89 项目实践 91 本章小结 92 思考练习 92 第5章 用NumPy进行简单的统计 分析 94 5.1 文件读写操作 94 5.1.1 使用NumPy读写文本文件 94 5.1.2 使用NumPy读写二进制文件 96 5.1.3 使用NumPy读写多维数据 文件 97 5.2 NumPy常用的统计函数 97 5.3 使用NumPy函数进行统计分析 102 5.3.1 NumPy的排序函数 102 5.3.2 NumPy的去重函数与重复函数 103 5.3.3 NumPy的搜索函数和计数函数 105 5.4 简单的统计分析 106 项目实践 109 本章小结 110 思考练习 110 第6章 数据可视化工具—— Matplotlib 112 6.1 Matplotlib概述 112 6.1.1 Matplotlib简介 112 6.1.2 Matplotlib的测试、安装与 导入 113 6.2 使用pyplot创建图表 114 6.2.1 创建简单的图表 114 6.2.2 创建子图 118 6.3 Matplotlib参数配置 119 6.3.1 matplotlibrc配置文件 119 6.3.2 设置动态rc参数 120 6.4 分析变量间关系 121 6.4.1 绘制散点图 121 6.4.2 绘制折线图 123 6.5 分析变量数据分布和分散状况 125 6.5.1 绘制直方图 125 6.5.2 绘制柱形图 127 6.5.3 绘制饼图 129 6.5.4 绘制箱线图 131 项目实践 132 本章小结 134 思考练习 135 第7章 pandas数据分析基础 136 7.1 pandas概述 136 7.1.1 pandas简介 136 7.1.2 pandas的测试、安装与导入 137 7.2 pandas的数据结构及常用操作 138 7.2.1 Series对象及常用操作 138 7.2.2 DataFrame对象及常用操作 142 7.3 pandas的索引 149 7.3.1 Index对象 149 7.3.2 Index对象的属性和方法 150 7.3.3 重新索引 152 7.3.4 层级索引 153 7.4 pandas数据结构之间的运算 156 7.4.1 算术运算和数据对齐 156 7.4.2 算术运算函数 158 7.4.3 DataFrame与Series对象之间的 运算 158 7.5 pandas的函数应用 159 7.5.1 数据筛选函数 159 7.5.2 apply()函数 160 7.5.3 统计函数 161 7.5.4 DataFrame格式化函数 162 7.5.5 排序和排名 162 7.6 数据的读取与写入 164 7.6.1 读写文本文件 164 7.6.2 读写Excel文件 166 7.6.3 读写数据库文件 168 7.6.4 读写JSON文件 170 7.7 数据分析方法 171 7.7.1 描述性统计分析 172 7.7.2 分组分析 172 7.7.3 分布分析 173 7.7.4 交叉分析 174 7.7.5 结构分析 177 7.7.6 相关分析 178 项目实践 179 本章小结 180 思考练习 180 第8章 用pandas进行数据 预处理 181 8.1 数据清洗 181 8.1.1 重复值的处理 181 8.1.2 缺失值的处理 182 8.1.3 异常值的处理 185 8.2 数据合并 187 8.2.1 按键合并数据 187 8.2.2 沿轴连接数据 189 8.2.3 合并重叠数据 192 8.3 数据抽取 193 8.3.1 字段抽取与拆分 193 8.3.2 记录抽取 195 8.4 重塑层级索引 195 8.5 映射与数据处理 197 8.5.1 用映射替换元素 197 8.5.2 用映射添加元素 198 8.5.3 重命名轴索引 199 8.6 排列与随机抽样 200 8.7 日期转换、日期格式化和日期 抽取 201 8.8 字符串处理 202 8.8.1 内置的字符串处理方法 203 8.8.2 正则表达式 205 8.8.3 矢量化的字符串函数 209 项目实践 211 本章小结 212 思考练习 213 第9章 机器学习库scikit-learn 入门 214 9.1 机器学习概述 214
9.2 scikit-learn概述 216 9.2.1 scikit-learn简介 216 9.2.2 scikit-learn的测试、安装和 导入 217 9.3 第 一个机器学习程序 218 9.4 使用scikit-learn进行机器 学习 219 9.4.1 Seaborn绘图 219 9.4.2 准备数据集 224 9.4.3 选择模型 229 9.4.4 调整参数并训练和测试模型 232 项目实践 235 本章小结 237 思考练习 237 第 10章 电影数据分析项目 239 10.1 项目描述 239 10.2 准备数据 240 10.3 数据清洗 241 10.4 数据分析与数据可视化 241 本章小结 247 思考练习 247 参考文献 248
|
|