新書推薦:
《
许子东文集9:21世纪中国小说选读
》
售價:HK$
108.9
《
好望角系列·被遗忘的中美洲:革命、暴力与移民的根源
》
售價:HK$
118.8
《
先秦战争与政治地理格局:换个角度看历史,破解华夏战争密码
》
售價:HK$
85.8
《
付出就一定有收获吗?给孩子的聪明哲思绘本 全6册
》
售價:HK$
109.8
《
自主机器人导论
》
售價:HK$
87.8
《
何处为家:雪莉·哈扎德和唐纳德·基恩的书信情谊
》
售價:HK$
96.8
《
和虫虫面对面
》
售價:HK$
74.7
《
何谓明治(历史学堂)
》
售價:HK$
63.8
編輯推薦:
本书系统性地总结了Python 在数据分析中的应用方法,围绕数据分析所需的编程技能进行了详细的讲解与实践指导。本书从基本编程出发,逐步深入到面向对象编程、使用模块、数组操作、数据处理以及可视化数据等关键领域,幵通过丰富的示例展示了如何将Python 的核心工具高效地应用于复杂的数据分析场景。本书注重实践与理论结合,帮助读者建立对数据分析任务的系统性理解。
內容簡介:
本书系统性地总结了Python 在数据分析中的应用方法,围绕数据分析所需的编程技能进行了详细的讲解与实践指导。本书从基本编程出发,逐步深入到面向对象编程、使用模块、数组操作、数据处理以及可视化数据等关键领域,幵通过丰富的示例展示了如何将Python 的核心工具高效地应用于复杂的数据分析场景。本书注重实践与理论结合,帮助读者建立对数据分析任务的系统性理解。本书面向具有一定Python 基础的读者,包括数据分析、机器学习及相关领域的研究人员、工程师以及高等院校的高年级本科生和研究生。此外,本书也适合希望通过掌握数据分析工具提升项目实践能力的读者阅读。无论是希望夯实编程基础的读者,还是希望在数据分析领域深入探索的技术人员,都可以通过本书获得清晰的思路和实用的工具支持。
關於作者:
本书作者José Unpingco:于1997年从加州大学圣地亚哥分校获得博士学位,此后一直在工业界担任工程师、顾问和讲师,研究各种高级数据科学主题,在机器学习方面拥有丰富的经验.他还率先在国防部范围内采用科学 Python。他还是 UCSD 本科和研究生学位课程的数据科学讲师,以及Python for Signal Processing和Python for Probability、Statistics和Machine Learning的作者。本书译者安翔:北京大学博士,北京大学信息科学技术学院博士后,人工智能研究院助理教授。主要研究领域为:语音识别与合成、自然语言处理、机器学习与深度学习等。博士后阶段进行了语音合成相关的研究工作, 近五年在公司积累了大量的深度学习相关实践经验。参与国家自然科学基金2项,863课题1项。在国内外高水平的学术会议期刊上发表了十多篇学术论文,其中SCI/EI收录5篇。
目錄 :
目 录译者序前言致谢第1 章 基本编程 11.1 基础语言 11.1.1 入门 21.1.2 保留关键字 31.1.3 数字 31.1.4 复数 41.1.5 字符串 51.1.6 基本数据结构 91.1.7 循环和条件 161.1.8 函数 201.1.9 文件输入/ 输出 321.1.10 处理错误 341.1.11 掌握Python 的强大功能 371.1.12 生成器 401.1.13 装饰器 451.1.14 迭代 491.1.15 使用Python 断言进行预调试 571.1.16 使用sys.settrace 进行堆栈追踪 581.1.17 使用IPython 进行调试 591.1.18 从Python 中进行日志记录 59第2 章 面向对象编程 622.1 属性 622.2 方法 642.3 继承 652.4 类变量 672.5 类函数 682.6 静态方法 702.7 哈希对子变量隐藏父变量 702.8 委托函数 712.9 使用super 进行委托 712.10 元编程:猴子补丁 732.11 抽象基类 742.12 描述符 762.13 具名元组和数据类 792.14 泛型函数 822.15 设计模式 842.15.1 模板 852.15.2 单列模式 852.15.3 观察者 862.15.4 适配器 87参考文献 87第3 章 使用模块 883.1 标准库 883.2 编写和使用自己的模块 903.2.1 将目录用作模块 913.3 动态导入 913.4 从Web 中获取模块 923.5 Conda 包管理 92参考文献 94第4 章 Numpy 954.1 Dtypes 954.2 多维数组 964.3 重塑和堆叠Numpy 数组 974.4 复制Numpy 数组 984.5 切片、逻辑数组操作 994.6 Numpy 数组和内存 1004.7 Numpy 内存数据结构 1034.8 数组元素操作 1054.9 通用函数 1064.10 Numpy 数据输入/ 输出 1074.11 线性代数 1074.12 广播 1084.13 掩码数组 1124.14 浮点数 1134.15 高级Numpy dtypes 116参考文献 117第5 章 Pandas 1185.1 使用Series 1185.2 使用数据帧 1215.3 重新索引 1255.4 删除项目 1275.5 高级索引 1275.6 广播和数据对齐 1285.7 分类和合并 1315.8 内存使用和数据类型dtypes 1335.9 常见的操作 1365.10 显示DataFrame 1375.11 分层索引 1395.12 Pipes 1425.13 数据文件和数据库 1425.14 自定义Pandas 1435.15 滚动和填充操作 144第6 章 可视化数据 1466.1 Matplotlib 1476.1.1 设置默认值 1496.1.2 图例 1496.1.3 子图 1496.1.4 Spines 1506.1.5 共享轴 1516.1.6 三维曲面 1526.1.7 使用patch 1536.1.8 3d 中的patches 1536.1.9 使用transformation 1556.1.10 使用文本注释 1586.1.11 使用箭头注释 1586.1.12 嵌入可缩放/ 不可缩放的子图 1616.1.13 动画 1636.1.14 直接使用路径 1646.1.15 使用滑块与绘图交互 1676.1.16 色彩图 1686.1.17 使用setp 和getp 1696.1.18 与Matplotlib 图形交互 1706.1.19 键盘事件 1706.1.20 鼠标事件 1726.2 Seaborn 1736.2.1 自动聚合 1766.2.2 多个绘图 1806.2.3 分布图 1816.3 Bokeh 1906.3.1 使用Bokeh 基元 1906.3.2 Bokeh 布局 1926.3.3 Bokeh 组件 1946.4 Altair 1996.4.1 Altair 细节化 2016.4.2 聚合和转换 2036.4.3 Altair 交互 2076.5 Holoviews 2106.5.1 数据集 2146.5.2 图像数据 2166.5.3 表格数据 2176.5.4 自定义交互 2196.5.5 流 2206.5.6 Pandas 与hvplot 集成 2216.5.7 网络图 2266.5.8 Holoviz Panel 2316.6 Plotly 234参考文献 242
內容試閱 :
前 言本书是基于我在加州大学圣地亚哥分校教授的ECE143 数据分析编程课程的讲义而撰写的,该课程是机器学习和数据科学研究生和本科生的必修课程。本书专门针对在数据分析领域中Python 的用语和方法进行讲解,适用于有一定编程基础和编程经验(如MATLAB 或Java) 的读者。具体而言,本书重点介绍如何使用特定的Python 语言来对混乱且复杂的原始数据进行整理,以及如何高效地完成数据预处理工作。在数据分析编程课程的教学过程中,我发现向学生进行相关知识点的背景讲解和讨论非常有助于初学者在代码工程中做出更好的选择。因此,本书除了讲解如何使用Python 进行数据分析以外,还讲解为什么这样进行数据分析。另外,本书还提供了一些小技巧,帮助读者创作出适合在实际生产和开发中使用的具有可读性和可维护性的代码。本书重点介绍了如何有效地使用Python 语言,然后介绍了一些关键的第三方模块。首先,本书对Numpy 数值数组模块进行了详细讲解,因为它是Python中所有数据科学和机器学习的基础。接下来,本书介绍了Pandas 模块,使用其功能来实现有效和流畅的数据处理。由于数据可视化对于数据科学和机器学习至关重要,因此本书还详细介绍了Matplotlib 模块以及基于Web 的Bokeh、Holoviews、Plotly 和Altair 等第三方模块。本书非常适合已经具备一些Python 基础,并想通过了解Python 的工作方式和原因来提高自身水平的读者。要想充分利用本书,请打开Python 解释器并开始键入本书提供的代码示例。