新書推薦:

《
万亿低空:应用实战篇 低空经济
》
售價:HK$
107.8

《
最美中国版画100幅 艺术百图系列 木版雕刻 经典古版画 中式美学 周亮编著
》
售價:HK$
85.8

《
乱世离歌:五代史略
》
售價:HK$
107.8

《
近代中国史学述论(修订版)
》
售價:HK$
118.8

《
茶食品工艺学(高等学校专业教材)
》
售價:HK$
41.8

《
南洋有遗音:从新加坡到苏门答腊的寻踪之旅
》
售價:HK$
74.8

《
盗墓:历史发现与文化考察
》
售價:HK$
327.8

《
具身智能:智能出行·智慧生活·人机共生
》
售價:HK$
97.9
|
| 內容簡介: |
本书介绍了大数据处理中的数据采集、数据存储、数据预处理和数据分析与挖掘等内容,还介绍了如何使用Python语言进行大数据处理的方法。
*章大数据基础,简要介绍了大数据的概念,大数据处理的过程和涉及的不同方面,以及使用Python解决大数据问题的优势。
第二章Python环境的准备,介绍如何安装和准备Python编程环境,包括编译器,集成开发环境(IDE)的安装,以及第三方包的管理和安装方法。
第三章大数据获取,介绍获取数据的方法,如何使用爬虫技术从网站获取网页,并通过解析网页获取其中的数据。
第四章大数据存储,介绍数据存储和使用的方法,包括操作常见类型的文件的方法,以及操作关系型数据库和NoSQL数据库的方法。
第五章大数据的数学基础,介绍如何使用NumPy和pandas操作数组,矩阵,以及使用其中的随机数功能。
第六章数据预处理,介绍数据预处理的概念,并介绍数据清洗,数据集成,数据转换和数据规约的方法。
第七章数据挖掘与分析,介绍数据挖掘的常见模型,介绍利用scikit-learn进行有监督分类,回归预测,以及聚类分析的方法。
第八章大数据可视化,介绍数据可视化基础,包括可视化的过程和如何选择合适的图表,并介绍了利用matplotlib绘制常见的图表。本书介绍了大数据处理中的数据采集、数据存储、数据预处理和数据分析与挖掘等内容,还介绍了如何使用Python语言进行大数据处理的方法。
*章大数据基础,简要介绍了大数据的概念,大数据处理的过程和涉及的不同方面,以及使用Python解决大数据问题的优势。
第二章Python环境的准备,介绍如何安装和准备Python编程环境,包括编译器,集成开发环境(IDE)的安装,以及第三方包的管理和安装方法。
第三章大数据获取,介绍获取数据的方法,如何使用爬虫技术从网站获取网页,并通过解析网页获取其中的数据。
第四章大数据存储,介绍数据存储和使用的方法,包括操作常见类型的文件的方法,以及操作关系型数据库和NoSQL数据库的方法。
第五章大数据的数学基础,介绍如何使用NumPy和pandas操作数组,矩阵,以及使用其中的随机数功能。
第六章数据预处理,介绍数据预处理的概念,并介绍数据清洗,数据集成,数据转换和数据规约的方法。
第七章数据挖掘与分析,介绍数据挖掘的常见模型,介绍利用scikit-learn进行有监督分类,回归预测,以及聚类分析的方法。
第八章大数据可视化,介绍数据可视化基础,包括可视化的过程和如何选择合适的图表,并介绍了利用matplotlib绘制常见的图表。
本书的*、二章是基础,三至八章分别介绍了大数据处理的某一环节。这些章节的内容相互独立,读者在自学时可根据兴趣和时间调整学习顺序或内容。
本书适合本科院校大数据专业的学生使用。
|
|