新書推薦:

《
古今英国园林
》
售價:HK$
107.8

《
奇迹时刻:获得全新的认知与领悟,如何爱自己,打破原生家庭限制,找寻真正的自由与自爱
》
售價:HK$
65.8

《
学会卓越
》
售價:HK$
109.9

《
365日自我肯定之书:你是你自己人生的主角!增强自我肯定感
》
售價:HK$
76.8

《
小儿推拿轻松学,脾肺同养百病消
》
售價:HK$
39.6

《
海洋之思:俄罗斯的海洋观(1997~2021)
》
售價:HK$
140.8

《
国语(全二册)(中国古代史学丛书)
》
售價:HK$
140.8

《
新安医学古籍整理发掘研究
》
售價:HK$
107.8
|
| 內容簡介: |
本书介绍了大数据处理中的数据采集、数据存储、数据预处理和数据分析与挖掘等内容,还介绍了如何使用Python语言进行大数据处理的方法。
*章大数据基础,简要介绍了大数据的概念,大数据处理的过程和涉及的不同方面,以及使用Python解决大数据问题的优势。
第二章Python环境的准备,介绍如何安装和准备Python编程环境,包括编译器,集成开发环境(IDE)的安装,以及第三方包的管理和安装方法。
第三章大数据获取,介绍获取数据的方法,如何使用爬虫技术从网站获取网页,并通过解析网页获取其中的数据。
第四章大数据存储,介绍数据存储和使用的方法,包括操作常见类型的文件的方法,以及操作关系型数据库和NoSQL数据库的方法。
第五章大数据的数学基础,介绍如何使用NumPy和pandas操作数组,矩阵,以及使用其中的随机数功能。
第六章数据预处理,介绍数据预处理的概念,并介绍数据清洗,数据集成,数据转换和数据规约的方法。
第七章数据挖掘与分析,介绍数据挖掘的常见模型,介绍利用scikit-learn进行有监督分类,回归预测,以及聚类分析的方法。
第八章大数据可视化,介绍数据可视化基础,包括可视化的过程和如何选择合适的图表,并介绍了利用matplotlib绘制常见的图表。本书介绍了大数据处理中的数据采集、数据存储、数据预处理和数据分析与挖掘等内容,还介绍了如何使用Python语言进行大数据处理的方法。
*章大数据基础,简要介绍了大数据的概念,大数据处理的过程和涉及的不同方面,以及使用Python解决大数据问题的优势。
第二章Python环境的准备,介绍如何安装和准备Python编程环境,包括编译器,集成开发环境(IDE)的安装,以及第三方包的管理和安装方法。
第三章大数据获取,介绍获取数据的方法,如何使用爬虫技术从网站获取网页,并通过解析网页获取其中的数据。
第四章大数据存储,介绍数据存储和使用的方法,包括操作常见类型的文件的方法,以及操作关系型数据库和NoSQL数据库的方法。
第五章大数据的数学基础,介绍如何使用NumPy和pandas操作数组,矩阵,以及使用其中的随机数功能。
第六章数据预处理,介绍数据预处理的概念,并介绍数据清洗,数据集成,数据转换和数据规约的方法。
第七章数据挖掘与分析,介绍数据挖掘的常见模型,介绍利用scikit-learn进行有监督分类,回归预测,以及聚类分析的方法。
第八章大数据可视化,介绍数据可视化基础,包括可视化的过程和如何选择合适的图表,并介绍了利用matplotlib绘制常见的图表。
本书的*、二章是基础,三至八章分别介绍了大数据处理的某一环节。这些章节的内容相互独立,读者在自学时可根据兴趣和时间调整学习顺序或内容。
本书适合本科院校大数据专业的学生使用。
|
|