新書推薦:

《
《陈氏香谱》之中国香道(中华经典生活美学丛书)
》
售價:HK$
74.8

《
历史的局外人
》
售價:HK$
63.8

《
肖邦钢琴作品全集 第二辑 套装全4册 波兰国家版 原版引进 肖邦国际钢琴比赛推荐用书
》
售價:HK$
253.0

《
轻松读懂大唐风云三百年(全4册)
》
售價:HK$
262.9

《
成人口腔正畸学 第2版
》
售價:HK$
657.8

《
永恒——商周时代的艺术
》
售價:HK$
173.8

《
幸福教室的密码:一位优秀班主任的行走与思考
》
售價:HK$
66.0

《
牙齿磨损 第3版
》
售價:HK$
327.8
|
| 內容簡介: |
本书介绍了大数据处理中的数据采集、数据存储、数据预处理和数据分析与挖掘等内容,还介绍了如何使用Python语言进行大数据处理的方法。
來源:香港大書城megBookStore,http://www.megbook.com.hk *章大数据基础,简要介绍了大数据的概念,大数据处理的过程和涉及的不同方面,以及使用Python解决大数据问题的优势。
第二章Python环境的准备,介绍如何安装和准备Python编程环境,包括编译器,集成开发环境(IDE)的安装,以及第三方包的管理和安装方法。
第三章大数据获取,介绍获取数据的方法,如何使用爬虫技术从网站获取网页,并通过解析网页获取其中的数据。
第四章大数据存储,介绍数据存储和使用的方法,包括操作常见类型的文件的方法,以及操作关系型数据库和NoSQL数据库的方法。
第五章大数据的数学基础,介绍如何使用NumPy和pandas操作数组,矩阵,以及使用其中的随机数功能。
第六章数据预处理,介绍数据预处理的概念,并介绍数据清洗,数据集成,数据转换和数据规约的方法。
第七章数据挖掘与分析,介绍数据挖掘的常见模型,介绍利用scikit-learn进行有监督分类,回归预测,以及聚类分析的方法。
第八章大数据可视化,介绍数据可视化基础,包括可视化的过程和如何选择合适的图表,并介绍了利用matplotlib绘制常见的图表。本书介绍了大数据处理中的数据采集、数据存储、数据预处理和数据分析与挖掘等内容,还介绍了如何使用Python语言进行大数据处理的方法。
*章大数据基础,简要介绍了大数据的概念,大数据处理的过程和涉及的不同方面,以及使用Python解决大数据问题的优势。
第二章Python环境的准备,介绍如何安装和准备Python编程环境,包括编译器,集成开发环境(IDE)的安装,以及第三方包的管理和安装方法。
第三章大数据获取,介绍获取数据的方法,如何使用爬虫技术从网站获取网页,并通过解析网页获取其中的数据。
第四章大数据存储,介绍数据存储和使用的方法,包括操作常见类型的文件的方法,以及操作关系型数据库和NoSQL数据库的方法。
第五章大数据的数学基础,介绍如何使用NumPy和pandas操作数组,矩阵,以及使用其中的随机数功能。
第六章数据预处理,介绍数据预处理的概念,并介绍数据清洗,数据集成,数据转换和数据规约的方法。
第七章数据挖掘与分析,介绍数据挖掘的常见模型,介绍利用scikit-learn进行有监督分类,回归预测,以及聚类分析的方法。
第八章大数据可视化,介绍数据可视化基础,包括可视化的过程和如何选择合适的图表,并介绍了利用matplotlib绘制常见的图表。
本书的*、二章是基础,三至八章分别介绍了大数据处理的某一环节。这些章节的内容相互独立,读者在自学时可根据兴趣和时间调整学习顺序或内容。
本书适合本科院校大数据专业的学生使用。
|
|