新書推薦:  
			 
			《 
			大国重器—中国盾构机创新发展之路
			》  
			 售價:HK$ 
			118.8
			  
			 
	
			 
			《 
			长路行(带你看民国顶级书香世家的真实生活日常)
			》  
			 售價:HK$ 
			74.8
			  
			 
	
			 
			《 
			人体脂肪的秘密
			》  
			 售價:HK$ 
			75.9
			  
			 
	
			 
			《 
			社会史:理论与实践(增订版)(德国著名社会史学家于尔根·科卡重要文集。全面展现德国社会史学派的兴起与
			》  
			 售價:HK$ 
			107.8
			  
			 
	
			 
			《 
			津巴多时间心理学 首次系统论述时间观疗法 菲利普·津巴多 著 自我觉察 活在当下 津巴多 心理学 当
			》  
			 售價:HK$ 
			75.9
			  
			 
	
			 
			《 
			亲爱的族人:菲利普王之战的新叙事(横扫北美史学界各项大奖 以印第安女王视角重写北美大陆的反殖民之战)
			》  
			 售價:HK$ 
			140.8
			  
			 
	
			 
			《 
			中国古代货币思想史
			》  
			 售價:HK$ 
			93.5
			  
			 
	
			 
			《 
			什么是新疆
			》  
			 售價:HK$ 
			195.8
			  
			 
	
 
       
     
      
      
         
          編輯推薦:  
         
         
           
            随着阿尔法狗在围棋领域高奏凯歌,人工智能领域已成为当前引人注目的风口,而机器学习又是这风口中的风头正劲的热点。本书从实战角度剖析了机器学习的知识原理,读者无需担心遇到难懂的数学公式和推导,就能够将机器学习的知识应用在自己熟悉的领域。《实用机器学习》还包含了三个机器学习真是应用的综合案例,本书所有代码资源都可以通过网络下载,读者还可以登录GITHUB与全球的机器学习爱好者共同交流本书的学习体验。
           
         
      
      
      
      
      
         
          內容簡介:  
         
         
           
            本书介绍了实用机器学习的工作流程,主要从实用角度进行了描述,没有数学公式和推导。本书涵盖了数据收集与处理、模型构建、评价和优化、特征的识别、提取和选择技术、高级特征工程、数据可视化技术以及模型的部署和安装,结合3个真实案例全面、详细地介绍了整个机器学习流程。后,还介绍了机器学习流程的扩展和大数据应用。
來源:香港大書城megBookStore,http://www.megbook.com.hk  本书可以作为程序员、数据分析师、统计学家、数据科学家解决实际问题的参考书,也可以作为机器学习爱好者学习和应用的参考书,还可以作为非专业学生的机器学习入门参考书,以及专业学生的实践参考书。
           
         
      
      
      
      
         
          關於作者:  
         
         
           
            Henrik Brink(亨里克·布林克)是一名数据科学家,对应用机器学习进行工业和学术应用开发有着丰富的经验。
 Joseph Richards(约瑟夫W理查兹)也是一位数据科学家,具有应用统计和预测分析方面的专业知识。Henrik和Joseph是Wise.io的联合创立者,Wise.io是一家提供工业机器学习解决方案的开发商。
 Mark Fetherolf(马克·弗特罗夫)是数据管理和预测分析公司Numinary Data Science的创始人和总裁。他曾在社会科学研究、化学工程、信息系统性能、容量规划、有线电视和在线广告应用等方面担任统计师和分析数据库开发人员。
           
         
      
      
      
      
      
         
          目錄  : 
           
         
         
           
            目录
 推荐序
 作者序
 致谢
 译者序
 关于本书
 作者简介
 关于封面插图
 第1部分机器学习工作流程
 第1章什么是机器学习
 1.1理解机器学习
 1.2使用数据进行决策
 1.2.1传统方法
 1.2.2机器学习方法
 1.2.3机器学习的五大优势
 1.2.4面临的挑战
 1.3跟踪机器学习流程:从数据到部署
 1.3.1数据集合和预处理
 1.3.2数据构建模型
 1.3.3模型性能评估
 1.3.4模型性能优化
 1.4提高模型性能的高级技巧
 1.4.1数据预处理和特征工程
 1.4.2用在线算法持续改进模型
 1.4.3具有数据量和速度的规模化模型
 1.5总结
 1.6本章术语
 第2章实用数据处理
 2.1起步:数据收集
 2.1.1应包含哪些特征
 2.1.2如何获得目标变量的真实值
 2.1.3需要多少训练数据
 2.1.4训练集是否有足够的代表性
 2.2数据预处理
 2.2.1分类特征
 2.2.2缺失数据处理
 2.2.3简单特征工程
 2.2.4数据规范化
 2.3数据可视化
 2.3.1马赛克图
 2.3.2盒图
 2.3.3密度图
 2.3.4散点图
 2.4总结
 2.5本章术语
 第3章建模和预测
 3.1基础机器学习建模
 3.1.1寻找输入和目标间的关系
 3.1.2寻求好模型的目的
 3.1.3建模方法类型
 3.1.4有监督和无监督学习
 3.2分类:把数据预测到桶中
 3.2.1构建分类器并预测
 3.2.2非线性数据与复杂分类
 3.2.3多类别分类
 3.3回归:预测数值型数据
 3.3.1构建回归器并预测
 3.3.2对复杂的非线性数据进行回归
 3.4总结
 3.5本章术语
 第4章模型评估与优化
 4.1模型泛化:评估新数据的预测准确性
 4.1.1问题:过度拟合与乐观模型
 4.1.2解决方案:交叉验证
 4.1.3交叉验证的注意事项
 4.2分类模型评估
 4.2.1分类精度和混淆矩阵
 4.2.2准确度权衡与ROC曲线
 4.2.3多类别分类
 4.3回归模型评估
 4.3.1使用简单回归性能指标
 4.3.2检验残差
 4.4参数调整优化模型
 4.4.1机器学习算法和它们的调整参数
 4.4.2网格搜索
 4.5总结
 4.6本章术语
 第5章基础特征工程
 5.1动机:为什么特征工程很有用
 5.1.1什么是特征工程
 5.1.2使用特征工程的5个原因
 5.1.3特征工程与领域专业知识
 5.2基本特征工程过程
 5.2.1实例:事件推荐
 5.2.2处理日期和时间特征
 5.2.3处理简单文本特征
 5.3特征选择
 5.3.1前向选择和反向消除
 5.3.2数据探索的特征选择
 5.3.3实用特征选择实例
 5.4总结
 5.5本章术语
 第2部分实 际 应 用
 第6章案例:NYC出租车数据
 6.1数据:NYC出租车旅程和收费信息
 6.1.1数据可视化
 6.1.2定义问题并准备数据
 6.2建模
 6.2.1基本线性模型
 6.2.2非线性分类器
 6.2.3包含分类特征
 6.2.4包含日期-时间特征
 6.2.5模型的启示
 6.3总结
 6.4本章术语
 第7章高级特征工程
 7.1高级文本特征
 7.1.1词袋模型
 7.1.2主题建模
 7.1.3内容拓展
 7.2图像特征
 7.2.1简单图像特征
 7.2.2提取物体和形状
 7.3时间序列特征
 7.3.1时间序列数据的类型
 7.3.2时间序列数据的预测
 7.3.3经典时间序列特征
 7.3.4事件流的特征工程
 7.4总结
 7.5本章术语
 第8章NLP高级案例:电影评论情感预测
 8.1研究数据和应用场景
 8.1.1数据集初探
 8.1.2检查数据
 8.1.3应用场景有哪些
 8.2提取基本NLP特征并构建初始模型
 8.2.1词袋特征
 8.2.2用朴素贝叶斯算法构建模型
 8.2.3tf-idf算法规范词袋特征
 8.2.4优化模型参数
 8.3高级算法和模型部署的考虑
 8.3.1word2vec特征
 8.3.2随机森林模型
 8.4总结
 8.5本章术语
 第9章扩展机器学习流程
 9.1扩展前需考虑的问题
 9.1.1识别关键点
 9.1.2选取训练数据子样本代替扩展性
 9.1.3可扩展的数据管理系统
 9.2机器学习建模流程扩展
 9.3预测扩展
 9.3.1预测容量扩展
 9.3.2预测速度扩展
 9.4总结
 9.5本章术语
 第10章案例:数字显示广告
 10.1显示广告
 10.2数字广告数据
 10.3特征工程和建模策略
 10.4数据大小和形状
 10.5奇异值分解
 10.6资源估计和优化
 10.7建模
 10.8K近邻算法
 10.9随机森林算法
 10.10其他实用考虑
 10.11总结
 10.12本章术语
 10.13摘要和结论
 附录常用机器学习算法
 名词术语中英文对照
           
         
      
      
      
      
         
          內容試閱  : 
           
         
         
           
            关于本书《实用机器学习》的读者对象是针对想要把机器学习应用于实际问题的人。它详细阐述了机器学习的主要组成部分:工作流程、算法和工具。关注点是著名算法的实际应用,而不是创建一个算法。构建和使用机器学习模型的每个步骤都有详细描述,并有从简单到中等复杂的实例与之对应。
 主要内容第1部分,“机器学习工作流程”介绍基本的机器学习工作流程,并分章节对每个步骤加以介绍。
 第1章,“什么是机器学习”介绍机器学习的应用领域和用途。
 第2章,“实用数据处理”,详细介绍机器学习流程中的数据处理和准备工作。
 第3章,“建模和预测”,介绍构建简单的机器学习模型,并利用应用广泛的算法和库进行预测。
 第4章,“模型评估和优化”,深入研究机器学习模型,并对其进行评估和性能优化。
 第5章,“基础特征工程”,介绍利用领域知识对原始数据进行提高的常用方法。
 第2部分,“实际应用”,介绍模型规模化和从文本、图片和时间序列数据中提取特征的技术,来提高绝大多数现代机器学习的性能。本部分包括3个有完整实例的章节。
 第6章,“实例:NYC出租车数据”,这是第一个完整实例章节,会预测乘客的倾向性行为。
 第7章,“高级特征工程”,包含高级特征工程过程,介绍从自然语言的文本、图片和时序序列数据中提取有价值的数据。
 第8章,“NLP高级案例:电影评论情感预测”,运用高级特征工程知识预测在线电影评论的情感。
 第9章,“扩展机器学习流程”,介绍扩大机器学习系统的数据规模、预测吞吐量和降低预测间隔的技术。
 第10章,“案例:数字显示广告”,构建大型数据的模型,预测数字广告点击行为。
 如何使用本书如果你是机器学习新手,第1~5章将引导你学习研究和准备数据、特征工程、建模和模型评估过程。Python实例采用流行的数据处理、pandas和Scikit-Learn机器学习库。第6~10章,包括3个实际机器学习案例、高级特征工程和优化的话题。由于学习库封装了大部分的复杂性,因此代码示例可以很容易地应用到你自己的机器学习系统中。
 目标读者本书可以使程序员、数据分析师、统计学家、数据科学家和其他专业人士将机器学习应用于实际问题,或者简单地理解它。他们将获得实用数据建模、优化和开发机器学习系统的经验,而没必要了解特定算法的理论推导。机器学习的数学基础是针对感兴趣的人的,某些算法在较高的层次上进行解释,本书提供给那些想深入学习的人,我们的焦点是获得实际结果以解决手头的问题。
 代码约定,下载和软件需求本书包含许多示例源代码,或者以编号的清单出现,或者嵌入在正文中,但无论哪种情况,都以固定宽度的这种字体显示,以区别于正常的文本。
 源代码使用Python,pandas和Scikit-Learn编写。与章节相应的iPython笔记文件可在GitHub上下载,地址为https:githubcombrinkarreal-world-machine-learning,也可以通过关注机械工业出版社计算机分社官方微信订阅号“IT有得聊”,输入5位数号“56922”后获得资源下载链接,还可以登录golden-book.com搜索本书并进行下载。
 笔记文件(扩展名为ipynb)与章节相对应。样本数据包含在data文件夹中,只要必需的库随iPython一起安装,那么所有的笔记文件都能执行。图形由matplotlib和Seaborn的pyplot模块生成。
 在有些情况下,由iPython产生的图形被提取出来作为本书的插图(为了适应打印质量和电子书显示,有些已经做了修改)。