《CPU设计与性能优化套装（套装共2册）》 - [美]丹尼斯·巴赫瓦洛夫汪文祥邢金璋 - 机械工业出版社 - 香港大書城

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

2024年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

『簡體書』CPU设计与性能优化套装（套装共2册）

書城自編碼： 3864296
分類：簡體書→大陸圖書→計算機/網絡→操作系統/系統開發
作者： [美]丹尼斯·巴赫瓦洛夫汪文祥邢金璋
國際書號(ISBN)： 9787X29566169
出版社：机械工业出版社
出版日期： 2023-05-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：HK$ 227.7

我要買件

** 我創建的書架 **
未登入.

新書推薦：

《艺术哲学》
售價：HK$ 96.8

《从助理到合伙人-青年律师业务进阶指南》
售價：HK$ 74.8

《明清白话文献与吴语语法》
售價：HK$ 217.8

《祖宗之法：北宋前期政治述略（修订二版）》
售價：HK$ 107.8

《德州扑克自学一本通》
售價：HK$ 55.0

《数学分析（第一卷）（第7版）（精装典藏版）》
售價：HK$ 97.9

《什么是思想史历史学的实践丛书》
售價：HK$ 61.6

《法律是什么：20世纪英美法理学批判阅读（全新增订版）》
售價：HK$ 63.8

建議一齊購買：

HK$ 148.8
《Windows内核编程》

HK$ 120.2
《CentOS 7.5系统管理与运维实战》

HK$ 133.7
《操作系统导论》

HK$ 127.6
《系统动力学前沿与应用》

HK$ 110.6
《Kali Linux渗透测试技术详解》

HK$ 224.9
《深入解析Windows操作系统第7版卷1》

內容簡介：

《CPU设计实战》
本书面向初学者，以实战的方式带领读者了解CPU设计的流程，并从零开始逐步开发出自己的CPU。本书将计算机组成与体系结构的理论知识和工业实践充分结合，使读者在实际的CPU设计与开发过程中更加深入地理解计算机系统的工作原理，掌握CPU设计理念、方法和技术。
本书共分为三个部分，第一部分介绍CPU的研发过程以及FPGA、数字逻辑电路等相关知识；第二部分先介绍简单流水线CPU设计，在此基础上添加指令、例外、中断、总线、高速缓存等功能，完成一个具有基本功能的CPU；第三部分介绍如何增加各种高级功能，最终形成一个具有丰富功能的CPU。
本书深入浅出、层次清晰，并融入了典型的CPU开发相关的技术问题，既可以作为高等院校计算机及相关专业本科生和研究生的CPU开发类课程的教材，也可以作为从事CPU相关研发工作的专业人员的参考书。
《现代CPU性能分析与优化》
本书旨在指导大家优化运行在现代CPU上的应用程序的性能。具体来说，主要分为两部分内容：
? 第一部分介绍性能分析，包括对CPU微架构、术语和指标的简要概述，还探讨了分析性能的不同方法和现代平台上可用的硬件监控功能。
? 第二部分展示如何发现优化机会，以及可以做哪些转换来提高程序的性能。此外，还提供了一份可应用于用户应用程序的优化清单，包括循环优化、向量化、函数内联等，并讨论了有助于消除CPU微架构层面的问题（如缓存未命中、分支预测错误等）的代码转换。
本书对于从事性能关键型应用程序开发和进行系统底层优化的技术人员来说是不可或缺的。对于任何想更好地了解应用程序性能并探索其诊断和改进方法的开发者来说，这本书也很有用。

關於作者：

汪文祥　工学博士，龙芯中科技术股份有限公司首席工程师，中国科学院大学岗位教授。主要研究方向为处理器体系结构设计、处理器验证及计算机系统性能分析优化等，参与了多项国家“核高基”、863 和 973 项目，在国内外各种期刊会议发表文章十余篇，申请专利数十项，授权专利十余项。2012年起任龙芯中科芯片研发部IP组组长，负责龙芯系列CPU IP核的开发研制及维护，参与制订龙芯指令系统架构规范。

邢金璋硕士毕业于中国科学院计算技术研究所，2015年加入龙芯中科技术股份有限公司，从事处理器核结构设计工作，是龙芯小、中系列处理器核演进版本的主要结构设计者之一。近年来，积极参与“龙芯杯”全国大学生计算机系统能力培养大赛的技术支持、培训等工作。
丹尼斯?巴赫瓦洛夫(Denis Bakhvalov)
Intel高级开发人员，在Intel从事C++编译器项目相关工作，致力于为不同的芯片架构生成最佳代码。性能工程和编译器一直是他感兴趣的研究领域。他于2008年开始了他的软件开发职业生涯，参与过多个领域的工作，包括桌面应用程序开发、嵌入式系统开发、性能分析和编译器开发。2016年，他开设了easyperf.net博客，开始在博客中撰写性能分析、调优、C/C++编译器和CPU微架构相关的文章。

《CPU设计实战》
丛书序言
序
前言
第1章CPU芯片研发过程概述　1
1.1处理器和处理器核　1
1.2芯片产品的研制过程　2
1.3芯片设计的工作阶段　3
第2章硬件实验平台及FPGA设计流程　5
2.1硬件实验平台　5
2.1.1龙芯CPU设计与体系结构教学实验系统　5
2.1.2龙芯计算机系统能力培养远程实验平台　7
2.2FPGA的设计流程　8
2.2.1FPGA的一般设计流程　9
2.2.2基于Vivado的FPGA设计流程　10
2.2.3Vivado使用小贴士　33
2.3任务与实践　35
第3章数字逻辑电路设计基础　36
3.1数字逻辑电路设计与Verilog代码开发　36
3.1.1面向硬件电路的设计思维方式　37
3.1.2行为描述的Verilog编程风格　38
3.1.3自顶向下的设计划分过程　38
3.1.4常用数字逻辑电路的Verilog描述　39
3.2数字逻辑电路功能仿真的常见错误及其调试方法　55
3.2.1功能仿真波形分析　56
3.2.2波形异常类错误的调试　60
3.3进一步使用Vivado　66
3.3.1定制同步RAM IP核　66
3.3.2定制异步RAM IP核　68
3.3.3查看时序结果和资源利用率　69
3.4任务与实践　69
3.4.1实践任务一：寄存器堆仿真　70
3.4.2实践任务二：同步RAM和异步RAM仿真、综合与实现　71
3.4.3实践任务三：数字逻辑电路的设计与调试　72
第4章简单流水线CPU设计　74
4.1设计一个简单的单周期CPU　75
4.1.1设计单周期CPU的总体思路　75
4.1.2单周期CPU的数据通路设计　76
4.1.3单周期CPU的控制信号生成　88
4.1.4复位的处理　91
4.2不考虑相关冲突的流水线CPU设计　92
4.2.1添加流水级间缓存　92
4.2.2同步RAM的引入　93
4.2.3调整更新PC的数据通路　96
4.2.4不考虑相关冲突情况下流水线控制信号的设计　96
4.3CPU设计开发环境（CPU_CDE）　97
4.3.1快速上手CPU设计的开发环境　97
4.3.2CPU设计开发环境的组织与结构　99
4.3.3CPU设计开发环境使用进阶　113
4.4CPU设计的功能仿真调试技术　117
4.4.1为什么要用基于Trace比对的调试辅助手段　117
4.4.2基于Trace比对调试手段的盲区及其对策　119
4.4.3学会阅读汇编程序和反汇编代码　119
4.4.4CPU调试中要抓取的信号以及如何看这些信号　124
4.5指令相关与流水线冲突　125
4.5.1处理寄存器写后读数据相关引发的流水线冲突　126
4.5.2转移计算未完成　127
4.6流水线数据的前递设计　127
4.6.1前递的数据通路设计　128
4.6.2前递的流水线控制信号调整　130
4.6.3前递引发的主频下降　131
4.7任务与实践　131
4.7.1实践任务一：简单CPU参考设计调试　132
4.7.2实践任务二：用阻塞技术解决相关引发的冲突　132
4.7.3实践任务三：用前递技术解决相关引发的冲突　133
第5章在流水线中添加运算类指令　134
5.1算术逻辑运算类指令的添加　134
5.1.1ADD、ADDI和SUB指令的添加　134
5.1.2SLTI和SLTIU指令的添加　135
5.1.3ANDI、ORI和XORI指令的添加　135
5.1.4SLLV、SRLV和SRAV指令的添加　135
5.2乘除法运算类指令的添加　136
5.2.1调用linx IP实现乘除法运算部件　136
5.2.2电路级实现乘法器　140
5.2.3电路级实现除法器　147
5.3乘除法配套数据搬运指令的添加　154
5.3.1乘法运算实现为单周期的情况　155
5.3.2乘法运算实现为多周期流水的情况　155
5.4任务与实践　156
第6章在流水线中添加转移指令和访存指令　157
6.1转移指令的添加　157
6.1.1BGEZ、BGTZ、BLEZ和BLTZ指令　158
6.1.2J指令　158
6.1.3BLTZAL和BGEZAL指令　158
6.1.4JALR指令　158
6.2访存指令的添加　158
6.2.1LB、LBU、LH和LHU指令的添加　158
6.2.2SB和SH指令的添加　159
6.2.3非对齐访存指令的说明　160
6.2.4LWL和LWR指令的添加　162
6.2.5SWL和SWR指令的添加　164
6.3任务与实践　164
第7章例外和中断的支持　166
7.1例外和中断的基本概念　166
7.1.1例外是一套软硬件协同处理的机制　166
7.1.2精确例外　167
7.2MIPS指令系统中与例外相关的功能定义　168
7.2.1CP0寄存器　168
7.2.2例外产生条件的判定　168
7.2.3例外入口　170
7.2.4MFC0和MTC0指令　170
7.2.5ERET指令　170
7.3流水线CPU实现例外和中断的设计要点　170
7.3.1例外检测逻辑　170
7.3.2精确例外的实现　172
7.3.3CP0寄存器　173
7.3.4CP0冲突　179
7.4任务与实践　180
7.4.1实践任务一：添加syscall例外支持　181
7.4.2实践任务二：添加其他例外支持　181
第8章A总线接口设计　184
8.1类SRAM总线　184
8.1.1主方和从方　185
8.1.2类SRAM总线接口信号的定义　185
8.1.3类SRAM总线的读写时序　186
8.1.4类SRAM总线的约束　189
8.2类SRAM总线的设计　189
8.2.1取指设计的考虑　190
8.2.2访存设计的考虑　195
8.3A总线协议　195
8.3.1A总线信号一览　195
8.3.2理解A总线协议　197
8.3.3类SRAM总线接口信号与A总线接口信号的关系　202
8.4类SRAM-A的转接桥设计　203
8.4.1转接桥的顶层接口　203
8.4.2转接桥的设计要求　204
8.4.3转接桥的设计建议　204
8.5任务与实践　205
8.5.1实践任务一：添加类SRAM总线支持　205
8.5.2实践任务二：添加A总线支持　208
8.5.3实践任务三：完成A随机延迟验证　210
第9章TLB MMU设计　211
9.1TLB模块的基础知识　212
9.1.1TLB的虚实地址转换　212
9.1.2TLB的软件访问　214
9.1.3TLB的软硬件交互机制　215
9.2TLB模块设计的分析　217
9.3TLB相关的CP0寄存器与指令的实现　219
9.4利用TLB进行虚实地址转换及TLB例外　221
9.5任务与实践　222
9.5.1实践任务一：TLB模块设计　222
9.5.2实践任务二：添加TLB相关指令和CP0寄存器　224
9.5.3实践任务三：添加TLB相关例外支持　225
第10章高速缓存设计　226
10.1Cache模块的设计　227
10.1.1Cache的设计规格　227
10.1.2Cache模块的数据通路设计　228
10.1.3Cache模块内部的控制逻辑设计　237
10.1.4Cache的硬件初始化问题　241
10.2将Cache模块集成至CPU中　242
10.2.1Cache命中情况下的CPU流水线适配　242
10.2.2Cache缺失情况下的CPU流水线适配　243
10.2.3Uncache访问的处理　243
10.3CACHE指令　245
10.3.1CACHE指令的定义　245
10.3.2CACHE指令的实现　247
10.4性能测试程序　247
10.4.1Dhrystone　247
10.4.2Coremark　250
10.5Cache的性能　251
10.6任务与实践　252
10.6.1实践任务一：Cache模块设计　252
10.6.2实践任务二：在CPU中集成ICache　254
10.6.3实践任务三：在CPU中集成DCache　255
10.6.4实践任务四：在CPU中添加CACHE指令　256
第11章进阶设计　258
11.1运行Linux内核　258
11.1.1复杂SoC搭建　259
11.1.2CPU的进一步完善　259
11.1.3调试建议　260
11.2提升主频的常用方法　261
11.2.1平衡各级流水线的延迟　261
11.2.2优化大概率事件的处理逻辑　261
11.2.3用面积和功耗换时序　262
11.2.4进一步切分流水线　262
11.3静态双发射流水线的实现　262
11.4动态调度机制的实现　263
11.4.1一个双发射动态调度流水线的设计实例　263
11.4.2动态调度中常见电路结构的RTL实现　266
11.5硬件转移预测技术　266
11.5.1硬件转移预测的流水线设计框架　267
11.5.2一个轻量级转移预测器的设计规格　268
11.6访存优化技术　269
11.6.1store buffer　269
11.6.2Non-blocking Cache　270
11.6.3访存乱序执行　271
11.6.4多级Cache　271
11.6.5Cache预取　272
11.7多核处理器的实现　272
11.7.1多核互联结构　273
11.7.2多核编号　273
11.7.3核间中断　273
11.7.4多核情况下的存储一致性　274
11.7.5LL-SC指令对的访存原子性　282
附录A龙芯CPU设计与体系结构教学实验系统　285
附录BVivado的安装　288
附录C简单MIPS指令系统规范　301
附录DVivado使用进阶　345
《现代CPU性能分析与优化》
译者序
前言
致谢
作者简介
第1章导读1
1.1 为什么需要性能调优2
1.2 谁需要做性能调优5
1.3 什么是性能分析7
1.4 本书的主要内容8
1.5 本书不包含什么内容9
1.6 本章总结10
第一部分现代CPU性能分析
第2章性能测量12
2.1 现代系统中的噪声13
2.2 生产环境中的性能测量15
2.3 自动检测性能退化问题16
2.4 手动性能测试18
2.5 软件计时器和硬件计时器22
2.6 微基准测试24
2.7 本章总结25
第3章 CPU微架构27
3.1 指令集架构27
3.2 流水线28
3.3 利用指令级并行30
3.3.1 乱序执行30
3.3.2 超标量引擎和超长指令字31
3.3.3 投机执行33
3.4 利用线程级并行34
3.5 存储器层次35
3.5.1 高速缓存层次35
3.5.2 主存39
3.6 虚拟内存39
3.7 单指令多数据多处理器40
3.8 现代CPU设计42
3.8.1 CPU前端42
3.8.2 CPU后端44
3.9 性能监控单元44
第4章性能分析中的术语和指标47
4.1 退休指令与执行指令47
4.2 CPU利用率48
4.3 CPI和IPC48
4.4 微操作49
4.5 流水线槽位51
4.6 核时钟周期和参考时钟周期51
4.7 缓存未命中52
4.8 分支预测错误53
第5章性能分析方法55
5.1 代码插桩56
5.2 跟踪58
5.3

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	香港用户　 \|　台灣用户　\|　海外用户

	megBook.com.hk
Copyright © 2013 - 2025 （香港）大書城有限公司　 All Rights Reserved.