您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
现代CPU性能分析与优化
出版社: 机械工业
作者: [美]丹尼斯·巴赫瓦洛夫(Denis Bakhvalov) 著
商品条码: 9787111719489
版次: 1
开本: 16开
页数: 205
出版年份: 2023
印次: 1
定价:
¥99
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书旨在指导大家优化运行在现代CPU上的应用程序的性能。具体来说,主要分为两部分内容:? 第一部分介绍性能分析,包括对CPU微架构、术语和指标的简要概述,还探讨了分析性能的不同方法和现代平台上可用的硬件监控功能。 ? 第二部分展示如何发现优化机会,以及可以做哪些转换来提高程序的性能。此外,还提供了一份可应用于用户应用程序的优化清单,包括循环优化、向量化、函数内联等,并讨论了有助于消除CPU微架构层面的问题(如缓存未命中、分支预测错误等)的代码转换。本书对于从事性能关键型应用程序开发和进行系统底层优化的技术人员来说是不可或缺的。对于任何想更好地了解应用程序性能并探索其诊断和改进方法的开发者来说,这本书也很有用。
作者简介
丹尼斯·巴赫瓦洛夫(Denis Bakhvalov)<br /> Intel高级开发人员,在Intel从事C++编译器项目相关工作,致力于为不同的芯片架构生成*佳代码。性能工程和编译器一直是他感兴趣的研究领域。他于2008年开始了他的软件开发职业生涯,参与过多个领域的工作,包括桌面应用程序开发、嵌入式系统开发、性能分析和编译器开发。2016年,他开设了easyperf.net博客,开始在博客中撰写性能分析、调优、C/C++编译器和CPU微架构相关的文章。<br />
目录
Preface?目 录译者序前言致谢作者简介第1章?导读11.1?为什么需要性能调优21.2?谁需要做性能调优51.3?什么是性能分析71.4?本书的主要内容81.5?本书不包含什么内容91.6?本章总结10第一部分?现代CPU性能分析第2章?性能测量122.1?现代系统中的噪声132.2?生产环境中的性能测量152.3?自动检测性能退化问题162.4?手动性能测试182.5?软件计时器和硬件计时器222.6?微基准测试242.7?本章总结25第3章?CPU微架构273.1?指令集架构273.2?流水线283.3?利用指令级并行303.3.1?乱序执行303.3.2?超标量引擎和超长指令字313.3.3?投机执行333.4?利用线程级并行343.5?存储器层次353.5.1?高速缓存层次353.5.2?主存393.6?虚拟内存393.7?单指令多数据多处理器403.8?现代CPU设计423.8.1?CPU前端423.8.2?CPU后端443.9?性能监控单元44第4章?性能分析中的术语和指标474.1?退休指令与执行指令474.2?CPU利用率484.3?CPI和IPC484.4?微操作494.5?流水线槽位514.6?核时钟周期和参考时钟周期514.7?缓存未命中524.8?分支预测错误53第5章?性能分析方法555.1?代码插桩565.2?跟踪585.3?负载表征595.3.1?统计性能事件595.3.2?手动收集性能计数605.3.3?事件多路复用和缩放625.4?采样635.4.1?用户模式采样和基于硬件 事件的采样645.4.2?寻找热点645.4.3?采集调用栈665.4.4?火焰图695.5?屋顶线性能模型695.6?静态性能分析735.7?编译器优化报告755.8?本章总结78第6章?性能分析相关的CPU特性806.1?自顶向下微架构分析技术816.1.1?Intel VTune Prof iler中的 TMA846.1.2?Linux perf中的TMA856.1.3?第一步:确定瓶颈866.1.4?第二步:定位具体的代码 位置886.1.5?第三步:解决问题906.1.6?小结916.2?后分支记录926.2.1?采集LBR栈946.2.2?获取调用图956.2.3?识别热点分支966.2.4?分析分支预测错误率976.2.5?机器码的准确计时986.2.6?评估分支输出的概率1006.2.7?其他应用场景1016.3?基于处理器事件的采样1016.3.1?精准事件1026.3.2?降低采样开销1036.3.3?分析内存访问1046.4?Intel处理器跟踪技术1056.4.1?工作流1056.4.2?时间报文1066.4.3?采集和解析跟踪文件1076.4.4?用法1086.4.5?磁盘空间和解析时间1096.5?本章总结110第二部分?基于源代码的CPU调优第7章?CPU前端优化1177.1 机器码布局1187.2 基本块1187.3 基本块布局1197.4 基本块对齐1217.5 函数拆分1237.6 函数分组1257.7 基于剖析文件的编译优化1267.8 对ITLB的优化1287.9 本章总结128第8章?CPU后端优化1308.1 内存绑定1308.1.1 缓存友好的数据结构1318.1.2 显式内存预取1368.1.3 针对DTLB优化1388.2 核心绑定1418.2.1 函数内联1418.2.2 循环优化1438.2.3 向量化1498.3 本章总结158第9章?优化错误投机1609.1 用查表替换分支1619.2 用断言替换分支1629.3 本章总结164第10章?其他调优16510.1 编译时计算16510.2 编译器内建函数16610.3 缓存预热16710.4 减少慢速浮点运算16810.5 系统调优169第11章?优化多线程应用程序17111.1 性能扩展和开销17111.2 并行效率指标17411.2.1 有效CPU利用率17411.2.2 线程数量17411.2.3 等待时间17511.2.4 自旋时间17511.3 使用Intel VTune Profiler进行 分析17511.3.1 寻找耗时锁17511.3.2 平台视图17811.4 使用Linux perf进行分析17811.5 使用Coz进行分析18111.6 使用eBPF和GAPP进行分析18111.7 检测一致性问题18211.7.1 缓存一致性协议18211.7.2 真共享18411.7.3 伪共享18411.8 本章总结186附录A?减少测量噪声188附录B?LLVM向量化程序193跋198术语200参考文献20
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网