您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
神经网络加速器的计算架构及存储优化技术研究
字数: 172000
装帧: 精装
出版社: 清华大学出版社
作者: 涂锋斌
出版日期: 2022-04-01
商品条码: 9787302601517
版次: 1
开本: 16开
页数: 160
出版年份: 2022
定价:
¥89
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
本书针对不同应用类型,提出了两套计算架构,分别是面向通用神经网络近似的神经网络计算架构RNA和面向专用人工智能领域的神经网络计算架构DNA。此外,为解决神经网络计算中的访存瓶颈问题,提出了基于数据保持时间的神经网络存储优化框架RANA。
内容简介
随着通用处理器性能增长的减缓及基于神经网络的智能应用的不断涌现,神经网络加速器正逐步成为新型计算系统中不可或缺的部分。过去几年,学术界乃至工业界出现了大量的神经网络加速器芯片。针对过去的神经网络加速器设计在计算模式、计算架构和存储优化方面存在的不足,本书的研究总结出两套神经网络加速器的优化设计方法:基于"计算模式-动态重构"的计算架构设计方法和基于"器件特性-容错能力"的存储优化方法。主要介绍三项基于上述优化设计方法的研究工作,即面向通用神经网络近似的神经网络计算架构RNA、面向专用人工智能领域的神经网络计算架构DNA和基于数据保持时间的神经网络存储优化框架RANA。
本书可供从事神经网络加速器、专用领域计算、可重构计算研究的高校师生和科研院所研宄人员及相关技术人员阅读参考。
作者简介
涂锋斌,2019年于清华大学微纳电子系获得博士学位,现于加州大学圣塔芭芭拉分校电子与计算机工程系担任博士后研究员。涂锋斌长期从事人工智能芯片方向的研究,连续做出世界很好的工作。涂锋斌在2016年设计出一款基于可重构计算架构的人工智能芯片Thinker。该款芯片作为清华唯二的作品参加全国双创周,获得李克强总理的高度赞许,先后被杨澜访谈录、雷锋网AI科技评论和MIT科技评论报道。Thinker芯片在2017获得ISLPED国际低功耗电子设计竞赛冠军(中国大陆首次)。截止目前,涂锋斌已发表18篇论文,其中包括计算机体系结构领域很好会议ISCA?
目录
第1章绪论1
1.1研究背景1
1.2研究现状3
1.2.1神经网络算法的发展历程3
1.2.2神经网络加速器的研究现状7
1.3研究动机10
1.4研究思路与研究内容11
1.4.1研究思路11
1.4.2研究内容12
第2章面向通用神经网络近似的神经网络计算架构RNA14
2.1引言14
2.2问题背景17
2.2.1神经网络近似与加速17
2.2.2通用架构模型17
2.3计算模式19
2.3.1RNA架构概览19
2.3.2FP计算模式20
2.3.3NE计算模式21
2.3.4CE计算模式23
2.3.5调度框架24
2.4RNA架构设计31
2.4.1RNA架构的PE设计31
2.4.2RNA架构的互连设计31
2.4.3RNA架构的控制器设计34
2.5实验结果37
2.5.1实验设置37
2.5.2RNA架构的版图和硬件指标38
2.5.3RNA架构的性能分析39
2.5.4RNA架构的参数探索47
2.6小结50
第3章面向专用人工智能领域的神经网络计算架构DNA51
3.1引言51
3.2问题背景53
3.2.1CNN模型53
3.2.2以CNN加速器为中心的计算系统架构55
3.2.3CNN加速的两大执行目标和挑战56
3.3计算模式57
3.3.1计算模式概览57
3.3.2数据复用模式57
3.3.3卷积映射方法66
3.3.4对全连接层的支持70
3.4DNA架构设计71
3.4.1可重构数据通路设计71
3.4.2可重构卷积引擎设计73
3.4.3DNA架构的工作流程和调度框架77
3.5实验结果79
3.5.1实验设置79
3.5.2DNA架构的版图和硬件指标79
3.5.3DNA架构的访存和整体能耗分析80
3.5.4DNA架构的性能分析84
3.5.5DNA架构与国际很好工作的比较85
3.5.6基于DNA架构的人工智能计算芯片Thinker88
3.6小结90
第4章基于数据保持时间的神经网络存储优化框架RANA92
4.1引言92
4.2问题背景95
4.2.1CNN模型95
4.2.2CNN加速器96
4.2.3CNN加速器的缓存容量问题97
4.2.4eDRAM及数据保持问题98
4.3研究动机99
4.3.1实验平台99
4.3.2问题分析100
4.3.3优化机会102
4.4RANA框架102
4.4.1RANA框架概览102
4.4.2基于数据保持时间的训练方法104
4.4.3混合计算模式107
4.4.4刷新优化的eDRAM控制器113
4.5实验结果114
4.5.1实验设置114
4.5.2对RANA框架的评估115
4.5.3在DaDianNao上的扩展性分析120
4.6小结121
第5章总结与展望123
5.1工作总结123
5.2未来工作展望124
参考文献126
在学期间发表的学术论文与研究成果137
致谢139
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网