精华内容
下载资源
问答
  • 计算机系统结构(第五版)(李学干)电子课件(全)
  • 第1章 计算机系统结构的基本概念 1. 什么是计算机系统的多级层次结构?从计算机语言的角度,把计算机系统按功能划分成以下多级层次结构: 2. 硬件和软件在什么意义上是等效的?在什么意义上是不等效的?硬件和软件...

    第1章  计算机系统结构的基本概念

     

    1. 什么是计算机系统的多级层次结构?

    从计算机语言的角度,把计算机系统按功能划分成以下多级层次结构:



    2. 硬件和软件在什么意义上是等效的?在什么意义上是不等效的?

    硬件和软件在功能实现上是等效的,即一种功能可以由软件实现,也可以由硬件实现。在实现性能上是不等效的。软件实现的优点是设计容易、改进简单;硬件实现的优点是速度快。

     

    3. 经典计算机系统结构的实质是什么?

    计算机系统中软、硬件界面的确定,其界面之上的是软件的功能,界面之下的是硬件和固件的功能。

     

    4. 语言实现的两种基本技术是什么?

    翻译和解释是语言实现的两种基本技术。它们都是以执行一串级指令来实现N+1级指令,但二者存在着差别:翻译技术是先把N+1级程序全部变换成N级程序后,再去执行新产生的N级程序,在执行过程中N+1级程序不再被访问。而解释技术是每当一条N+1级指令被译码后,就直接去执行一串等效的N级指令,然后再去取下一条N+1级的指令,依此重复进行。在这个过程中不产生翻译出来的程序,因此解释过程是边变换边执行的过程。

     

    5. 对于通用寄存器型机器来说,机器语言程序设计者所看到的计算机的属性主要有哪些?

    (1)   数据表示

    (2)   寻址规则

    (3)   寄存器定义

    (4)   指令集

    (5)   中断系统

    (6)   机器工作状态的定义和切换

    (7)   存储系统

    (8)   信息保护

    (9)   I/O结构

     

    6. 什么是软件兼容?软件兼容有几种?其中哪一种是软件兼容的根本特征?

    同一个软件可以不加修改地运行于系统结构相同的各档机器上,而且它们所获得的结果一样,差别只在于运行时间的不同。

    软件兼容分为向上兼容、向下兼容、向前兼容和向后兼容。其中向后兼容是软件兼容的根本特征。

     

    7. 什么是系列机?它的出现较好地解决了什么矛盾?

    系列机是指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。它的出现较好地解决了软件要求环境稳定和硬件、器件技术迅速发展之间的矛盾。

     

    8. 对计算机发展非常关键的实现技术有哪些?

    (1) 逻辑电路

    (2) 半导体DRAM(动态随机访问存储器)

    (3) 磁盘

    (4) 网络

     

    9. 实现软件移植的主要途径有哪些?

    (1) 采用系列机方法

    (2) 采用模拟与仿真方法

    (3) 采用统一的高级语言

     

    10. 试以系列机为例,说明计算机系统结构、计算机组成和计算机实现三者之间的关系。

    计算机组成是计算机系统结构的逻辑实现;计算机实现是计算机组成的物理实现。

    一种系统结构可以有多种组成;一种组成可以有多种实现。同一系列机中各种型号的机器具有相同的系统结构,但采用不同的组成和实现技术,因而具有不同的性能和价格。

     

    11. 存储程序计算机在系统结构上的主要特点是什么?

    (1)以运算器为中心。

    (2)采用存储程序原理。程序和数据放在同一存储器中,并且没有对两者加以区分。

    (3)存储器是按地址访问的、线性编址的空间。

    (4)控制流由指令流产生。

    (5)指令由操作码和地址码组成。操作码指明本指令的操作类型,地址码指明操作数和操作结果的地址。

    (6)数据以二进制编码表示,采用二进制运算。

     

    12. 从系统结构的发展情况看,新型系统结构的设计主要从哪两方面着手?

    新型系统结构的设计主要从以下两方面着手:

    一方面是合理地增加计算机系统中硬件的功能比例,使系统结构对操作系统、高级语言甚至应用软件提供更多更好的支持;

    另一方面则是通过多种途径提高计算机系统结构中的并行性等级,使得凡是能并行计算和处理的问题都能并行计算和处理,使这种系统结构和组成对算法提供更多、更好的支持。

     

    13. 软件技术两个最重要的发展趋势是什么?

    (1) 程序及数据所使用存储器容量的不断增大。

    (2) 高级语言的使用越来越广泛,在很多应用领域取代了汇编语言。

     

    14. 计算机系统设计人员的技术挑战主要来自哪几个方面?

    计算机系统设计人员的技术挑战主要来自系统结构、设计工具、制造工艺、软件、应用和经济等多个方面。

     

    15. 一种计算机系统结构的生命周期是怎样的?

    计算机的生命周期和系统中各个部分的发展密切相关。一种新的系统结构的诞生,往往以硬件为标志,它的发展和成熟,是以配套的系统软件和应用为标志的。一个计算机系统结构,从产生到消亡,大致需要15~20年的时间。

     

    16. 用户CPU时间由哪三个因素决定?

    用户CPU时间 = CPI ´ IC / 时钟频率

    其中,CPI:指令时钟数

    IC:程序执行过程中所处理的指令数。

     

    17. 什么是测试程序组件?在评价计算机系统设计时最常见的测试程序组件是哪个?

    选择一组各个方面有代表性的测试程序,组成一个通用测试程序集合。这种测试程序集合称为测试程序组件。

    在评价计算机系统设计时最常见的测试程序组件是基于UNIX的SPEC,其主要版本包括SPEC89、SPEC92、SPEC95和SPEC2000等。

     

    18. SPEC2000测试程序组件中包括哪几个测试程序组件?

    (1)SPEC CPU2000:测试CPU;

    (2)SPECviewperf:用于测试图形系统支持OpenGL库的性能;

    (3)SPECapc:测试图形密集型应用的性能;

    (4)SPECSFS:基于NFS文件系统的文件服务器测试程序;

    (5)SPECWeb:Web服务器测试程序。

     

    19. 测试基于Microsoft公司的Windows系列操作系统平台的最常用测试组件有哪些?

    (1)PCMark04包括中央处理器测试组、内存测试组、图形芯片测试组、硬盘测试组等。

    (2)BusinessWinstone 2004主要用于测试计算机系统商业应用的综合性能。

    (3)MultimediaContent Creation Winstone 2004主要用于测试计算机系统多媒体应用的综合性能。

    (4)SiSoftSandra Pro 2004:一套功能强大的系统分析评比工具,拥有超过30种以上的分析与测试模组,主要包括CPU、存储器、I/O接口、I/O设备、主板等。

     

    20. 常用的专门的性能指标测试程序有哪些?

    3DMark03主要测试显卡性能和DirectX的性能。

    Prime95是用来估计分布式计算程序的通信情况,可使计算机高负荷运转,所以也用来测试计算机的稳定性。

    SuperPi/SuperE是计算圆周率π/自然指数e的软件,通常用来测试CPU的稳定性。

     

    21. 计算机系统结构设计和分析中最经常使用的三条基本原则是什么?

    (1)大概率事件优先原则:对于大概率事件(最常见的事件),赋予它优先的处理权和资源使用权,以获得全局的最优结果。

    (2)Amdahl定律:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。

    (3)程序的局部性原理:程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。

     

    22. 根据Amdahl定律,系统加速比由哪两个因素决定?

    系统加速比依赖于两个因素:

    (1)可改进比例:可改进部分在原系统计算时间中所占的比例。

    (2)部件加速比:可改进部分改进以后的性能提高。

     

    23. 从执行程序的角度看,并行性等级从低到高可分为哪几级?

    从执行程序的角度看,并行性等级从低到高可分为:

    1)指令内部并行:单条指令中各微操作之间的并行。

    2)指令级并行(Instruction Level ParallelismILP):并行执行两条或两条以上的指令。

    3)线程级并行(Thread Level ParallelismTLP):并行执行两个或两个以上的线程,通常是以一个进程内派生的多个线程为调度单位。

    4)任务级或过程级并行:并行执行两个或两个以上的过程或任务(程序段),以子程序或进程为调度单元。

    5)作业或程序级并行:并行执行两个或两个以上的作业或程序。

     

    24. 从处理数据的角度,并行性等级从低到高可以分为哪几级?

    从处理数据的角度,并行性等级从低到高可以分为:

    (1)字串位串:同时只对一个字的一位进行处理。

    (2)字串位并:同时对一个字的全部位进行处理。

    (3)字并位串:同时对许多字的同一位(称位片)进行处理。

    (4)全并行:同时对许多字的全部或部分位进行处理。

     

    25.Flynn分类法把计算机系统的结构分为哪4类?

    (1)     单指令流单数据流(SISDSingle Instruction stream Single Data stream)。

    (2)     单指令流多数据流(SIMDSingle Instruction stream Multiple Data stream)。

    (3)     多指令流单数据流(MISDMultiple Instruction stream Single Data stream)。

    (4)     多指令流多数据流(MIMDMultiple Instruction stream Multiple Data stream)。

     

    26.常见的计算机系统结构分类法有哪两种?分类的依据是什么?

    Flynn分类法:按照指令流和数据流的多倍性进行分类。

    冯氏分类法:用系统的最大并行度对计算机进行分类。

     

    27. 计算机系统中提高并行性的技术途径有哪三种?

    (1)时间重叠。多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。

    (2)资源重复。通过重复设置资源,尤其是硬件资源,大幅度提高计算机系统的性能。

    (3)资源共享。这是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备。

     

    28. 多机系统的耦合度可以分为哪几类?

    (1)最低耦合:除通过某种中间存储介质之外,各计算机之间没有物理连接,也无共享的联机硬件资源。

    (2)松散耦合:通过通道或通信线路实现计算机间互连,共享某些外围设备,机间的相互作用是在文件或数据集一级进行。

    (3)紧密耦合:机间物理连接的频带较高,往往通过总线或高速开关实现互连,可以共享主存。

     

    29. 单机系统和多机系统中,都是按哪三种技术途径分别发展为哪三类多处理机?

    单机系统和多机系统中,都是按时间重叠、资源重复和资源共享三种技术途径,分别发展为同构型多处理机、异构型多处理机、分布处理系统。

     

    30. 三种类型的多处理机(同构型多处理机、异构型多处理机、分布处理系统)的主要区别是什么?

     

    项目

    同构型多处理机

    异构型多处理机

    分布处理系统

    目的

    提高系统性能

    (可靠性、速度)

    提高系统使用效率

    兼顾效率与性能

    技术

    途径

    资源重复

    (机向互连)

    时间重叠

    (功能专用化)

    资源共享

    (网络化)

    组成

    同类型

    (同等功能)

    不同类型

    (不同功能)

    不限制

    分工方式

    任务分布

    功能分布

    硬件、软件、数据等各种资源分布

    工作方式

    一个作业由多机

    协同并行地完成

    一个作业由多机

    协同串行地完成

    一个作业由一台处理机完成,必要时才请求它机协作

    控制形式

    常采用浮动控制方式

    采用专用控制方式

    分布控制方式

    耦合度

    紧密耦合

    紧密、松散耦合

    松散、紧密耦合

    对互连网络的要求

    快速性、灵活性、可重构性

    专用性

    快速、灵活、简单、通用

     


    展开全文
  • 计算机系统结构总结

    千次阅读 2019-05-22 15:02:27
    计算机系统结构的课程已经结束了,今天刚考完试。在之前的复习中,我将计算机系统结构课程按照老师的复习PPT整理了一遍。 需要注意的是,计算机系统结构中的计算题阿姆达尔定律,流水线,存储器性能这三类计算题我...

    计算机系统结构的课程已经结束了,今天刚考完试。在之前的复习中,我将计算机系统结构课程按照老师的复习PPT整理了一遍。
    需要注意的是,计算机系统结构中的计算题阿姆达尔定律,流水线,存储器性能这三类计算题我没有整理。这并不说明它不重要,而是它太重要了,太重要了,太重要了,所以我没有简要的整理,这些内容还是需要多看看书,多做做题。
    当然,一切学习不应该以考试为目的。已故国际著名数学大师、南开大学数学教授陈省身先生曾经说过:“不要考100分。”其含义是,学生做学问,掌握精髓要义考个七八十分,就可以了。不要为了考100分在细枝末节上浪费过多的时间。

    第一章

    计算模式发展

    主机计算-桌面计算-普适计算

    摩尔定律

    集成电路芯片上所集成的电路数目,每隔18个月就翻一番

    处理器发展所面临的挑战

    频率墙、功耗墙、存储墙、应用墙

    流水线特点

    • 提高整体工作负载的吞吐量
    • 速率受限于最慢的流水段
    • 流水段的执行时间如果不均衡,那么加速比就会降低
    • 开始填充流水线的时间和最后排放流水线的时间降低加速比

    什么是计算机系统结构(必考简答)

    • 传统定义:程序员所看到的计算机属性,即程序员编写 出的能在机器上正确运行的程序所必须了解到的概念性结构和功能特性
    • 宽泛定义:使用各种可行的制造工艺进行抽象层的设计,使得应用程序有效运行

    计算机系统结构与计算机组成、实现的关系(简答题)

    计算机组成是计算机系统结构的逻辑实现,计算机实现是计算机组成的物理实现。一种系统结构可以有多种组成。一种组成可以有多种实现。
    例如:在设计主存系统时,确定主存容量、编址方式等属于计算机系统结构;确定主存周期、逻辑设计等属于计算机组成;选择存储芯片类型、线路设计等属于计算机实现。

    第三章

    什么是指令集架构?它如何去表现?(选择或填空)

    指令集架构是一系列指令
    如何去表现它:由于硬件只能理解位,所以采用二进制格式

    根据处理器内部储存类型对指令集架构进行分类(简答)

    • 堆栈型
      优点:表示计算的简单模型
      缺点:堆栈不能被随机访问,从而很难生成有效代码
    • 累加器型
      优点:减小了机器的内部状态
      缺点:由于累加器是唯一的暂存器,这种机器的存储器通信开销最大
    • 寄存器型
      优点:是代码生成最一般的模型
      缺点:所有操作数均需命名,且显示表示,因而指令比较长

    RISC vs. CISC (必考简答、填空)

    • RISC精简指令集计算机
      指令是等长的,结构简单,易学易用,功耗低,load/store结构
    • CISC复杂指令集计算机
      指令是不等长的,结构复杂,功能强,功耗大,采用微程序控制

    近代编译器结构——多遍结构(填空)

    第四章

    流水线的好处(填空)

    提高系统的吞吐量

    指令流水级,功能部件级流水(填空)

    通过时间与排空时间(填空)

    结构冲突、数据冲突、控制冲突(填空)

    三个常见的数据冲突:RAW,WAR,WAW(填空)

    流水线的性能问题(必考计算题)

    • 吞吐率:单位时间内流水线完成的任务数量或输出结果的数量。
    • 最大吞吐率TPmax:流水线在连续流动达到稳定状态后所得到的吞吐率。
    • 加速比:流水线的速度与等功能非流水线的速度之比
    • 最大加速比:N趋向于无穷大
    • 效率:流水–线中设备实际使用时间与整个运行时间的比值。
    • 额外开销:流水寄存器需要建立时间和传输延迟

    解决流水线瓶颈

    • 细分瓶颈段
    • 重复设置瓶颈段

    第五章

    指令级并行(填空)

    指令级并行(ILP):重叠执行指令以提高性能
    动态:动态分支预测
    静态:循环展开编译

    基本块(填空)

    除入口和出口外没有其他分支的线性指令序列

    数据相关,名称相关,控制相关(填空)

    相关性是程序的特性;冲突时流水线结构的特性;相关性的存在只预示着存在有冲突的可能性

    对程序正确性至关重要的两个属性(必考填空或简答)

    异常行为:指令执行顺序的任何更改都不能改变异常在程序中引发的方式
    数据流:在产生结果和使用结果的指令之间的实际数据值流

    目标分支预测(BTB)

    缺点:分支目标计算开销很大,并且会导致指令获取延迟

    动态分支预测

    分支历史表、相关性

    动态调度

    硬件在维护数据流和异常行为的同时,重新安排指令执行,以减少停机

    记分牌

    通过尽早执行一条指令来保持CPI=1
    当指令停止时,如果其他指令不依赖于任何活动或停止指令,则可以发出和执行它们

    超标量(必考)

    超标量处理器在运行时动态确定指令窗口可以被流出执行。动态调度时,这些工作有硬件完成;静态调度时,部分工作由编译器完成,大大降低了硬件实现的复杂度。

    超长指令字VLIW(必考)

    ILP的限制是什么?

    • 基准不同
    • 硬件的复杂度
    • 复杂的编译器

    什么是线程级并行(TLP),指令级并行(ILP),数据级并行(MDP)?

    多线程切换(必考)

    • 细粒度切换:它在每条指令间都能进行线程的切换,从而导致多个线程的交替执行。
    • 粗粒度切换:粗粒度多线程之间的切换只在发生代价较高、时间较长的阻塞出现时。

    什么是同时多线程

    同时多线程技术是一种在多流出、动态调度处理器上同时开发线程级并行和指令级并行的改进的多线程技术。

    第七章

    存储系统的层次结构(图表分析|填空)

    寄存器-(通过指令)-Cache-(通过块)-内存-(通过页表)-磁盘-(通过文件)-磁带

    局部性原理(简答|填空)

    • 局部性原理:CPU访问存储器时,不论是存取指令还是存取数据,所访问的存储单元都趋向于聚集在一个较小的连续区域中。
    • 时间局限性:如果一个信息项正在被访问,那么在近期它很有可能还会被再次访问。程序循环、堆栈等都是产生时间局限性的原因。
    • 空间局限性:在最近的将来将用到的信息很可能与现在正在使用的信息在空间地址上是临近的。

    存储层次的性能参数(计算题)

    • 存储容量S:主存的容量
    • 命中率H:CPU访问该存储系统时,在M1中找到所需信息的概率。
    • 存储系统的平均每位价格C
    • 平均访存时间
    • 命中
    • 不命中

    映像规则(图表分析|填空)

    • 映像规则:全相连映像、直接映像、组相连映像
    • 查找算法:目录表结构、并行查找和顺序查找
    • 替换算法:Random、LRU、FIFO

    写策略(填空|简答)

    • 写操作在访问Cache的比例为25%,写操作必须是在确认命中后才能执行,写操作有可能导致主存和Cache中的内容不一致。
    • 写直达与写回
      写直达:写操作应用于Cache块和下一层的内存中,易于编译,读缺失不产生写,重复写会影响底层的内存。
      优点:易于扩展
      写回:写操作只应用与Cache,编译较难,读缺失会产生写,重复读不会影响底层内存。常用于写回操作。
      优点:使用更小的内存带宽。

    按写分配与不按写分配(图表分析|填空)

    • 按写分配:(写时取)写失效时,先把所写单元所在的块直接调入Cache,再行写入。
    • 不按写分配:(绕写法)写失效时,把所写单元所在的块直接调入底层内存即可。常用于写直达操作。

    写缓存(填空)

    在处理器和内存之间的一个write buffer,这样CPU就不需要写停顿。
    程序执行时间,平均访问时间,命中与失效(计算)

    强制、容量与冲突不命中(填空)

    强制:第一次访问cache时一定会失效
    容量:cache大小有限,不可能装入全部的内存块
    冲突不命中:直接映像中的碰撞失效

    虚存空间(填空)

    虚存空间:把内存与外存有机的结合起来使用,从而得到一个容量很大的“内存”

    页表(填空)

    地址变换后备缓存(TLB)(填空)

    cache内部的块表

    第八章

    What is a bus? (填空)

    总线:共享的通信链路,用于连接多个子系统的单组连线

    Reliability, Availability and Dependability of the Storage Device * 可靠性、可用性与可信性 (填空)

    • 系统可靠性
      系统从初始状态开始一直提供服务的能力
      用平均无故障时间MTTF衡量
    • 系统可用性
      系统正常工作时间在连续两次正常服务间隔时间中所占的比率。
      用MTTF/(MTTF+MTTR(平均修复时间))来衡量
      MTTF+MTTR=MTBF(平均故障间隔时间)
    • 系统可信性
      多大程度上可以合理地认为服务是可靠的
      可信性不可度量

    Redundant Arrays of Inexpensive Disks (RAID): 廉价磁盘冗余阵列 (简答填空)

    PAID 0:数据分块,把数据放在多个盘上。
    RAID 5:块交叉分布式奇偶校验盘阵列
    RAID 6:双维奇偶校验独立存取盘阵列
    可容忍双盘出错
    写入数据要访问1个数据盘和2个冗余盘
    存储开销是RAID 5的两倍,RAID 6(3读3写)

    I/O Benchmarks: Metrics and TPC(填空)

    I/O基准:度量和TPC

    展开全文
  • 02325计算机系统结构(重点)

    千次阅读 多人点赞 2019-04-11 01:04:57
    第1章 计算机系统结构的基本概念 1.1 解释下列术语 层次结构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统...

    第1章 计算机系统结构的基本概念

     

    1.1 解释下列术语

    层次结构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

     

    虚拟机:用软件实现的机器。

     

    翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

     

    解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

     

    计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

     

    在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性

     

    计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

     

    计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

     

    系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

     

    Amdahl定律:当对一个系统中的部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比

     

    程序的局部性原理:程序执行时所访问存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。

     

    CPI:每条指令执行的平均时钟周期数。

     

    测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

     

    存储程序计算机:冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

     

    系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。

     

    软件兼容:一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。

     

    向上(下)兼容按某档计算机编制的程序,不加修改就能运行于比它高(低)档的计算机。

     

    )兼容按某个时期投入市场的某种型号计算机编制的程序,不加修改地就能运行于在它之)投入市场的计算机。

     

    兼容机:由不同公司厂家生产的具有相同系统结构的计算机。

     

    模拟:用软件的方法在一台现有的计算机(称为宿主机)上实现另一台计算机(称为虚拟机)的指令系统。

     

    仿真:用一台现有计算机(称为宿主机)上的微程序去解释实现另一台计算机(称为目标机)的指令系统。

     

    并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠,就存在并行性。它包括同时性与并发性两种含义。

     

    时间重叠:在并行性概念中引入时间因素,让多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。

     

    资源重复:在并行性概念中引入空间因素,以数量取胜。通过重复设置硬件资源,大幅度地提高计算机系统的性能。

     

    资源共享:这是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备。

     

    耦合度:反映多机系统中各计算机之间物理连接的紧密程度和交互作用能力的强弱。

     

    紧密耦合系统:又称直接耦合系统。在这种系统中,计算机之间的物理连接的频带较高,一般是通过总线或高速开关互连,可以共享主存。

     

    松散耦合系统:又称间接耦合系统,一般是通过通道或通信线路实现计算机之间的互连,可以共享外存设备(磁盘、磁带等)。计算机之间的相互作用是在文件或数据集一级上进行。

     

    异构型多处理机系统:由多个不同类型、至少担负不同功能的处理机组成,它们按照作业要求的顺序,利用时间重叠原理,依次对它们的多个任务进行加工,各自完成规定的功能动作。

     

    同构型多处理机系统:由多个同类型或至少担负同等功能的处理机组成,它们同时处理同一作业中能并行执行的多个任务。

     

     

    1.3 计算机系统结构的Flynn分类法是按什么来分类的?共分为哪几类?

    答:Flynn分类法是按照指令流和数据流的多倍性进行分类。把计算机系统的结构分为:

    1. 单指令流单数据流SISD
    2. 单指令流多数据流SIMD
    3. 多指令流单数据流MISD
    4. 多指令流多数据流MIMD

     

    1.4 计算机系统设计中经常使用的4个定量原理是什么?并说出它们的含义。

    答:(1)以经常性事件为重点在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的改进。(2)Amdahl定律。加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。(3)CPU性能公式。执行一个程序所需的CPU时间 = IC ×CPI ×时钟周期时间。(4)程序的局部性原理。程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。

     

     

    1.7 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?

     由题可知:   可改进比例 = 40% = 0.4      部件加速比 = 10

    根据Amdahl定律可知:

    采用此增强功能方法后,能使整个系统的性能提高到原来的1.5625倍。

     

     

    第2章 指令集结构的分类

     

      1. 解释下列术语

    堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。

     

    累加器型机器:CPU 中存储操作数的单元是累加器的机器。

     

    通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。

     

    CISC:复杂指令集计算机

     

    RISC:精简指令集计算机

     

    寻址方式:指令系统中如何形成所要访问的数据的地址。一般来说,寻址方式可以指明指令中的操作数是一个常数、一个寄存器操作数或者是一个存储器操作数。

     

    数据表示:硬件结构能够识别、指令系统可以直接调用的那些数据结构。

     

      1. 区别不同指令集结构的主要因素是什么?根据这个主要因素可将指令集结构分为哪3类?

    答:区别不同指令集结构的主要因素是CPU中用来存储操作数的存储单元。据此可将指令系统结构分为堆栈结构、累加器结构和通用寄存器结构。

     

      1.  常见的3种通用寄存器型指令集结构的优缺点有哪些?

    答:

    指令系统结构类型

    优  点

    缺  点

    寄存器-寄存器型

    (0,3)

    指令字长固定,指令结构简洁,是一种简单的代码生成模型,各种指令的执行时钟周期数相近。

    与指令中含存储器操作数的指令系统结构相比,指令条数多,目标代码不够紧凑,因而程序占用的空间比较大。

    寄存器-存储器型

    (1,2)

    可以在ALU指令中直接对存储器操作数进行引用,而不必先用load指令进行加载。容易对指令进行编码,目标代码比较紧凑。

    由于有一个操作数的内容将被破坏,所以指令中的两个操作数不对称。在一条指令中同时对寄存器操作数和存储器操作数进行编码,有可能限制指令所能够表示的寄存器个数。指令的执行时钟周期数因操作数的来源(寄存器或存储器)不同而差别比较大。

    存储器-存储器型

    (2,2)或(3,3)

    目标代码最紧凑,不需要设置寄存器来保存变量。

    指令字长变化很大,特别是3操作数指令。而且每条指令完成的工作也差别很大。对存储器的频繁访问会使存储器成为瓶颈。这种类型的指令系统现在已不用了。

     

      1.  指令集应满足哪几个基本要求?

    答:对指令集的基本要求是:完整性、规整性、高效率和兼容性。

    完整性是指在一个有限可用的存储空间内,对于任何可解的问题,编制计算程序时,指令集所提供的指令足够使用。

    规整性主要包括对称性和均匀性。对称性是指所有与指令集有关的存储单元的使用、操作码的设置等都是对称的。均匀性是指对于各种不同的操作数类型、字长、操作种类和数据存储单元,指令的设置都要同等对待。

    高效率是指指令的执行速度快、使用频度高。

     

      1.  指令集结构设计所涉及的内容有哪些?

    答: (1) 指令集功能设计:主要有RISC和CISC两种技术发展方向; (2) 寻址方式的设计:设置寻址方式可以通过对基准程序进行测试统计,察看各种寻址方式的使用频率,根据适用频率设置必要的寻址方式。 (3) 操作数表示和操作数类型:主要的操作数类型和操作数表示的选择有:浮点数据类型、整型数据类型、字符型、十进制数据类型等等。 (4) 寻址方式的表示:可以将寻址方式编码于操作码中,也可以将寻址方式作为一个单独的域来表示。 (5) 指令集格式的设计:有变长编码格式、固定长度编码格式和混合型编码格式3种。

     

      1.  简述CISC指令集结构功能设计的主要目标。从当前的计算机技术观点来看,CISC指令集结构的计算机有什么缺点?

    答:主要目标是增强指令功能,把越来越多的功能交由硬件来实现,并且指令的数量也是越来越多。

    缺点: (1) CISC结构的指令集中,各种指令的使用频率相差悬殊。(2)CISC结构指令的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。(3)CISC结构指令集的复杂性给VLSI设计增加了很大负担,不利于单片集成。(4)CISC结构的指令集中,许多复杂指令需要很复杂的操作,因而运行速度慢。 (5) 在CISC结构的指令集中,由于各条指令的功能不均衡性,不利于采用先进的计算机体系结构技术(如流水技术)来提高系统的性能。

     

      1. 简述RISC指令集结构的设计原则。

    答(1) 选取使用频率最高的指令,并补充一些最有用的指令;(2)每条指令的功能应尽可能简单,并在一个机器周期内完成;(3)所有指令长度均相同;(4)只有Load和Store操作指令才访问存储器,其它指令操作均在寄存器之间进行; (5) 以简单有效的方式支持高级语言。

     

      1.  指令中表示操作数类型的方法有哪几种?

    答:操作数类型有两种表示方法:(1)操作数的类型由操作码的编码指定,这是最常见的一种方法;(2)数据可以附上由硬件解释的标记,由这些标记指定操作数的类型,从而选择适当的运算。

     

      1.  表示寻址方式的主要方法有哪些?简述这些方法的优缺点。

    答:表示寻址方式有两种常用的方法:(1)将寻址方式编于操作码中,由操作码在描述指令的同时也描述了相应的寻址方式。这种方式译码快,但操作码和寻址方式的结合不仅增加了指令的条数,导致了指令的多样性,而且增加了CPU对指令译码的难度。(2)为每个操作数设置一个地址描述符,由该地址描述符表示相应操作数的寻址方式。这种方式译码较慢,但操作码和寻址独立,易于指令扩展。

     

      1.  通常有哪几种指令格式,请简述其适用范围。

    答: (1) 变长编码格式。如果系统结构设计者感兴趣的是程序的目标代码大小,而不是性能,就可以采用变长编码格式。(2)固定长度编码格式。如果感兴趣的是性能,而不是程序的目标代码大小,则可以选择固定长度编码格式。 (3) 混合型编码格式。需要兼顾降低目标代码长度和降低译码复杂度时,可以采用混合型编码格式。

     

      1.  根据CPU性能公式简述RISC指令集结构计算机和CISC指令集结构计算机的性能特点。

    答:CPU性能公式:CPU时间=IC×CPI×T

    其中,IC为目标程序被执行的指令条数,CPI为指令平均执行周期数,T是时钟周期的时间。

    相同功能的CISC目标程序的指令条数ICCISC 少于RISC的ICRISC,但是CISC的CPICISC和TCISC都大于RISC的CPIRISC和TRISC,因此,CISC目标程序的执行时间比RISC的更长。

     

     

    第3章 流水线技术

     

    3.2 指令的执行可采用顺序执行、重叠执行和流水线三种方式,它们的主要区别是什么?各有何优缺点。

    答:(1)指令的顺序执行是指指令与指令之间顺序串行。即上一条指令全部执行完后,才能开始执行下一条指令。

    优点:控制简单,节省设备。缺点:执行指令的速度慢,功能部件的利用率低。

    (2)指令的重叠指令是在相邻的指令之间,让第k条指令与取第k+l条指令同时进行。重叠执行不能加快单条指令的执行速度,但在硬件增加不多的情况下,可以加快相邻两条指令以及整段程序的执行速度。与顺序方式相比,功能部件的利用率提高了,控制变复杂了。

    (3)指令的流水执行是把一个指令的执行过程分解为若干个子过程,每个子过程由专门的功能部件来实现。把多个处理过程在时间上错开,依次通过各功能段,每个子过程与其它的子过程并行进行。依靠提高吞吐率来提高系统性能。流水线中各段时间应尽可能相等

     

    3.3 简述先行控制的基本思想。

    答:先行控制技术是把缓冲技术和预处理技术相结合。缓冲技术是在工作速度不固定的两个功能部件之间设置缓冲器,用以平滑它们的工作。预处理技术是指预取指令、对指令进行加工以及预取操作数等。

    采用先行控制方式的处理机内部设置多个缓冲站,用于平滑主存、指令分析部件、运算器三者之间的工作。这样不仅使它们都能独立地工作,充分忙碌而不用相互等待,而且使指令分析部件和运算器分别能快速地取得指令和操作数,大幅度地提高指令的执行速度和部件的效率。这些缓冲站都按先进先出的方式工作,而且都是由一组若干个能快速访问的存储单元和相关的控制逻辑组成。

    采用先行控制技术可以实现多条指令的重叠解释执行。 

     

    3.4 设一条指令的执行过程分成取指令、分析指令和执行指令三个阶段,每个阶段所需的时间分别为△t、△t和2△t 。分别求出下列各种情况下,连续执行N条指令所需的时间。

    (1)顺序执行方式;

    (2)只有“取指令”与“执行指令”重叠;

    (3)“取指令”、“分析指令”与“执行指令”重叠。

    解:(1)每条指令的执行时间为:△t+△t+2△t=4△t

    连续执行N条指令所需的时间为:4N△t

    (2)连续执行N条指令所需的时间为:4△t+3(N-1)△t=(3N+1)△t

    (3)连续执行N条指令所需的时间为:4△t+2(N-1)△t=(2N+2)△t

     

    3.5 简述流水线技术的特点。

    答:流水技术有以下特点:

    (1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率

    (2) 流水线中各段时间应尽可能相等,否则将引起流水线堵塞断流

    (3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。

    (4) 流水技术适合于大量重复的时序过程,只有输入端不断地提供任务,才能充分发挥流水线的效率。

    (5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。

     

    3.6 解决流水线瓶颈问题有哪两种常用方法?

    答:细分瓶颈段与重复设置瓶颈段

     

    3.7 减少流水线分支延迟的静态方法有哪些?

    答:(1)预测分支失败:沿失败的分支继续处理指令,就好象什么都没发生似的当确定分支失败说明预测正确,流水线正常流动当确定分支成功,流水线就把在分支指令之后取出的指令转化为空操作,并按分支目标地址重新取指令执行。

    (2)预测分支成功流水线ID段检测到分支指令后,一旦计算出了分支目标地址就开始从该目标地址取指令执行。

    (3)延迟分支主要思想是从逻辑上延长分支指令的执行时间。把延迟分支看成是由原来的分支指令和若干个延迟槽构成。不管分支是否成功,都要按顺序执行延迟槽中的指令。

    3种方法的共同特点:它们对分支的处理方法在程序的执行过程中始终是不变的。它们要么总是预测分支成功,要么总是预测分支失败。

     

    3.8 简述延迟分支方法中的三种调度策略的优缺点。

    调度策略

    对调度的要求

    对流水线性能改善的影响

    从前调度

    分支必须不依赖于被调度的指令

    总是可以有效提高流水线性能

    从目标处调度

    如果分支转移失败,必须保证被调度的指令对程序的执行没有影响,可能需要复制被调度指令

    分支转移成功时,可以提高流水线性能。但由于复制指令,可能加大程序空间

    从失败处调度

    如果分支转移成功,必须保证被调度的指令对程序的执行没有影响

    分支转移失败时,可以提高流水线性能

     

     

    3.9列举出下面循环中的所有相关,包括输出相关、反相关、真相关。

    for (i=2; i<100; i=i+1)

    a[i]=b[i]+a[i] ;/* s1 */

    c[i+1]=a[i]+d[i] ; /* s2 */

    a[i-1]=2*b[i] ; /* s3 */

    b[i+1]=2*b[i] ;/* s4 */

    解:展开循环两次:

    a[i] = b[i] + a[i] ; /* s1 */

    c[i+1] = a[i] + d[i] ; /* s2 */

    a[i-1] = 2 * b[i] ; /* s3 */

    b[i+1] = 2 * b[i] ; /* s4 */

    a[i+1] = b[i+1] + a[i+1] ; /* s1’ */

    c[i+2] = a[i+1] + d[i+1] ; /* s2 ‘*/

    a[i] = 2 * b[i+1] ; /* s3 ‘*/

    b[i+2] = 2 * b[i+1] ; /* s4 ‘*/

     

    输出相关:无

    反相关:无

    真相关:S1&S2

    由于循环引入的相关:S4&S4’(真相关)、S1’&S4(真相关)、S3’&S4(真相关)、S1&S3’(输出相关、反相关)、S2&S3’(反相关)。

     

    3.12 有一指令流水线如下所示

    1. 求连续输入10条指令,该流水线的实际吞吐率和效率;
    2. 该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少?

    解:(1)

    (2)瓶颈在3、4段。

    1. 变成八级流水线(细分)

     

     
     

    1. 重复设置部件

     

     

     

     
     

     

     

    3.14 有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3段的时间为2△t,其余各段的时间均为△t,而且流水线的输出可以直接返回输入端或

     

     
     

    暂存于相应的流水寄存器中。现要在该流水线上计算             ,画出其时空图,并计算其吞吐率、加速比和效率。

     

    解:首先,应选择适合于流水线工作的算法。对于本题,应先计算A1B1、A2B2、A3B3和A4B4;再计算(A1B1) ×(A2B2)和(A3B3) ×(A4B4);然后求总的结果。

     

     
     

    其次,画出完成该计算的时空图,如所示,图中阴影部分表示该段在工作。

     

     

    由图可见,它在18个△t时间,给出7个结果。所以吞吐率为:

                                                           

    如果不用流水线,由于一次求3t一次求5t,则产生上述7个结果共需(4×5+3×3)△t =29t。所以加速比为

                                                                    

     

    该流水线的效率可由阴影区的面积5个段总时空区的面积的比值求得

                                                                        

     

     

    3.15 动态多功能流水线由6个功能段组成,如下图:

     

     
     

     

    其中,S1、S4、S5、S6组成乘法流水线,S1、S2、S3、S6组成加法流水线,各个功能段时间均为50ns,假设该流水线的输出结果可以直接返回输入端,而且设置有足够的缓冲寄存器,若以最快的方式用该流水计算:

    1. 画出时空图;
    2. 计算实际的吞吐率、加速比和效率。

    解:机器一共要做10次乘法,4次加法。

     

     

     
     

     

     

     

    第5章 存储层次

     

     

      1. 简述“Cache—主存”层次与“主存—辅存”层次的区别。

    答:

                  存储层次

    比较项目

    “Cache—主存”层次

    “主存—辅存”层次

    目的

    为了弥补主存速度的不足

    为了弥补主存容量的不足

    存储管理实现

    全部由专用硬件实现

    主要由软件实现

    访问速度的比值

    (第一级比第二级)

    几比一

    几万比一

    典型的块(页)大小

    几十个字节

    几百到几千个字节

    CPU对第二级的访问方式

    可直接访问

    均通过第一级

    不命中时CPU是否切换

    不切换

    切换到其它进程

     

      1. 地址映象方法有哪几种?它们各有什么优缺点?

    答:(1) 全相联映象。实现查找的机制复杂,代价高,速度慢。Cache空间的利用率较高,块冲突概率较低,因而Cache的失效率也低。(2)直接映象。实现查找的机制简单,速度快。Cache空间的利用率较低,块冲突概率较高,因而Cache的失效率也高。(3)组相联映象。组相联是直接映象和全相联的一种折衷。

     

      1. 降低Cache失效率有哪几种方法?简述其基本思想。

    答:常用的降低Cache失效率的方法有下面几种:

    1. 增加Cache块大小。增加块大小利用了程序的空间局部性。
    2. 增加Cache的容量。
    3. 提高相联度,降低冲突失效。
    4. 伪相联Cache,降低冲突失效。当对伪相联Cache进行访问时,首先是按与直接映象相同的方式进行访问。如果命中,则从相应的块中取出所访问的数据,送给CPU,访问结束。如果不命中,将索引字段的最高位取反,然后按照新索引去寻找“伪相联组”中的对应块。如果这一块的标识匹配,则称发生了“伪命中”。否则,就访问下一级存储器。
    5. 硬件预取技术。在处理器提出访问请求前预取指令和数据。
    6. 由编译器控制的预取,硬件预取的替代方法,在编译时加入预取的指令,在数据被用到之前发出预取请求。
    7. 编译器优化,通过对软件的优化来降低失效率。
    8. “牺牲”Cache。在Cache和下一级存储器的数据通路之间增设一个全相联的小Cache,存放因冲突而被替换出去的那些块。每当发生不命中时,在访问下一级存储器之前,先检查“牺牲”Cache中是否含有所需的块。如果有,就将该块与Cache中某个块做交换,把所需的块从“牺牲”Cache 调入Cache。

     

      1. 简述减小Cache失效开销的几种方法。

    答:让读失效优先于写、写缓冲合并、请求字处理技术、非阻塞Cache或非锁定Cache技术、采用二级Cache。

     

    5.6 通过编译器对程序优化来改进Cache性能的方法有哪几种?简述其基本思想。

    答:(1)数组合并。通过提高空间局部性来减少失效次数。有些程序同时用相同的索引来访问若干个数组的同一维,这些访问可能会相互干扰,导致冲突失效,可以将这些相互独立的数组合并成一个复合数组,使得一个Cache块中能包含全部所需元素。(2)内外循环交换。循环嵌套时,程序没有按数据在存储器中的顺序访问。只要简单地交换内外循环,就能使程序按数据在存储器中的存储顺序进行访问。(3)循环融合。有些程序含有几部分独立的程序段,它们用相同的循环访问同样的数组,对相同的数据作不同的运算。通过将它们融合成一个单一循环,能使读入Cache的数据被替换出去之前得到反复的使用。(4)分块。通过改进时间局部性来减少失效。分块不是对数组的整行或整列进行访问,而是对子矩阵或块进行操作。

     

    5.7 在“Cache—主存”层次中,主存的更新算法有哪两种?它们各有什么特点?

    答:(1)写直达法。易于实现,而且下一级存储器中的数据总是最新的。

    (2)写回法。速度快,“写”操作能以Cache存储器的速度进行。而且对于同一单元的多个写最后只需一次写回下一级存储器,有些“写”只到达Cache,不到达主存,因而所使用的存储器频带较低。

     

    5.8 组相联Cache的失效率比相同容量直接映象Cache的失效率低。由此能否得出结论:采用组相联一定能带来性能上的提高?为什么?

    答:不一定。因为组相联命中率的提高是以增加命中时间为代价的,组相联需要增加多路选择开关。

     

    5.9 写出三级Cache的平均访问时间的公式。

    解:平均访存时间 = 命中时间+失效率×失效开销

    只有第I层失效时才会访问第I1

    三级Cache的命中率分别为HL1 Hl2 HL3失效率分别为Ml1Ml2ML3,第三级Cache的失效开销为PL3

     平均访问时间TA =HL1Ml1{Hl2Ml2(HL3ML3×PL3)}

     

    5.10 假设对指令Cache的访问占全部访问的75%;而对数据Cache的访问占全部访问的25%。Cache的命中时间为1个时钟周期,失效开销为50 个时钟周期,在混合Cache中一次load或store操作访问Cache的命中时间都要增加一个时钟周期,32KB的指令Cache的失效率为0.39%,32KB的数据Cache的失效率为4.82%,64KB的混合Cache的失效率为1.35%。又假设采用写直达策略,且有一个写缓冲器,并且忽略写缓冲器引起的等待。试问指令Cache和数据Cache容量均为32KB的分离Cache和容量为64KB的混合Cache相比,哪种Cache的失效率更低?两种情况下平均访存时间各是多少?

    解:(1)根据题意,约75%的访存为取指令。

    因此,分离Cache的总体失效率为:(75%×0.15%)+(25%×3.77%)=1.055%;    

    容量为128KB的混合Cache的失效率略低一些,只有0.95%。   

    (2)平均访存时间公式可以分为指令访问和数据访问两部分:     

     平均访存时间=指令所占的百分比×(读命中时间+读失效率×失效开销)+                数据所占的百分比×(数据命中时间+数据失效率×失效开销)    

    所以,两种结构的平均访存时间分别为:  

    分离Cache的平均访存时间=75%×(1+0.15%×50)+25%×(1+3.77%×50)

    =(75%×1.075)+(25%×2.885)=1.5275      

    混合Cache的平均访存时间=75%×(1+0.95%×50)+25%×(1+1+0.95%×50)

    =(75%×1.475)+(25%×2.475)=1.725

    因此,尽管分离Cache的实际失效率比混合Cache的高,但其平均访存时间反而较低。分离Cache提供了两个端口,消除了结构相关。

     

    5.11 给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU的性能。由计算结果能得出什么结论?

    1. 理想Cache情况下的CPI为2.0,时钟周期为2ns,平均每条指令访存1.2次;
    2. 两者Cache容量均为64KB,块大小都是32字节;
    3. 组相联Cache中的多路选择器使CPU的时钟周期增加了10%;
    4. 这两种Cache的失效开销都是80ns;
    5. 命中时间为1个时钟周期;
    6. 64KB直接映象Cache的失效率为1.4%,64KB两路组相联Cache的失效率为1.0%。

    解:  平均访问时间=命中时间+失效率×失效开销

    平均访问时间1-路=2.0+1.4% *80=3.12ns

    平均访问时间2-路=2.0*(1+10%)+1.0% *80=3.0ns

    两路组相联的平均访问时间比较低

    CPUtime=(CPU执行+存储等待周期)*时钟周期

    CPU time=IC(CPI执行+总失效次数/指令总数*失效开销) *时钟周期

    =IC((CPI执行*时钟周期)+(每条指令的访存次数*失效率*失效开销*时钟周期))

    CPU time 1-way=IC(2.0*2+1.2*0.014*80)=5.344IC

    CPU time 2-way=IC(2.2*2+1.2*0.01*80)=5.36IC

    相对性能比:5.36/5.344=1.003

    直接映象cache的访问速度比两路组相联cache要快1.04倍,而两路组相联Cache的平均性能比直接映象cache要高1.003倍。因此这里选择两路组相联。

     

     

    展开全文
  • 计算机系统结构基本概念

    万次阅读 多人点赞 2018-08-08 21:20:39
    计算机系统=硬件/固件+软件 虚拟机器和实际机器: 完全由软件实现的机器为虚拟机器,由硬件或固件实现的机器为实际机器。  仿真:由微程序解释指令集。  翻译技术是先把L+1级程序全部变换成L级程序后,再去...

    计算机系统=硬件/固件+软件

    虚拟机器和实际机器:
    完全由软件实现的机器为虚拟机器,由硬件或固件实现的机器为实际机器。

      仿真:由微程序解释指令集。

     翻译技术是先把L+1级程序全部变换成L级程序后,再去执行新产生的L级程序,在执行过程中L+1级程序不再被访问。

      解释技术是每当一条L+1级指令被译码后,就直接去执行一串等效的L级指令,然后再去取下一条L+1级的指令,依此重复进行。

    经典计算机体系结构概念的实质是计算机系统中软硬件界面的确定,其界面之上的是软件的功能,界面之下的是硬件和固件的功能。 

     

    计算机系统结构:计算机系统的软、硬件的界面,即机器语言程序员所看到的传统机器级所具有的属性。 

    计算机组成:计算机系统结构的逻辑实现,包括物理机器级内的数据流和控制流的组成以及逻辑设计等。

    计算机实现:计算机组成的物理实现,包括处理机,和主存等物理结构器件的集成度速度,着眼器件技术和微组装技术。

    着眼于:物理机器级内各事件的排序方式与控制方式、各部件的功能以及各部件之间的联

    ①指令系统

      指令系统的确定----系统结构
      指令的实现----------组成
      具体电路、器件设计及装配技术---实现
    ②乘法指令
      是否设乘法指令---系统结构
      用高速乘法器还是加法器移位器实现---组成
      器件的类型、数量及组装技术的确定---实现

    系统结构主要考虑的是计算机系统软、硬件界面的划分;计算机组成是系统结构的逻辑实现;计算机实现是计算机组成的物理实现。
    2.具有相同系统结构的计算机可以采用不同的组成,一种计算机组成可以采用多种不同的计算机实现(数据通路宽度8位,16位,32位);

    3.不同的系统结构使采用的组成技术产生差异,计算机组成也会影响系统结构;

     

     

     

     

    冯泽云分类法:

    按照系统的最大并行程度进行分类。
    最大并行度:计算机系统在单位时间内能够处理的最大的二进制位数。
    用平面直角坐标系中的一个点代表一个计算机系统,其横坐标表示字宽(n位),纵坐标表示一次能同时处理的字数(m字),m×n就表示了并行度.

             即:Pm=位片宽×字宽

    全并行

    Michael J,Flynn分类

    指令流:机器执行的指令序列。
    数据流:指令流调用的数据序列,包括输入数据和中间结果。
    多倍性:是指在系统性能瓶颈部件上处于同一执行阶段的指令或数据的最大可能个数。

     

    SISD 单指令流单数据流
         传统的单处理机属于SISD计算机,顺序处理计算机。
    SIMD 单指令流多数据流
        阵列处理机是SIMD计算机的典型代表
        我国的YH-I型是此类计算机型
    MISD 多指令流单数据流
        这类系统没有实际的计算机。
    MIMD 多指令流多数据流
        包括了大多数多处理机及多计算机系统

     

        我国的YH-II型计算机是这种类型的计算机

    计算机系统结构的发展

    冯·诺依曼结构 

    存储程序原理的基本点:指令驱动,1.以运算器为中心:I/O设备与存储器之间的数据传送以及机器各种联系都要经过它。
    2.在存储器中,指令和数据同等对待。指令和数据一样可以进行运算,即由指令组成的程序是可以修改的。
    3.存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的

    4.指令的执行是顺序的
    一般是按照指令在存储器中存放的顺序执行。
    程序的分支由转移指令实现。
    指令计数器PC指明当前正在执行的指令在存储器中的地址。
    5.指令由操作码和地址码组成。
         指令格式:
            操作码:指明操作类型。地址码:指明操作数和运算结果地址。
            三地址、二地址、一地址、零地址
    6.指令和数据均以二进制编码表示,采用二进制运算。

    冯·诺依曼型计算机明显有3个缺点:
    ① 存在两个瓶颈:
             CPU访问存储器;
             指令串行执行;
            严重影响计算机系统性能提高,
    ② 机器语言与高级语言间语义差别较大;
    ③ 数据表示简单,应用中常用到的栈、树、图、多维数组等数据结构必须经过地址映像存放,使软件复杂,运行速度慢。 

    软件对系统结构的影响 .可移植性

     

    系列机:

    由同一厂家生产的具有相同系统结构、但具有
    不同组成和实现的一系列不同型号的计算机。
    例如,IBM公司的IBM 370系列,Intel公司的x86系列等。

     

     

     

     

     

    模拟:用软件方法在A机上模拟执行B机的指令系统, A机称为宿主机, B机称为虚拟机,

     

    仿真:用一台现有机器(宿主机)上的微程序去解释实现
          另一台机器(目标机)的指令集。

    统一高级语言 :用统一的高级语言编写系统软件和应用程序

    器件发展对系统结构的影响

    摩尔定律

    计算机的分代主要以器件作为划分标准。SMP:对称式共享存储器多处理机
       MPP:大规模并行处理机  

    应用对系统结构的影响 

     

    并行性:计算机系统在同一时刻或者同一  时间间隔内进行多种运算或操作。

    只要在时间上相互重叠,就存在并行性。
    同时性:两个或两个以上的事件在同一时刻发生。

    并发性:两个或两个以上的事件在同一时间间隔内发生。 

    指令内部并行:单条指令中各微操作之间的并行。
    指令级并行:并行执行两条或两条以上的指令。
    线程级并行:并行执行两个或两个以上的线程。
     通常是以一个进程内派生的多个线程为调度单位。
    任务级或过程级并行:并行执行两个或两个以上的过程或任务(程序段)
          以子程序或进程为调度单元。
    作业或程序级并行:并行执行两个或两个以上的

              作业或程序。 

    三种途径:时间重叠、资源重复、资源共享。

    定量分析技术基础

    大概率事件优先原则

    Amdahl定律

    加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。

                                       1
            Speedup = -----------------  
                           (1-F) + F/S 
    F ----可改进比例(系统加速度比)
    S ---- 部件加速比

     

    程序的局部性原理

    计算机性能的评测:执行时间和吞吐率  基准测试程序 

    响应时间:计算机完成某一任务所花费的全部时间。
    流量:单位时间内系统所能完成的任务量。
    CPU时间:表示CPU为某个任务工作的时间。
    用户CPU时间:用户程序所花费的CPU时间。
    系统CPU时间:用户程序运行期间操作系统花费的CPU时间。

    CPU的性能
    (1)CPU时间=总时钟周期数/时钟频率
    (2)每条指令时钟数CPI,指令数IC
        CPI=总时钟周期数/IC

    (3)CPU时间=CPI×IC/时钟频率

    时钟周期时间:取决于硬件实现技术和计算机组成。
    CPI:取决于计算机组成和指令集结构。

    IC:取决于指令集结构和编译技术。

    展开全文
  • 一、计算机系统结构的概念1.1 计算机系统的层次结构划分为多级层次结构的优点: (1)便于理解计算机的整体工作概念及目前软硬件的作用和地位; (2)便于认识语言的实质和实现方法; (3)便于搜索虚拟机的新的实现...
  • 计算机系统结构 第2版 习题解答 郑纬民 汤志忠 给大家分享了 啊、@@@@@
  • 计算机系统结构张晨曦版课后答案

    千次阅读 多人点赞 2019-12-30 09:33:01
    第1章 计算机系统结构的基本概念 1.1 解释下列术语 层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器...
  • 计算机系统结构(一):全课程思维导图和计算机系统结构概述前言课程思维导图 前言 DUT的计算机系统结构长期以来都是英文ppt。时值疫情期间,复习时稍有不便,再加上CA的内容本身比较琐碎。遂在此对知识进行一个梳理...
  • 计算机系统结构--复习(Part 1)

    万次阅读 多人点赞 2018-11-07 11:01:47
    计算机系统结构教程-第二版-张晨曦著: https://download.csdn.net/download/zongza/10787843 计算机体系结构教程-学习指导与题解: https://download.csdn.net/download/zongza/10793886   Chapter 1 ...
  • 计算机系统结构之重要知识点总结1

    千次阅读 2018-12-18 08:54:00
    第一章 计算机系统结构的概念 重要知识点: 1. 计算机系统结构的定义 答:计算机系统结构是程序员看到的计算机属性,即概念性结构和功能性结构   2. 计算机系统结构的Flynn分类法 答: 分类依据: 指令流...
  • 计算机系统结构实践教程(第2版)》是2015年清华大学出版社出版的图书,作者是张晨曦、李江峰、刘依、沈立。本书设计了8个实验: 指令系统和体系结构、流水线及流水线中的冲突、指令调度和延迟分支、Cache性能分析...
  • 计算机系统结构样例试卷一、选择题(每小题2分,共20分)1、关于计算机系统结构、计算机组成和计算机实现间的关系说法正确的是( )。A.计算机组成是计算机系统结构的逻辑实现B.一种计算机系统结构只可以有一种...
  • 计算机系统结构中的8个伟大思想

    千次阅读 2018-10-06 17:36:23
    摘抄自《计算机组成与设计—硬件/软件接口》 1. 面向摩尔定律的设计 计算机设计者面临的一个永恒问题就是摩尔定律(Moore’s Law)驱动的快速变化。摩尔定律指出单芯片上的集成度没18-24个月翻一番。摩尔定律是...
  • 计算机系统结构之互连网络详解

    千次阅读 2018-10-31 12:30:04
    互连网络是一种由开关元件按照一定的拓扑结构和控制方式构成的网络,用来实现计算机系统中结点之间的相互连接。这些结点可以是处理器、存储模块或其他设备。 1.1 互连网络的种类 静态互连网络:连接通路是固定的...
  • 考研选择专业的时候,可以看到“计算机科学与技术”是一级学科,下面还有三个二级学科,分别叫“计算机系统结构” “计算机软件与理论” “计算机应用技术”。为什么分为这三个学科?这三个学科下面...
  • 第2章 计算机指令集结构设计 1. 通常可按哪5个因素对计算机指令集结构进行分类?(1) 在CPU中操作数的存储方法。(2) 指令中显式表示的操作数个数。(3) 操作数的寻址方式。(4) 指令集所提供的操作类型。(5) 操作数的...
  • 一、名词解释 1.虚拟机:指由软件实现的机器,以区别于由固件/硬件实现...4. 系列机:由同一厂家生产的具有相同系统结构,但具有不同组成和实现的一系列不同型号的机器。 5. 模拟:用软件的方法在一台现有的计算...
  • 计算机系统结构,组成和实现

    千次阅读 2015-05-17 23:16:58
    计算机系统结构的定义:计算机系统结构是其所处环境中最高层次的概念,是对计算机系统中各个机器之间界面的划分和定义,以及对各级界面上,下的功能进行分配。也称为体系结构。计算机体系结构指的是计算机系统设计的...
  • 计算机系统结构选择题

    千次阅读 2020-07-09 16:04:38
    计算机系统结构 | 期末复习总结学习笔记 第一部分 选择题 一、单项选择题 (本大题共10小题,每小题1分,共10分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其选出并将“答题卡” 的相应代码涂黑。未...
  • 计算机系统结构-透明性概念

    千次阅读 2020-03-19 15:15:48
    透明性 定义:在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 例如:浮点数表示、乘法...对计算机系统结构,以下那些透明? 存储器模块m交叉存取;浮点数据表示;I...
  • 计算机系统结构课后题目答案

    千次阅读 多人点赞 2020-07-16 10:26:37
    计算机系统结构的基础知识 题目1.10 计算机系统有三个部件可以改进,这三个部件的加速比如下。 部件加速比S1=30,部件加速比S2=20,部件加速比S3=10。 (1)如果部件1和部件2的可改进比例都为30%,那么当部件3的可...
  • 计算机系统结构——量化研究方法(第三版) PDG格式 <br> 【原 书 名】 Computer Architecture:A Quantitative Approach,Third Edition 【原出版社】 Morgan Kaufmann 【作 者】(美)John L....
  • 计算机系统结构——流水线的分类

    千次阅读 2020-06-21 09:23:50
    处理机间流水线(系统级)它是由两个以上的处理机串行地对同一数据流进行处理,每个处理机完成一项任务。 标量流水处理机和向量流水处理机 标量流水处理机:处理机不具有向量数据的表示,仅对标量数据进行流水处理。...
  • 计算机系统结构 pdf

    热门讨论 2009-07-13 14:28:56
    计算机参考书,清华大学出版社,郑纬民,汤志中著
  • 计算机系统结构 计算机指令集结构

    千次阅读 2016-05-05 23:57:56
    一、寻址方式 二、指令集结构的功能设计对于指令集的基本要求是:完整性、规整性、高效性和兼容性。 2.1 CISC指令集结构的功能设计1....3.面向操作系统的优化实现改进指令集1)处理机工作状态和访问方式的切
  • 计算机系统结构 存储体系

    千次阅读 2016-05-06 00:02:18
    一、存储器的层次结构1.1 存储层次的性能参数(1)存储层次的平均每位价格 C假设存储器M的容量、访问时间、每位价格为S,T,C,则存储层次的平均每位价格C (2)命中率 H 和不命中率 F命中率是指CPU在访问存储系统时...
  • 计算机系统结构中流水线的时空图怎么画

    万次阅读 多人点赞 2018-10-31 12:42:35
     非流水线工作方式的控制比较简单,但部件的利用率较低,系统工作速度较慢。  3.标量流水计算机工作方式  标量(Scalar)流水计算机是 只有一条 指令流水线 的计算机。图5-22表示标量流水计算机的时空图。...
  • 学习计算机系统结构思维导图

    千次阅读 2017-09-23 21:23:00
    下面聊聊计算机专业,其实我大一上完,也没啥感觉,主要就学了一门编程语言,还有高等数学,英语了。还有一门数据结构。学得还算可以,自我感觉良好。怎么说呢,学习其实脚踏实地,由浅入深就行了。切不可心急。 ...
  • 计算机系统结构 互连网络

    千次阅读 2016-05-06 00:03:04
    一、基本概念互连网络是一种由开关元件按照一定的拓扑结构和控制方式构成的网络,用来实现计算机系统中结点 之间的相互连接。 1.1 互连网络的种类静态互连网络:连接通路是固定的,一般不能实现任意结点到结点之间的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 733,196
精华内容 293,278
关键字:

计算机系统结构