精华内容
下载资源
问答
  • 单周期CPU代码实现

    2018-05-08 16:21:27
    北航计算机组成课程设计单周期CPUVerilog代码实现,内包含源代码和相应的测试文件
  • 课程设计所得单周期十条指令cpu,源代码在压缩包里,可略作参考,如果怎么跑都不会就。。。
  • 这学期比较忙,很久没发博客了,先附上源码,等过完期末再补全博文 源码链接:https://github.com/AlexZhang267/Single-Cycle-CPU ...单周期,没有pipeline,太简单了。。。不想写说明了,就是对着这张图写的。

    这学期比较忙,很久没发博客了,先附上源码,等过完期末再补全博文
    源码链接:https://github.com/AlexZhang267/Single-Cycle-CPU
    注:我是在编辑器中写的,用Icarus Verilog编译运行的,没用vivado。

    单周期,没有pipeline,太简单了。。。不想写说明了,就是对着这张图写的。
    这里写图片描述

    展开全文
  • 单周期CPUVerilog实现

    2012-03-19 22:34:37
    单周期CPU实现了lw,sw,add,sub,slt,jmp指令
  • 自己动手写CPU之第五阶段(3)——MIPS指令集中的逻辑、移位与空指令 - yxwkaifa - 博客园 sllv $t1,$t2,$t3。 则t1值为t2左移t3的低五位 但是这里不太懂,没搞明白是怎么实现的逻辑左右移,位数可变 这里...

    参考计组实验测试指令 - 简书,添加了一些细节。

    1.添加 bne指令

    修改 ctrl.v


     

     


     

     


     

    之后修改mipstestloopjal_sim.asm,mars dump 为 bnetest.dat

     


     

    修改sccomp_tb

     


     

    modelsim编译,模拟。信号添加sccomp_tb: u_ctrl -> i_bne ,npc,  pc

     


     

    可见i_bne控制信号为1时,npc变为44。添加bne成功

    2.添加jr指令

    先看其格式。

     


     

    R型指令。

    故在ctrl.v如下修改。


     

    ctrl.v又两处修改

     


     

    然后在NPC.v修改。注意添加参数和input

     


     

     


     

     

    =RD1的原因可见sccpu.v

     


     

    在ctrl_encode_def 定义NPC_JR


     

    在sccpu.v添加参数  .RD1


     

    然后写测试程序

    $ra先赋值为4.这样应该会不断循环。

    导出测试


     

    勿忘修改sccomp_tb

     


     

    波形图可见PC从1c变到设定的4。添加成功

     


     

    3.添加JALR

     


     

    ctrl.v

     


     

     


     

     


     

     


     

     

    JALR指令格式为 jalr rs

    无条件跳转到由寄存器rs指定的指令,并将下一条指令的地址保存到寄存器$ra中

    测试代码

     


     

    可见从14跳到4,


     

    并且$ra 记录 18

     


     

    4.添加NOR指令

     


     

     


     

     


     

    在alu.v中

     


     

    测试代码


     

    波形:

     


     

    寄存器:


     

    5.添加sll & sra & srl指令

    注意这里做了扩展


     

    注意同时修改了input ALUOp的宽度


     

    然后在ctrl.v中

    写寄存器

    注意只改了RegWrite,下面的RD没改


     

     

    添加输出

     


     

     

     


     

     

    在sccpu.v中


     

     


     

     

     


     

     


     

    测试代码:

     


     

    波形:可以看到ALUop对应 sll,srl,sra的1000,1001,1010

     


     

    寄存器值:

     


     

    6.sllv和srlv

     

    这里sllv使用的是rs低五位 自己动手写CPU之第五阶段(3)——MIPS指令集中的逻辑、移位与空指令 - yxwkaifa - 博客园

    sllv $t1,$t2,$t3。

    则t1值为t2左移t3的低五位

    但是这里不太懂,没搞明白是怎么实现的逻辑左右移,位数可变

    这里犯了一次错误。复制粘贴后忘了改数字了


     

     


     

     

     


     

     


     

     


     

    测试代码:

     


     

    波形:

     


     

    寄存器变化

     


     

    7.stli指令

    小于则置一

     


     

     


     

     


     

     


     

    测试代码:

     


     

    波形:

     


     

    寄存器值:

     


     

    8.lui指令

    取高十六位


     

     


     

     


     

     

     


     

     


     

     

    测试代码:


     

    波形图:

     


     

    寄存器值:

     


     

    9.andi指令

     


     

     


     

    别忘了RT


     

     

    aluop同and


     

    测试代码:

     


     

    波形图:

     


     

    寄存器:

     


     

    以上。nice!

    学号后八位排序

    01510029

    lui 0x0151

    ori 0x0029

     


     

    记得改sccomp_tb

     


     

    跑完看result.txt

     


     

    大概是完成了排序。

    转载于:https://www.cnblogs.com/lqerio/p/11117623.html

    展开全文
  • • 用硬件描述语言(Verilog)设计MIPS CPU,支持如下指令集 • ISA1 = {ADD/ADDU/SUB/SUBU/SLL/SRL/SRA/SLLV/SRLV/SRAV/AND/OR/XOR/NOR/ SLT/SLTU/ADDI/ADDIU/ANDI/ORI/XORI/LUI/SLTI/SLTIU/LB/LBU/LH/LH U/LW/SB/...
  • 单周期的整个项目,在电脑上安装vivado即可添加项目,我个人使用的是15版的。另外需要看波形图的,点击仿真,调节相关参数即可
  • 单周期CPU的设计,使用结构级语句与描述级语句构建寄存器堆、ALU、CONUNIT等模块,支持12条指令:add、sub、j、bne、bnq等
  • single_period_CPU_opt.zip 内部完整代码 仿真测试都通过
  • 周期CPU(verilog实现/含实验文档) 开发平台为ISE,实验文档中包含状态机示意图和线路连接图
  • Verilog单周期CPU配套源码,两个压缩包一个是完整的工程,一个是可以直接导入的函数库,任选一个即可。关于本代码的详细解释请移步于本人博客:https://blog.csdn.net/Accelerato/article/details/86546751
  • 单周期CPU——verilog语言实现

    万次阅读 多人点赞 2018-06-29 11:28:38
    单周期CPU的设计与实现 关于单周期CPU的设计问题,相信各位在课程上也有所学习,以下是个人的一些理解 整个项目的资源下载:这里写链接内容 实验内容 基本要求 PC和寄存器组写状态使用时钟触发,这是必须...

    单周期CPU的设计与实现

    关于单周期CPU的设计问题,相信各位在课程上也有所学习,以下是个人的一些理解

    实验内容

    基本要求

    1. PC和寄存器组写状态使用时钟触发,这是必须的!
    2. 指令存储器和数据存储器存储单元宽度一律使用8位,即一个字节的存储单位。不能使用32位作为存储器存储单元宽度。
    3. 控制器部分要学会用控制信号真值表方法分析问题并写出逻辑表达式;或者用case语句方法逐个产生各指令控制信号。注意:控制信号的产生不能使用时钟触发!
    4. 必须写一段测试用的汇编程序,而且必须包含所要求的所有指令,slti指令必须检查两种情况:“小于”和“大于等于”;beq、bne:“不等”和“等”。这段汇编程序必须尽量优化且出现在实验报告中,同时,给出每条指令在内存中的地址。检查实验时,必须提供。
    5. Always@(…)的敏感信号表中,时序触发和电平触发不能同时出现,即不能混用。
    6. 实验报告中应该有每条指令执行的波形(截图),用于说明该指令的正确性。

    指令的分析

    同时该CPU至少能实现以下指令功能操作。指令与格式如下:
    ==> 算术运算指令
    (1)add rd , rs, rt (说明:以助记符表示,是汇编指令;以代码表示,是机器指令)
    000000 rs(5位) rt(5位) rd(5位) reserved
    功能:rd←rs + rt。reserved为预留部分,即未用,一般填“0”。

    (2)addi rt , rs ,immediate
    000001 rs(5位) rt(5位) immediate(16位)
    功能:rt←rs + (sign-extend)immediate;immediate符号扩展再参加“加”运算。
    (3)sub rd , rs , rt
    000010 rs(5位) rt(5位) rd(5位) reserved
    功能:rd←rs - rt

    ==> 逻辑运算指令
    (4)ori rt , rs ,immediate
    010000 rs(5位) rt(5位) immediate(16位)
    功能:rt←rs | (zero-extend)immediate;immediate做“0”扩展再参加“或”运算。
    (5)and rd , rs , rt
    010001 rs(5位) rt(5位) rd(5位) reserved
    功能:rd←rs & rt;逻辑与运算。
    (6)or rd , rs , rt
    010010 rs(5位) rt(5位) rd(5位) reserved
    功能:rd←rs | rt;逻辑或运算。

    ==>移位指令
    (7)sll rd, rt,sa
    011000 未用 rt(5位) rd(5位) sa reserved
    功能:rd<-rt<<(zero-extend)sa,左移sa位 ,(zero-extend)sa

    ==>比较指令
    (8)slti rt, rs,immediate 带符号
    011011 rs(5位) rt(5位) immediate(16位)
    功能:if (rs <(sign-extend)immediate) rt =1 else rt=0, 具体请看表2 ALU运算功能表,带符号

    ==> 存储器读/写指令
    (9)sw rt ,immediate(rs) 写存储器
    100110 rs(5位) rt(5位) immediate(16位)
    功能:memory[rs+ (sign-extend)immediate]←rt;immediate符号扩展再相加。即将rt寄存器的内容保存到rs寄存器内容和立即数符号扩展后的数相加作为地址的内存单元中。

    (10) lw rt , immediate(rs) 读存储器
    100111 rs(5位) rt(5位) immediate(16位)
    功能:rt ← memory[rs + (sign-extend)immediate];immediate符号扩展再相加。
    即读取rs寄存器内容和立即数符号扩展后的数相加作为地址的内存单元中的数,然后保存到rt寄存器中。

    ==> 分支指令
    (11)beq rs,rt,immediate
    110000 rs(5位) rt(5位) immediate(16位)
    功能:if(rs=rt) pc←pc + 4 + (sign-extend)immediate <<2 else pc ←pc + 4
    特别说明:immediate是从PC+4地址开始和转移到的指令之间指令条数。immediate符号扩展之后左移2位再相加。为什么要左移2位?由于跳转到的指令地址肯定是4的倍数(每条指令占4个字节),最低两位是“00”,因此将immediate放进指令码中的时候,是右移了2位的,也就是以上说的“指令之间指令条数”。

    (12)bne rs,rt,immediate
    110001 rs(5位) rt(5位) immediate
    功能:if(rs!=rt) pc←pc + 4 + (sign-extend)immediate <<2 else pc ←pc + 4
    特别说明:与beq不同点是,不等时转移,相等时顺序执行。

    ==>跳转指令
    (13)j addr
    111000 addr[27..2]
    功能:pc <-{(pc+4)[31..28],addr[27..2],2{0}},无条件跳转。
    说明:由于MIPS32的指令代码长度占4个字节,所以指令地址二进制数最低2位均为0,将指令地址放进指令代码中时,可省掉!这样,除了最高6位操作码外,还有26位可用于存放地址,事实上,可存放28位地址了,剩下最高4位由pc+4最高4位拼接上。

    ==> 停机指令
    (14)halt
    111111 00000000000000000000000000(26位)
    功能:停机;不改变PC的值,PC保持不变。

    实验原理

    单周期CPU指的是一条指令的执行在一个时钟周期内完成,然后开始下一条指令的执行,即一条指令用一个时钟周期完成。电平从低到高变化的瞬间称为时钟上升沿,两个相邻时钟上升沿之间的时间间隔称为一个时钟周期。时钟周期一般也称振荡周期(如果晶振的输出没有经过分频就直接作为CPU的工作时钟,则时钟周期就等于振荡周期。若振荡周期经二分频后形成时钟脉冲信号作为CPU的工作时钟,这样,时钟周期就是振荡周期的两倍。)
    CPU在处理指令时,一般需要经过以下几个步骤:
    (1) 取指令(IF):根据程序计数器PC中的指令地址,从存储器中取出一条指令,同时,PC根据指令字长度自动递增产生下一条指令所需要的指令地址,但遇到“地址转移”指令时,则控制器把“转移地址”送入PC,当然得到的“地址”需要做些变换才送入PC。
    (2) 指令译码(ID):对取指令操作中得到的指令进行分析并译码,确定这条指令需要完成的操作,从而产生相应的操作控制信号,用于驱动执行状态中的各种操作。
    (3) 指令执行(EXE):根据指令译码得到的操作控制信号,具体地执行指令动作,然后转移到结果写回状态。
    (4) 存储器访问(MEM):所有需要访问存储器的操作都将在这个步骤中执行,该步骤给出存储器的数据地址,把数据写入到存储器中数据地址所指定的存储单元或者从存储器中得到数据地址单元中的数据。
    (5) 结果写回(WB):指令执行的结果或者访问存储器中得到的数据写回相应的目的寄存器中。
    单周期CPU,是在一个时钟周期内完成这五个阶段的处理。

    这里写图片描述

    MIPS指令的三种格式:
    这里写图片描述
    其中,
    op:为操作码;
    rs:只读。为第1个源操作数寄存器,寄存器地址(编号)是00000~11111,00~1F;
    rt:可读可写。为第2个源操作数寄存器,或目的操作数寄存器,寄存器地址(同上);
    rd:只写。为目的操作数寄存器,寄存器地址(同上);
    sa:为位移量(shift amt),移位指令用于指定移多少位;
    funct:为功能码,在寄存器类型指令中(R类型)用来指定指令的功能与操作码配合使用;
    immediate:为16位立即数,用作无符号的逻辑操作数、有符号的算术操作数、数据加载(Load)/数据保存(Store)指令的数据地址字节偏移量和分支指令中相对程序计数器(PC)的有符号偏移量;
    address:为地址。

    这里写图片描述
    图2是一个简单的基本上能够在单周期CPU上完成所要求设计的指令功能的数据通路和必要的控制线路图。其中指令和数据各存储在不同存储器中,即有指令存储器和数据存储器。访问存储器时,先给出内存地址,然后由读或写信号控制操作。对于寄存器组,先给出寄存器地址,读操作时,输出端就直接输出相应数据;而在写操作时,在 WE使能信号为1时,在时钟边沿触发将数据写入寄存器。图中控制信号作用如表1所示,表2是ALU运算功能表。

    表1 控制信号的作用

    控制信号名状态“0”状态“1”
    Reset初始化PC为0PC接收新地址
    PCWrePC不更改,相关指令:haltPC更改,相关指令:除指令halt外
    ALUSrcA来自寄存器堆data1输出,相关指令:add、sub、addi、or、and、ori、beq、bne、slti、sw、lw来自移位数sa,同时,进行(zero-extend)sa,即 {{27{0}},sa},相关指令:sll
    ALUSrcB来自寄存器堆data2输出,相关指令:add、sub、or、and、sll、beq、bne来自sign或zero扩展的立即数,相关指令:addi、ori、slti、sw、lw
    DBDataSrc来自ALU运算结果的输出,相关指令:add、addi、sub、ori、or、and、slti、sll来自数据存储器(Data MEM)的输出,相关指令:lw
    RegWre无写寄存器组寄存器,相关指令:beq、bne、sw、halt、j 寄存器组写使能,相关指令:add、addi、sub、ori、or、and、slti、sll、lw
    InsMemRW写指令存储器读指令存储器(Ins. Data)
    mRD输出高阻态读数据存储器,相关指令:lw
    mWR无操作写数据存储器,相关指令:sw
    RegDst写寄存器组寄存器的地址,来自rt字段,相关指令:addi、ori、lw、slti写寄存器组寄存器的地址,来自rd字段,相关指令:add、sub、and、or、sll
    ExtSel(zero-extend)immediate(0扩展),相关指令:ori(sign-extend)immediate(符号扩展),相关指令:addi、slti、sw、lw、beq、bne
    PCSrc[1..0]00:pc<-pc+4,相关指令:add、addi、sub、or、ori、and、slti、sll、sw、lw、beq(zero=0)、bne(zero=1);01:pc<-pc+4+(sign-extend)immediate,相关指令:beq(zero=1)、bne(zero=0);10:pc<-{(pc+4)[31:28],addr[27:2],2{0}},相关指令:j;11:未用
    ALUOp[2..0]ALU 8种运算功能选择(000-111),看功能表

    相关部件及引脚说明:

    • Instruction Memory:指令存储器,
    • Iaddr,指令存储器地址输入端口
    • IDataIn,指令存储器数据输入端口(指令代码输入端口)
    • IDataOut,指令存储器数据输出端口(指令代码输出端口)
    • RW,指令存储器读写控制信号,为0写,为1读
    • Data Memory:数据存储器,
    • Daddr,数据存储器地址输入端口
    • DataIn,数据存储器数据输入端口
    • DataOut,数据存储器数据输出端口
    • /RD,数据存储器读控制信号,为0读
    • /WR,数据存储器写控制信号,为0写
    • Register File:寄存器组
    • Read Reg1,rs寄存器地址输入端口
    • Read Reg2,rt寄存器地址输入端口
    • Write Reg,将数据写入的寄存器端口,其地址来源rt或rd字段
    • Write Data,写入寄存器的数据输入端口
    • Read Data1,rs寄存器数据输出端口
    • Read Data2,rt寄存器数据输出端口
    • WE,写使能信号,为1时,在时钟边沿触发写入
    • ALU: 算术逻辑单元
    • result,ALU运算结果
    • zero,运算结果标志,结果为0,则zero=1;否则zero=0

    表2 ALU运算功能表
    这里写图片描述

    需要说明的是以上数据通路图是根据要实现的指令功能的要求画出来的,同时,还必须确定ALU的运算功能(当然,以上指令没有完全用到提供的ALU所有功能,但至少必须能实现以上指令功能操作)。从数据通路图上可以看出控制单元部分需要产生各种控制信号,当然,也有些信号必须要传送给控制单元。从指令功能要求和数据通路图的关系得出以上表1,这样,从表1可以看出各控制信号与相应指令之间的相互关系,根据这种关系就可以得出控制信号与指令之间的关系表(留给学生完成),再根据关系表可以写出各控制信号的逻辑表达式,这样控制单元部分就可实现了。
    指令执行的结果总是在时钟下降沿保存到寄存器和存储器中,PC的改变是在时钟上升沿进行的,这样稳定性较好。另外,值得注意的问题,设计时,用模块化、层次化的思想方法设计,关于如何划分模块、如何整合成一个系统等等,是必须认真考虑的问题。

    实验器材

    电脑一台,Xilinx Vivado 软件一套,Basys3板一块。

    实验分析

    1. CPU的设计,主要是依照实验原理中的数据通路图以及控制信号的表格进行坟墓快设计的。其中分为十个底层模块以及一个顶层模块,具体的模块内容及作用如下:
    顶层模块(1个):
    (1) Main
    作用:负责统筹11个模块的输入输出参数,通过设置多个wire类型的变量,及时拿到各个模块的输出,并传入到需要改输入参数的模块中去。

    关键代码:

    1.  module Main(  
    2.      input CLK,  //时钟  
    3.      input Reset,    //重置信号  
    4.      output zero,pcWre,  //ALU结果是否为0, PC更改信号  
    5.      output[1:0] pcSrc,  //PC四选一选择器的控制信号  
    6.      output[2:0] aluop,  //ALU的执行信号  
    7.      output[5:0] op, //指令操作的代码  
    8.      output[31:0] readData1, readData2, extendData, writeData, o_p, currentAdd, Result   //寄存器1读取的值,寄存器2读取的值,拓展符号信号,写入寄存器的数据, 32位的整条指令, 当前指令的地址, ALU输出的结果  
    9.      );  
    底层模块(10个):
    

    (1) PC
    作用:根据传入的PCWre控制信号,进行地址移位操作。当PCWre为0时,指令地址保持不变;当PCWre为1时,指令地址变更为新地址。

    代码:

    1.  module PC(  
    2.      input CLK,  
    3.      input Reset,  
    4.      input PCWre,//值为0时不更改,代表停机指令;值为1的时候进行更改  
    5.      input [31:0] NewAdd,  
    6.      output reg[31:0] CurrentAdd  
    7.      );  
    8.        
    9.      initial begin  
    10.         CurrentAdd <= -8;  
    11.     end  
    12.       
    13.     always@(posedge CLK or posedge Reset)  
    14.         begin  
    15.             if(Reset == 0) CurrentAdd <= 0;  
    16.             else   
    17.                 begin  
    18.                     if(PCWre == 0) CurrentAdd <= CurrentAdd;  
    19.                     else CurrentAdd <= NewAdd;  
    20.                 end  
    21.         end  
    22. endmodule  

    (2) ROM(指令存储器)
    作用:通过从文件中读取相关的指令,并按照实验要求存储在8位的寄存器中,并根据传入的地址,输出对应地址的指令。

    代码:

    1.  module ROM ( rd, addr, dataOut); // 存储器模块  
    2.      input rd; // 读使能信号  
    3.      input [ 31:0] addr; // 存储器地址  
    4.      output reg [31:0] dataOut; // 输出的数据  
    5.    
    6.      reg [7:0] rom [99:0]; // 存储器定义必须用reg类型, 存储器存储单元8位长度, 共100个存储单元  
    7.        
    8.      initial // 加载数据到存储器rom。 注意: 必须使用绝对路径, 如: E:/Xlinx/VivadoProject/ROM/(自己定)  
    9.      begin       
    10.         $readmemb ("D:/Xlinx/VivadoProject/CPU/rom_data.txt", rom); // 数据文件rom_data(.coe或.txt) 。 未指定, 就从0地址开始存放。  
    11.         //rom[addr][7:0] = 1'b00000100;  
    12.         dataOut = 0;  
    13.     end  
    14.       
    15.     always @( rd or addr ) begin  
    16.         if (rd==1) begin // 为0, 读存储器。 大端数据存储模式  
    17.             dataOut[31:24] = rom[addr];  
    18.             dataOut[23:16] = rom[addr+1];  
    19.             dataOut[15:8] = rom[addr+2];  
    20.             dataOut[7:0] = rom[addr+3];  
    21.         end  
    22.     end  
    23. endmodule  

    (3) ControlUnit
    作用:根据PC传出的指令,设置相关的控制信号,相关信号的设置,详见实验原理中的控制信号作用表

    代码:

    1.  module ControlUnit(  
    2.      input [5:0] op,  
    3.      input zero,  
    4.      output reg Reset,  
    5.      output reg PCWre,  
    6.      output reg ALUSrcA,  
    7.      output reg ALUSrcB,  
    8.      output reg DBDataSrc,  
    9.      output reg RegWre,  
    10.     output reg InsMemRW,  
    11.     output reg mRD,  
    12.     output reg mWR,  
    13.     output reg RegDst,  
    14.     output reg ExtSel,  
    15.     output reg [1:0] PCSrc,  
    16.     output reg [2:0] ALUOp  
    17.     );  

    (4) RegFile(寄存器组)
    作用:暂时存储指令操作过程中产生的数据。按照实验的要求,设置成8位的寄存器。而且根据输入的读取数据的地址,读取对应寄存器的数据,并根据输入信号RegWre,确定是否能够对寄存器进行写入操作。当RegWre为0时,无法进行写入操作,当RegWre为1时,进行写入操作

    代码:

    1.  module RegFile(CLK,RST,RegWre,ReadReg1,ReadReg2,WriteReg,WriteData,  
    2.      ReadData1,ReadData2);  
    3.      input CLK;  
    4.      input RST;  
    5.      input RegWre;  
    6.      input [4:0] ReadReg1,ReadReg2,WriteReg;  
    7.      input [31:0] WriteData;  
    8.      output [31:0] ReadData1,ReadData2;  
    9.        
    10.     reg [31:0] regFile[1:31]; // 寄存器定义必须用reg类型  
    11.       
    12.     initial begin  
    13.         for(i=1;i<32;i=i+1)  
    14.                 regFile[i] <= 0;  
    15.     end  
    16.     integer i;  
    17.     assign ReadData1 = (ReadReg1 == 0) ? 0 : regFile[ReadReg1]; // 读寄存器数据  
    18.     assign ReadData2 = (ReadReg2 == 0) ? 0 : regFile[ReadReg2];  
    19.       
    20.     always @ (negedge CLK or negedge RST) begin // 必须用时钟边沿触发  
    21.         if (RST==0) begin  
    22.             for(i=1;i<32;i=i+1)  
    23.             regFile[i] <= 0;  
    24.         end  
    25.         else if(RegWre == 1 && WriteReg != 0) // WriteReg != 0, $0寄存器不能修改  
    26.             regFile[WriteReg] <= WriteData; // 写寄存器  
    27.     end  
    28.       
    29. endmodule  

    (5) ALU
    作用:根据传入的控制信号,对传入的两个值进行相关的算术运算或逻辑运算,除了返回结果外,还有一个输出信号记录结果是否为0。

    代码:

    1.  module ALU(  
    2.      input [2:0] ALUopcode,  
    3.      input [31:0] rega,  
    4.      input [31:0] regb,  
    5.      output reg [31:0] result,  
    6.      output zero  
    7.      );  
    8.      initial  
    9.      begin  
    10.         result = 0;  
    11.     end  
    12.     assign zero = (result==0)?1:0;  
    13.     always @( ALUopcode or rega or regb ) begin  
    14.         case (ALUopcode)  
    15.             3'b000 : result = rega + regb;  
    16.             3'b001 : result = rega - regb;  
    17.             3'b010 : result = regb << rega;   
    18.             3'b011 : result = rega | regb;  
    19.             3'b100 : result = rega & regb;  
    20.             3'b101 : result = (rega < regb)?1:0; // 不带符号比较  
    21.             3'b110 : begin // 带符号比较  
    22.                 if(rega < regb && (rega[31] == regb[31]))result = 1;  
    23.                 else if (rega[31] == 1 && regb[31] == 0) result = 1;  
    24.                 else result = 0;  
    25.                 end  
    26.             3'b111 : result = rega ^ regb;  
    27.             default : begin  
    28.                 result = 32'h00000000;  
    29.                 $display (" no match");  
    30.                 end  
    31.         endcase  
    32.     end  
    33. endmodule  

    (6) RAM(数据存储器)
    作用:按照要求,利用8位的寄存器来存储数据。根据传入的控制信号来进行读写操作。当nRD为1时,进行读取操作,当为0时,不进行读取操作,并输出高阻态;当nWR为0时,进行写入操作,当为1时,不进行写入操作。

    代码:

    1.  module RAM(  
    2.      input clk,  
    3.      input [31:0] address,  
    4.      input [31:0] writeData, // [31:24], [23:16], [15:8], [7:0]  
    5.      input nRD, // 为0, 正常读; 为1,输出高组态  
    6.      input nWR, // 为1, 写; 为0, 无操作  
    7.      output [31:0] Dataout  
    8.      );  
    9.        
    10.     reg [7:0] ram [0:60]; // 存储器定义必须用reg类型  
    11.       
    12.     // 读  
    13.     //assign是随时赋值语句,Data有变化,随时写进到ram中去  
    14.     assign Dataout[7:0] = (nRD==1)?ram[address + 3]:8'bz; // z 为高阻态  
    15.     assign Dataout[15:8] = (nRD==1)?ram[address + 2]:8'bz;  
    16.     assign Dataout[23:16] = (nRD==1)?ram[address + 1]:8'bz;  
    17.     assign Dataout[31:24] = (nRD==1)?ram[address ]:8'bz;  
    18.     // 写  
    19.     always@( negedge clk ) begin // 用时钟下降沿触发写存储器, 个例  
    20.         if( nWR==0 ) begin  
    21.             ram[address] <= writeData[31:24];  
    22.             ram[address+1] <= writeData[23:16];  
    23.             ram[address+2] <= writeData[15:8];  
    24.             ram[address+3] <= writeData[7:0];  
    25.         end  
    26.     end  
    27. endmodule  

    (7) Pccounter
    作用:根据传入的信号,进行传入PC的新地址。当PCSrc为0时,新地址将读取下一条指令,即地址加4;当PCSrc为1时,在原有地址的基础上,跳转立即数的指令数目;当PCSrc为2时,跳转到j指令所指向的指令地址。

    代码:

    1.  module PCcounter(  
    2.      input [1:0] PCSrc,  
    3.      input [31:0] currentAddress,  
    4.      output reg [31:0] newAddress,  
    5.      input [31:0] outData,  
    6.      input [25:0] jAddress  
    7.      );  
    8.        
    9.      wire [31:0] temp_one, temp_two, temp_three;  
    10.     assign temp_one = currentAddress + 4;  
    11.     assign temp_two[25:0] = jAddress[25:0];  
    12.     assign temp_three = temp_two << 2;  
    13.     always@(PCSrc or currentAddress or outData or jAddress or temp_one)  
    14.         begin  
    15.             case(PCSrc)  
    16.                 2'b00:  newAddress = currentAddress+4;  
    17.                 2'b01:    
    18.                     begin  
    19.                         newAddress = (currentAddress+4)+ (outData << 2);  
    20.                         newAddress[1:0] = 1'b00;  
    21.                     end  
    22.                   
    23.                 2'b10:   
    24.                 begin  
    25.                      newAddress[31:28] = temp_one[31:28];  
    26.                      newAddress[27:0] = temp_three[27:0];  
    27.                 end  
    28.              endcase  
    29.         end  
    30. endmodule  

    (8) Sign、zero extend
    作用:根据传入的控制信号,对出入的数据进行相对应的拓展。当ExtSel为0时,对传入的立即数进行零拓展;当ExtSel为1时,对传入的立即数进行信号拓展。
    代码:

    1.  module Extend(  
    2.      input [15:0] immediate,  
    3.      input ExtSel,  
    4.      output reg[31:0] outData  
    5.      );  
    6.        
    7.      always@(immediate or ExtSel)  
    8.      begin  
    9.          case(ExtSel)  
    10.             1'b0:  
    11.                 begin  
    12.                     outData[15:0] = immediate;  
    13.                     outData[31:16] = 16'h0000;  
    14.                 end  
    15.             1'b1:  
    16.                 begin  
    17.                     outData[15:0] = immediate;  
    18.                     outData[31:16] = (immediate[15])? 16'hffff : 16'h0000;  
    19.                 end   
    20.         endcase  
    21.     end  
    22. endmodule  

    (9) 5bit_selecter
    作用:根据传入的控制信号,对两个传入的5位数据进行二选一操作。具体应用在选择rt或者rs作为写入地址。

    代码:

    1.  module select_5_bit(  
    2.      input [4:0] select_one,  
    3.      input [4:0] select_two,  
    4.      input control,  
    5.      output [4:0] result  
    6.      );  
    7.        
    8.      assign result = (control == 1'b0 ? select_one : select_two);  
    9.  endmodule  

    (10) 32bit_selecter
    作用:根据传入的控制信号,对两个传入的32位数据进行二选一操作。具体应用在传入ALU的数据A的选择、传入ALU的数据B的选择以及写入寄存器中数据的选择。

    代码:

    1.  module select_32_bit(  
    2.      input [31:0] select_one,  
    3.      input [31:0] select_two,  
    4.      input control,  
    5.      output [31:0] result  
    6.      );  
    7.        
    8.      assign result = (control == 1'b0 ? select_one : select_two);  
    9.  endmodule  

    2. CPU正确性的验证
    为验证所设计CPU的正确性,通过输入以下指令,观察结果来确认

    地址指令op(6)rs(5)rt(5)rd(5)/immediate (16)16进制数代码
    0x00000000addi 1, 1 , 0,800000100000000010000 0000 0000 1000= 04010008
    0x00000004ori 2, 2 , 0,201000000000000100000 0000 0000 001040400002
    0x00000008add 3, 3 , 2,$100000000010000010001 1000 0000 000000411800
    0x0000000Csub 5, 5 , 3,$200001000011000100010 1000 0000 000008622800
    0x00000010and 4, 4 , 5,$201000100101000100010 0000 0000 000044A22000
    0x00000014or 8, 8 , 4,$201001000100000100100 0000 0000 000048824000
    0x00000018sll 8, 8 , 8,101100000000010000100 0000 0100 000060084040
    0x0000001Cbne 8, 8 , 1,-2 (≠,转18)11000101000000011111 1111 1111 1110C501FFF2
    0x00000020slti 6, 6 , 2,801101100010001100000 0000 0000 10006C460008
    0x00000024slti 7, 7 , 6,001101100110001110000 0000 0000 00006CC70000
    0x00000028addi 7, 7 , 7,800000100111001110000 0000 0000 100004E70008
    0x0000002Cbeq 7, 7 , 1,-2 (=,转28)11000000111000011111 1111 1111 1110C0E1FFFE
    0x00000030sw 2,4( 2 , 4 ( 1)10011000001000100000 0000 0000 010098220004
    0x00000034lw 9,4( 9 , 4 ( 1)10011100001010010000 0000 0000 01009C290004
    0x00000038j 0x0000004011100000000000000000 0000 0001 0000E0000010
    0x0000003Caddi 10, 10 , 0,1000000100000010100000 0000 0000 1010040A000A
    0x00000040halt11111100000000000000000000000000 =FC000000
    0x00000044
    0x00000048
    0x0000004C

    测试代码跟其他的配置文件见文章开头的CSDN下载

    展开全文
  • 这是计算机组成原理课设,基于verilog实现单周期CPU代码,实现了add, addu, addi, addiu, sub, slt, and, or, xor, beq, j, sw, lw, lui,andi,addu,ori,xori,共18条指令,能够运行简单的冒泡排序。内含单周期...
  • 计算机组成原理课设要求做的31条单周期cpu,代码中有注释,可以根据需要适当修改
  • 包含测试代码和CPU实现代码。 实现的具体功能如下: 1.设计的CPU能够执行20条整数指令,每条指令的编码长度均为32位; 2.指令类型有:计算类型、访问存储器类型、条件转移类型和无条件转移类型等; 3.实现CPU的...
  • Verilog 单周期CPU代码 及汇编代码 完美运行各种代码
  • Verilog语言设计的多周期CPU,资源里包含了源代码及多周期CPU结构图,与大家分享下。 用Verilog语言设计的多周期CPU,资源里包含了源代码及多周期CPU结构图,与大家分享下。
  • 单周期CPU设计vivado

    2018-12-03 17:10:27
    单周期CPU设计的文件,语言verilog,打开之后,可以用vivado直接跑,思路是正确的,具体的指令需要根据要求做小幅度调整
  • 实现单周期CPU,本文首先研究了单周期CPU的相关理论和工作原理。本章首先简要介绍单周期CPU的基本概念,然后对CPU的工作原理进行简要分析,以便为单周期CPU的设计和开发提供理论基础。 1.1 单周期CPU概述 中央...

    第一章 单周期CPU的设计原理

    1.1 单周期CPU概述

    1.2 CPU工作原理

    第二章 单周期CPU的设计内容

    2.1 指令系统的设计

    2.1.1 概述

    2.1.2 运算类指令的设计

    2.1.3 传送类指令的设计

    2.1.4 存储类指令的设计

    2.1.5 控制类指令的设计

    2.2 整体框架的设计

    2.3 数据通路的设计

    2.4 控制信号的设计

    第三章 单周期CPU的具体实现

    3.1 底层模块的实现

    3.1.1 程序计数器PC

    3.1.2 指令存储器InstructionMemory

    3.1.3 寄存器组RegisterFile

    3.1.4 算术逻辑单元ALU

    3.1.5 数据存储器DataMemory

    3.1.6 控制单元ControlUnit

    3.2 顶层模块的实现

    第四章 单周期CPU的仿真验证

    4.1 测试程序

    4.2 波形仿真


    第一章 单周期CPU的设计原理

    为实现单周期CPU,本文首先研究了单周期CPU的相关理论和工作原理。本章首先简要介绍单周期CPU的基本概念,然后对CPU的工作原理进行简要分析,以便为单周期CPU的设计和开发提供理论基础。

    1.1 单周期CPU概述

    中央处理器,即CPU,作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。在CPU内部,电平从低到高变化的瞬间称为时钟上升沿,两个相邻时钟上升沿之间的时间间隔称为一个时钟周期。单周期CPU指的是一条指令的执行在一个时钟周期内完成,然后开始下一条指令的执行,即一条指令用一个时钟周期完成。

    1.2 CPU工作原理

    CPU在处理指令时,一般需要经过以下几个步骤:

    (1) 取指令(IF):根据程序计数器PC中的指令地址,从存储器中取出一条指令,同时,PC根据指令字长度自动递增产生下一条指令所需要的指令地址,但遇到“地址转移”指令时,则控制器把“转移地址”送入PC,当然得到的“地址”需要做些变换才送入PC。

    (2) 指令译码(ID):对取指令操作中得到的指令进行分析并译码,确定这条指令需要完成的操作,从而产生相应的操作控制信号,用于驱动执行状态中的各种操作。

    (3) 指令执行(EXE):根据指令译码得到的操作控制信号,具体地执行指令动作,然后转移到结果写回状态。

    (4) 存储器访问(MEM):所有需要访问存储器的操作都将在这个步骤中执行,该步骤给出存储器的数据地址,把数据写入到存储器中数据地址所指定的存储单元或者从存储器中得到数据地址单元中的数据。

    (5) 结果写回(WB):指令执行的结果或者访问存储器中得到的数据写回相应的目的寄存器中。

    CPU的指令处理过程如下:

     

    单周期CPU,是在一个时钟周期内完成这五个阶段的处理。

    第二章 单周期CPU的设计内容

    2.1 指令系统的设计

    2.1.1 概述

    本文所设计的单周期CPU的指令系统采用类似MIPS的设计风格,包括以下四类指令:

    (1) 运算类指令;

    (2) 传送类指令;

    (3) 存储类指令;

    (4) 控制类指令;

    其中,所有指令的操作码部分用4位二进制表示,寄存器编号用3位二进制表示。在下述的具体设计表示中,以助记符表示的是汇编指令;以代码表示的则是二进制机器指令。

    2.1.2 运算类指令的设计

    运算类指令共有8条,具体的指令功能与指令格式如下:

    (1) add rd,rs,rt

    0000

    rs(3位)

    rt(3位)

    rd(3位)

    reserved(未用)

    功能:将寄存器rs和rt中的值相加并将结果写回寄存器rd。reserved为预留部分,即未用,一般填“0”。

    (2) addi rt,rs,immediate

    0001

    rs(3位)

    rt(3位)

    immediate(6位)

    功能:将立即数immediate进行符号扩展后再和寄存器rs中的值相加并将结果写回寄存器rt。

    (3) sub rd,rs,rt

    0010

    rs(3位)

    rt(3位)

    rd(3位)

    reserved(未用)

    功能:用寄存器rs中的值减去rt中的值并将结果写回寄存器rd。reserved为预留部分,即未用,一般填“0”。

    (4) or rd,rs,rt

    0011

    rs(3位)

    rt(3位)

    rd(3位)

    reserved(未用)

    功能:将寄存器rs和rt中的值进行按位或运算并将结果写回寄存器rd。reserved为预留部分,即未用,一般填“0”。

    (5) ori rt,rs,immediate

    0100

    rs(3位)

    rt(3位)

    immediate(6位)

    功能:将立即数immediate进行“0”扩展后再和寄存器rs中的值进行按位或运算并将结果写回寄存器rt。

    (6) and rd,rs,rt

    0101

    rs(3位)

    rt(3位)

    rd(3位)

    reserved(未用)

    功能:将寄存器rs和rt中的值进行按位与运算并将结果写回寄存器rd。reserved为预留部分,即未用,一般填“0”。

    (7) sll rd,rt,sa

    0110

    未用(3位)

    rt(3位)

    rd(3位)

    sa(3位)

    功能:先将sa表示的立即数进行“0”拓展,然后将寄存器rt中的值左移sa位并将结果写回寄存器rd。

    (8) slt rd,rs,rt

    0111

    rs(3位)

    rt(3位)

    rd(3位)

    reserved(未用)

    功能:将寄存器rs和rt中的值作为带符号数进行比较,若rs中的值更小,则将寄存器rd中的值置1,否则置0。

    2.1.3 传送类指令的设计

    传送类指令共有2条,具体的指令功能与指令格式如下:

    (1) mov rd,rt

    1000

    未用(3位)

    rt(3位)

    rd(3位)

    reserved(未用)

    功能:将寄存器rt中的值传送到寄存器rd。reserved为预留部分,即未用,一般填“0”。

    (2) movi rt,immediate

    1001

    未用(3位)

    rt(3位)

    immediate(6位)

    功能:将立即数immediate进行符号扩展后传送到寄存器rt。

    2.1.4 存储类指令的设计

    存储类指令共有2条,具体的指令功能与指令格式如下:

    (1) sw  rt,immediate(rs)

    1010

    rs(3位)

    rt(3位)

    immediate(6位)

    功能:将寄存器rt中的值存储到内存中,存储单元的地址为寄存器rs中的值加上经符号拓展的立即数immediate。

    (2) lw  rt,immediate(rs)

    1011

    rs(3位)

    rt(3位)

    immediate(6位)

    功能:将内存中的值加载到寄存器rt中,存储单元的地址为寄存器rs中的值加上经符号拓展的立即数immediate。

    2.1.5 控制类指令的设计

    控制类指令共有4条,具体的指令功能与指令格式如下:

    (1) beq  rs,rt,immediate

    1100

    rs(3位)

    rt(3位)

    immediate(6位)

    功能:比较寄存器rs和rt中的值,若相等则跳转到目标处执行,否则继续执行下一条指令。跳转的目标地址与当前指令的下一条指令的相对位移由立即数immediate给出。

    (2) bgtz  rs,immediate

    1101

    rs(3位)

    000

    immediate(6位)

    功能:判断寄存器rs中的值是否大于0,若大于0则跳转到目标处执行,否则继续执行下一条指令。跳转的目标地址与当前指令的下一条指令的相对位移由立即数immediate给出。

    (3) j  addr

    1110

    addr(12位)

    功能:执行无条件跳转,跳转的目的地址组成如下:高3位为PC中值的高3位,第1-12位由addr给出,最低位为0。

    (4) halt

    1111

    000000000000(12位)

    功能:停机指令,不改变PC的值,PC保持不变。

    2.2 整体框架的设计

    本文所设计的单周期CPU的整体框架主要包括七部分:程序计数器、指令寄存器、寄存器组、算术逻辑单元、数据存储器、控制单元和顶层模块。具体框架如下:

    2.3 数据通路的设计

    本文所设计的单周期CPU的数据通路如下:

    其中Ins.MEM为指令存储器,Data.MEM为数据存储器。访问存储器时,先给出内存地址,然后由读或写信号控制操作。对于寄存器组Register File,先给出寄存器编号,读操作时,输出端就直接输出相应数据;而在写操作时,当写使能信号为1时,在时钟边沿触发将数据写入寄存器。

    主要模块接口说明如下:

    (1) Instruction Memory:指令存储器。

    IAddr,指令存储器地址输入端口

    IDataOut,指令存储器数据输出端口(指令代码输出端口)

    InsMemRW,指令存储器读写控制信号,为0写,为1读

    (2) Data Memory:数据存储器。

    DAddr,数据存储器地址输入端口

    DataIn,数据存储器数据输入端口

    DataOut,数据存储器数据输出端口

    RD,数据存储器读控制信号,为0读

    WR,数据存储器写控制信号,为0写

    (3) Register File:寄存器组。

    Read Reg1,rs寄存器地址输入端口

    Read Reg2,rt寄存器地址输入端口

    Write Reg,将数据写入的寄存器端口,其地址来源为rt或rd字段

    Write Data,写入寄存器的数据输入端口

    Read Data1,rs寄存器数据输出端口

    Read Data2,rt寄存器数据输出端口

    WE,写使能信号,为1时,在时钟边沿触发写入

    (4) ALU:算术逻辑单元。

    A,操作数A输入端口

    B,操作数B输入端口

    result,ALU运算结果

    zero,运算结果标志,结果为0,则zero=1;否则zero=0

    sign,运算结果标志,结果最高位为0,则sign=0,正数;否则,sign=1,负数

    2.4 控制信号的设计

    本文所设计的单周期CPU的各控制信号如下:

     各控制信号的功能如下:

    控制信号名

    状态“0”

    状态“1”

    Reset

    初始化PC为0

    PC接收新地址

    PCWre

    PC不更改,相关指令:halt

    PC更改,相关指令:除指令halt外

    ALUSrcA

    来自寄存器堆data1输出,相关指令:add、addi、sub、or、ori、and、slt、mov、movi、beq、bgtz、sw、lw

    来自经过“0”拓展的移位数sa,即 {{13{0}},sa},相关指令:sll

    ALUSrcB

    来自寄存器堆data2输出,相关指令:add、sub、or、and、sll、slt、mov、beq、bgtz

    来自sign或zero扩展的立即数,相关指令:addi、ori、movi、sw、lw

    DBDataSrc

    来自ALU运算结果的输出,相关指令:add、addi、sub、or、ori、and、sll、slt、mov、movi

    来自数据存储器(Data MEM)的输出,相关指令:lw

    RegWre

    寄存器组写不使能,相关指令:sw、beq、bgtz、j、halt

    寄存器组写使能,相关指令:add、addi、sub、or、ori、and、sll、slt、mov、movi、lw

    InsMemRW

    写指令存储器

    读指令存储器

    RD

    读数据存储器,相关指令:lw

    无操作

    WR

    写数据存储器,相关指令:sw

    无操作

    RegDst

    写寄存器组寄存器的地址,来自rt字段,相关指令:addi、ori、movi、lw

    写寄存器组寄存器的地址,来自rd字段,相关指令:add、sub、or、and、sll、slt、mov

    ExtSel

    (zero-extend)immediate0扩展),相关指令:ori

    (sign-extend)immediate符号扩展,相关指令:addi、movi、sw、lw、beq、bgtz

    PCSrc[1..0]

    00:pc<-pc+2,相关指令:add、addi、sub、or、ori、and、sll、slt、sw、lw、beq(zero=0)、bgtz(sign=1,或zero=1);

    01:pc<-pc+2+(sign-extend)immediate,相关指令:beq(zero=1)、bgtz(sign=0,zero=0);

    10:pc<-{(pc+2)[15..13],addr[12..1],0},相关指令:j;

    11:未用

    ALUOp[2..0]

    ALU 8种运算功能选择(000-111),具体见ALU功能表

    ALU运算功能表如下:

    ALUOp[2..0]

    功能

    描述

    000

    Y = A+B

    001

    Y = A-B

    010

    Y = B<<A

    B左移A位

    011

    Y = A∨B

    100

    Y = A∧B

    101

    Y=(A<B)?1: 0

    比较A与B

    不带符号

    110

    if (A<B && (A[15] == B[15] ) )

        Y = 1;

    else if ( A[15] && !B[15)  Y = 1;

    else Y = 0; 

    比较A与B

    带符号

    111

    Y = B

    直送

    在具体进行控制时,PC的改变是在时钟上升沿进行的,指令执行的结果总是在时钟下降沿保存到寄存器和存储器中,这样稳定性较好。

    第三章 单周期CPU的具体实现

    3.1 底层模块的实现

    单周期CPU每个时钟周期可被划分为五个阶段,对应的有五个最关键的底层模块:IF阶段对应PC,ID阶段对应InstructionMemory和RegisterFile,EXE阶段对应ALU,MEM阶段对应DataMemory,WB阶段也对应RegisterFile。除此之外,还需要生成控制信号的控制单元(ControlUnit)等。下面具体介绍上述各主要模块的设计与实现。

    3.1.1 程序计数器PC

    PC为时序逻辑,在时钟上升沿到来时,若PCWre为1,则输出下一条待处理的指令地址,否则不输出新的指令地址。若Reset为0,则设置输出的指令地址为0。具体代码如下:

    module PC(    
        input clk,    
        input [15:0] PCin,    
        input PCWre,    
        input Reset,    
        output reg [15:0] PCout    
    );    
          
        initial begin    
            PCout <= 0;   
        end  
            
        always@(posedge clk) begin    
            if(Reset == 0) begin    
                PCout <= 0;    
            end    
            else if(PCWre == 0) begin    
                PCout <= PCout;    
            end    
            else begin    
                PCout <= PCin;    
            end    
        end  
            
    endmodule    
    

    3.1.2 指令存储器InstructionMemory

    InstructionMemory为组合逻辑,内含128个字节的mem。mem中存放要执行的测试程序段的机器码,使用initial语句中的$readmemb伪指令从Instructions.txt文件中读取出来。当输入一个16位长的指令地址,输出对应地址中的16位机器指令。具体代码如下:

    module InsMemory(    
        input InsMemRW,    
        input [15:0] address,    
        output reg [15:0] DataOut    
    );    
    
        reg [7:0] mem [0:127];   
    
        initial begin    
            DataOut = 16'b1111000000000000;  
            $readmemb("Instructions.txt", mem);      
        end   
          
        always@(*) begin   
            DataOut[15:8] <= mem[address];    
            DataOut[7:0] <= mem[address+1];  
        end   
           
    endmodule    
    

    3.1.3 寄存器组RegisterFile

    RegisterFile中定义了一个含有8个寄存器的寄存器组,设计逻辑包括两部分:一方面,读寄存器组为组合逻辑,当输入一个3位长的寄存器编号时,输出对应寄存器中的数值。另一方面,写寄存器组是时序逻辑,在时钟下降沿到来时触发写入。具体代码如下:

    module RegFile(    
        input CLK,    
        input RST,    
        input RegWre,    
        input [2:0] ReadReg1,    
        input [2:0] ReadReg2,    
        input [2:0] WriteReg,    
        input [15:0] WriteData,    
        output [15:0] ReadData1,    
        output [15:0] ReadData2    
    );    
      
        reg [15:0] regFile[0:7];  
           
        integer i;    
          
        assign ReadData1 = regFile[ReadReg1];   
        assign ReadData2 = regFile[ReadReg2];  
            
        always @ (negedge CLK) begin    
            if (RST == 0) begin    
                for(i=1;i<8;i=i+1)    
                    regFile[i] <= 0;    
            end    
            else if(RegWre == 1 && WriteReg != 0) begin    
                regFile[WriteReg] <= WriteData;    
            end    
        end    
                
    endmodule    
    

    3.1.4 算术逻辑单元ALU

    ALU为组合逻辑,根据控制信号对两个操作数进行相应的运算,并输出结果。具体代码如下:

    module ALU(    
        input [2:0] ALUopcode,    
        input [15:0] rega,    
        input [15:0] regb,    
        output reg [15:0] result,    
        output zero,    
        output sign    
    );    
      
        assign zero = (result==0)?1:0;    
        assign sign = result[15];    
          
        always @( ALUopcode or rega or regb ) begin    
            case (ALUopcode)    
                3'b000 : result = rega + regb;    
                3'b001 : result = rega - regb;    
                3'b010 : result = regb << rega;    
                3'b011 : result = rega | regb;    
                3'b100 : result = rega & regb;    
                3'b101 : result = (rega < regb)?1:0;     
                3'b110 : begin    
                    if (rega<regb &&(( rega[15] == 0 && regb[15]==0) ||    
                    (rega[15] == 1 && regb[15]==1))) result = 1;    
                    else if (rega[15] == 0 && regb[15]==1) result = 0;    
                    else if ( rega[15] == 1 && regb[15]==0) result = 1;    
                    else result = 0;    
                end    
                3'b111 : result = regb;    
            endcase    
        end   
           
    endmodule    
    

    3.1.5 数据存储器DataMemory

    DataMemory中包含128个字节的ram,设计逻辑包括两部分:一方面,读存储器为组合逻辑,当输入一个16位长的数据地址时,输出对应地址中的16位数据。另一方面,写存储器是时序逻辑,在时钟下降沿到来时触发写入。具体代码如下:

    module DataMemory(    
        input clk,    
        input [15:0] address,    
        input RD,    
        input WR,    
        input [15:0] DataIn,    
        output [15:0] DataOut    
    );    
        
        reg [7:0] ram[0:127];  
            
        integer i;    
          
        initial begin;    
            for(i=0;i<128;i=i+1)    
                ram[i]<=0;    
        end    
           
        assign DataOut[7:0] = (RD == 0)? ram[address+1]:8'bz;    
        assign DataOut[15:8] = (RD == 0)? ram[address]:8'bz;    
       
        always@(negedge clk) begin    
            if(WR == 0) begin    
                if(address>=0 && address<128) begin    
                    ram[address] <= DataIn[15:8];    
                    ram[address+1] <= DataIn[7:0];     
                end    
            end    
        end  
            
    endmodule    
    

    3.1.6 控制单元ControlUnit

    ControlUnit为组合逻辑,将机器码中的操作码(opcode)转换为各个控制信号,从而控制不同的指令在不同的数据通路中传输。具体代码如下:

    module ControlUnit(    
        input [3:0] opcode,    
        input zero,    
        input sign,    
        output reg PCWre,    
        output reg ALUSrcA,    
        output reg ALUSrcB,    
        output reg DBDataSrc,    
        output reg RegWre,    
        output reg InsMemRW,    
        output reg RD,    
        output reg WR,    
        output reg RegDst,    
        output reg ExtSel,    
        output reg [1:0] PCSrc,    
        output reg [2:0] ALUOp    
    );    
      
        initial begin    
            RD = 1;    
            WR = 1;    
            RegWre = 0;   
            PCWre = 0;   
            InsMemRW = 1;    
        end   
           
        always@ (opcode) begin    
            case(opcode)     
                4'b0000:begin // add    
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 0;    
                    DBDataSrc = 0;    
                    RegWre = 1;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    RegDst = 1;    
                    ALUOp = 3'b000;    
                end    
                4'b0001:begin //addi    
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 1;    
                    DBDataSrc = 0;    
                    RegWre = 1;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    RegDst = 0;    
                    ExtSel = 1;    
                    ALUOp = 3'b000;    
                end    
                4'b0010:begin //sub    
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 0;    
                    DBDataSrc = 0;    
                    RegWre = 1;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    RegDst = 1;    
                    ALUOp = 3'b001;    
                end  
                4'b0011:begin // or    
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 0;    
                    DBDataSrc = 0;    
                    RegWre = 1;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    RegDst = 1;    
                    ALUOp = 3'b011;    
                end     
                4'b0100:begin // ori    
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 1;    
                    DBDataSrc = 0;    
                    RegWre = 1;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    RegDst = 0;    
                    ExtSel = 0;    
                    ALUOp = 3'b011;    
                end    
                4'b0101:begin //and    
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 0;    
                    DBDataSrc = 0;    
                    RegWre = 1;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    RegDst = 1;    
                    ALUOp = 3'b100;    
                end    
                4'b0110:begin //sll    
                    PCWre = 1;    
                    ALUSrcA = 1;    
                    ALUSrcB = 0;    
                    DBDataSrc = 0;    
                    RegWre = 1;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    RegDst = 1;    
                    ALUOp = 3'b010;    
                end    
                4'b0111:begin //slt    
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 0;    
                    DBDataSrc = 0;    
                    RegWre = 1;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    RegDst = 1;    
                    ALUOp = 3'b110;    
                end  
                4'b1000:begin //mov    
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 0;    
                    DBDataSrc = 0;    
                    RegWre = 1;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    RegDst = 1;    
                    ExtSel = 1;    
                    ALUOp = 3'b111;    
                end  
                4'b1001:begin //movi    
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 1;    
                    DBDataSrc = 0;    
                    RegWre = 1;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    RegDst = 0;    
                    ExtSel = 1;    
                    ALUOp = 3'b111;    
                end      
                4'b1010:begin //sw    
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 1;    
                    RegWre = 0;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 0;    
                    ExtSel =1;    
                    ALUOp = 3'b000;    
                end    
                4'b1011:begin //lw    
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 1;    
                    DBDataSrc = 1;    
                    RegWre = 1;    
                    InsMemRW = 1;    
                    RD = 0;    
                    WR = 1;    
                    RegDst = 0;    
                    ExtSel = 1;    
                    ALUOp = 3'b000;    
                end   
                4'b1100:begin //beq    
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 0;    
                    RegWre = 0;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    ExtSel = 1;    
                    ALUOp = 3'b001;    
                end    
                4'b1101:begin  //bgtz  
                    PCWre = 1;    
                    ALUSrcA = 0;    
                    ALUSrcB = 0;    
                    RegWre = 0;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    ExtSel = 1;    
                    ALUOp = 3'b001;    
                end    
                4'b1110:begin //j    
                    PCWre = 1;    
                    RegWre = 0;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                    ALUOp = 3'b010;    
                end    
                4'b1111:begin //halt    
                    PCWre = 0;    
                    RegWre = 0;    
                    InsMemRW = 1;    
                    RD = 1;    
                    WR = 1;    
                end    
                default:begin    
                    RD = 1;    
                    WR = 1;    
                    RegWre = 0;    
                    InsMemRW = 0;    
                end    
            endcase    
        end   
           
        always@(opcode or zero or sign) begin    
            if(opcode == 4'b1110) // j    
                PCSrc = 2'b10;    
            else if(opcode == 4'b1100) begin  
                if(zero == 1)  
                    PCSrc = 2'b01;  
                else  
                    PCSrc = 2'b00;  
            end  
            else if(opcode == 4'b1101) begin  
                if(zero == 0 && sign == 0)    
                    PCSrc = 2'b01;    
                else    
                    PCSrc = 2'b00;  
            end    
            else begin    
                PCSrc = 2'b00;    
            end    
        end   
           
    endmodule    
    

    3.2 顶层模块的实现

    在顶层模块中,通过实例化各个底层模块,并使用导线将它们按照数据通路图连接起来,构成单周期CPU的完整结构,具体原理图如下:

    第四章 单周期CPU的仿真验证

    根据上述实现的单周期CPU,利用指令系统中所有的指令设计一个测试程序,对该CPU进行如下仿真验证。

    4.1 测试程序

    使用该指令系统中所有指令,设计出如下一段具有实际意义的测试程序。该程序计算数字1到5的和以及按位或的和,并将两者中较大者存储到内存中地址为14的存储单元中,最后读出该存储单元中的值。具体指令序列如下:

    地址

    汇编程序

    机器指令代码(二进制)

    0x0000

    movi     $0,0

    10010000 00000000

    0x0002

    mov      $1,$0

    10000000 00001000

    0x0004

    and      $3,$1,$0

    01010010 00011000

    0x0006

    addi      $2,$0,6

    00010000 10000110

    0x0008

    ori      $3,$0,1

    01000000 11000001

    0x000A

    add      $5,$0,$3

    00000000 11101000

    0x000C

    or       $6,$1,$3

    00110010 11110000

    0x000E

    mov      $0,$5

    10000001 01000000

    0x0010

    mov      $1,$6

    10000001 10001000

    0x0012

    addi      $4,$3,1

    00010111 00000001

    0x0014

    mov      $3,$4

    10000001 00011000

    0x0016

    beq      $3,$2,1

    11000110 10000001

    0x0018

    j         5

    11100000 00000101

    0x001A

    slt      $5,$0,$1

    01110000 01101000

    0x001C

    movi     $4,4

    10010001 00000100

    0x001E

    sub     $6,$2,$4

    00100101 00110000

    0x0020

    sll       $7,$6,1

    01100001 10111001

    0x0022

    bgtz      $5,2

    11011010 00000010

    0x0024

    sw      $0,10($7)

    10101110 00001010

    0x0026

    j         21

    11100000 00010101

    0x0028

    sw      $1,10($7)

    10101110 01001010

    0x002A

    lw       $6,10($7)

    10111111 10001010

    0x002C

    halt

    11110000 00000000

    4.2 波形仿真

    在仿真过程中,设置如下输入和输出,并显示如下寄存器中的内容:

    输入

    clk

    CPU时钟信号,周期为10ns

    reset

    CPU复位信号,0为复位

    输出

    nowIns

    当前指令

    nextPC

    下一条指令地址

    nowPC

    当前PC地址

    ALUSrcA

    ALU操作数A

    ALUSrcB

    ALU操作数

    ALUResult

    ALU运算结果

    finalData

    写回的结果

    寄存器

    RegFile[0]-RegFile[7]

    寄存器组

    DataMemory[10]-DataMemory[15]

    数据存储器

    仿真结果如下:

    (1) movi $0,0至ori $3,$0,1

    (2) add $5,$0,$3至j 5 (第一轮循环)

    (3) add $5,$0,$3至j 5 (第二轮循环)

    (4) add $5,$0,$3至j 5 (第三轮循环)

    (5) add $5,$0,$3至j 5 (第四轮循环)

    (6) add $5,$0,$3至beq $3,$2,1 (第五轮循环)

    (7) slt $5,$0,$1至sll $7,$6,1

    (8) bgtz $5,2至halt

     

    展开全文
  • 本项目主要利用Verilog语言设计一一个基于MIPS架构的CPU。分别设计指令存储器、寄存器堆、ALU、取指令部件、数据存储器、立即数处理单元、主单元控制器、ALU控制单元。将这些单元连城数据通路,再结合控制单元合成...
  • 内含CPU所有Verilog源码、论文详细解析,作业成绩为优秀 所有代码和论文皆为原创,严禁二次转载!
  • 16位单周期处理器的verilog实现。包括存储模块和仿真模块,结构很清晰,大学计算机组成原理课程必备。
  • 单周期CPU 简单的单周期RISC-V CPU 目录 目录结构 ├── Core │ ├── ALU │ │ ├── AddSubUnit │ │ │ ├── add_sub32.v │ │ │ └── CLA │ │ │ ├── cla_16bit.v │ │ │ ├...
  • 包含测试代码和CPU实现代码。 实现的具体功能如下: 1.设计的CPU能够执行20条整数指令,每条指令的编码长度均为32位; 2.指令类型有:计算类型、访问存储器类型、条件转移类型和无条件转移类型等; 3.实现CPU的...
  • Verilog单周期CPU设计(超详细)

    万次阅读 多人点赞 2019-01-19 12:27:24
    实验 单周期CPU一、设计目的与目标实验内容实验要求二、课程设计器材硬件平台软件平台三、 CPU逻辑设计总体方案指令模块MIPS指令格式指令处理流程数据通路总体结构图设计流程逻辑图四、模块详细设计PCAdd4...
  • 这是计算机组成原理课设,基于verilog实现单周期CPU代码,实现了add, addu, addi, addiu, sub, slt, and, or, xor, beq, j, sw, lw, lui,andi,addu,ori,xori,共18条指令,能够运行简单的冒泡排序。内含实验...
  • verilog HDL语言或者VHDL语言来编写,实现单周期CPU的设计。 用Verilog HDL语言编写MIPS32单周期CPU程序 (1)理解MIPS常用的指令系统并掌握单周期CPU的工作原理与逻辑功能实现。 (2)通过对单周期CPU的运行...
  • 单周期CPU设计verilog

    2017-05-10 22:42:35
    单周期CPU设计verilog,课程设计
  • verilog单周期CPU设计

    2017-12-03 16:48:16
    支持指令集为:{addu, subu, ori, lw, sw, beq, lui, jal, jr,nop,sll,j,lh,sh}。 处理器为单周期设计。
  • 本资源包含了计算机组成原理课程最后的课程设计的所有相关资源、代码、PPT以及实验报告。其中包含了minisys的工程文件,打开即可看到,本课设还包含了外设的使用,也录制了相关使用外设的演示视频如蜂鸣器(音节和...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,686
精华内容 674
关键字:

verilog实现单周期cpu