精华内容
下载资源
问答
  • 指令集

    千次阅读 2016-03-24 18:00:55
     转载自 ... 一个完整的指令集结构包括 Instuction Fetch  Instuction Decode Operand Fetch Excute Result Store Next Instruction
    

    转载自 http://www.cnblogs.com/li-daphne/p/4067241.html


    一个完整的指令集结构包括

    Instuction Fetch 
    Instuction Decode
    Operand Fetch
    Excute
    Result Store
    Next Instruction

     我们必须解决的问题包括:

    1. 指令的编码方式(即如何编码)
    2. 操作数和操作结构的存放位置
      1. 存放位置
      2. 多少个现实操作数
      3. 存储器操作数如何定位
      4. 那些操作数可以或不可以放到存储器中
    3. 数据的类型和大小
    4. 支持哪些操作
    5. 下一条指令的地址
      1. jumps,conditions,branches
      2. fetch-decode-execute is implicit
    • 有关ISA的若干问题
      • 分类
        • stack   0 address ADD tos<---tos+next
          Accumulator 1 address ADD A  acc<---acc+mem[A]
          1+x address ADDX A acc<---acc+mem[A+x]
          Register-memory 2 address ADD A B EA[A]<---EA[A]
          3 address add A B C EA[A]<---EA[B]+EA[C]
          Load-Store 3 address add  A B C A<---B+C
          load A B A<---mem[B]
        • 通用寄存器型(R-M   R-R)占主导地位
          • 寄存器比存储器更快
          • 对便一起来说寄存器更容易使用
        • 尾端问题
            • little endian,big endian,在一个字内部的字节顺序问题,例如在地址xxx00指定了一个字(int),存储器中从xxx00连续存放ffff0000,有两种表示方式:
              • 小端方式:xxx00位置是字的最低字节,数值为0000ffff。x86,dec vax,windows NT
              • 大端方式:xxx00位置是字的最高字节,数值为ffff0000。IBM 360/370,Motorola,MIPS
        • 对齐问题
          • 对一个s字节的对象访问,地址为A,如果A mod s ==0,则是边界对齐
          • 这是由于存储器本身的读写要求的。没有对其的对象可能会导致存储器两次读写。
        •  基准测试结果:
          • 偏移寻址、立即数寻址、寄存器寻址方式,其使用频度为75%~99%
          • 偏移字段大小为12~16bits,可满足75%~99%的需求
          • 立即数字段大小为8~16bits,可满足50%~80%的需求

     


    操作数类型和操作数表示

    类型:是面向应用、面向软件系统处理的各种操作数据类型。整型、浮点型、字符、字符串、向量类型;类型由操作码确定。

    表示:操作数在机器中的表示,硬件结构能够识别,指令系统可以直接使用的表示格式。整型(原码、补码、反码),浮点(IEE 754标准),十进制(BCD码,二进制十进制表示)


    • ISA研究的问题
      • ISA的分类
      • 操作数部分
        • 理解存储器地址(尾端+对齐问题)
        • 寻址方式
        • 操作数的类型、表示和大小问题
      • 操作码部分
        • 支持哪些类型的操作
      • 指令格式
    • 研究的方法:基于统计的方法
    • 结论:
      • 常用的寻址方式:立即数、偏移寻址、寄存器寻址
      • 偏移字段的大小:12~16bits
      • 立即数字段的大小8~16bits
      • 操作数大小:单字、双字的数据访问频率高;64字长更具一般性
    • ISA的功能设计
      • 任务:确定硬件支持哪些操作
      • 方法:统计
      • 类型:CICS和RISC
    • 控制类指令
      • 条件分支最常见
      • 寻址方式:pc-relative和偏移地址至少8位;即动态的转移地址方式
    • CISC
      • 强化指令功能,减少程序中指令条数

    RISC计算机指令集结构的功能设计

    • 特点:
      • 大多数指令在单周期内完成
      • 采用load、store结构
      • 硬布线控制逻辑
      • 减少指令和寻址方式种类
      • 固定的指令格式
      • 注重代码的优化
      • 面向寄存器结构
      • 重视流水线的执行效率--》尽量减少断流
      • 重视优化编译技术
    • RISC为了使流水线高效执行
      • 简单而统一的指令译码
      • 大部分指令可以单周期完成
      • 只有load/store指令访存
      • 简单寻址技术
      • 采用load延迟技术
    • 为了便于优化编译产生优化代码
      • 三地址指令格式
      • 较多适量的寄存器
      • 对称的指令格式
    • RISC的关键技术
      • 延迟转移技术
      • 指令取消技术
      • 重叠寄存器窗口技术
        • 处理器中设置多个寄存器堆,并划分多个窗口
        • 每个过程使用其中相邻的三个窗口和一个公共的窗口
        • 一个与前一个过程公用;一个与下一个过程公用;一个作为局部寄存器
      • 指令调整技术
      • 硬件为主,固件为辅
    • 频率较高的指令:load,store,add,subtract,move register-register,and,shift,compare equal,compare not equal,branch,jump,call,return
    • 控制类指令:conditional branch,jump,procedure calls,procedure returns
    • 控制类指令的寻址方式:pc-relative
      • 编译时不知道转移地址,程序执行时动态确定
      • 转移地址放到某一寄存器中

     


    • 指令编码方式
      • 长度可变
      • 长度固定
      • 混合
      MIPS寻址方式/指令格式(所有指令都是32bit)
      • 寄存器直接寻址
      • 立即数寻址
      • 基址寻址
      • pc相对寻址
      • 寄存器间接寻址

     

    现代编译技术与计算机体系结构设计

    • ISA设计需要了解的有挂compiler的问题
      • 如何分配变量
        • 高级语言分配数据的区域
          • stack
            • 用来分配局部变量;用来存储活动记录(call和return),工作堆栈指针访问其中的内容
          • global data area
            • 用来分配被静态说明的对象,如常亮和全局变量、其中数组和其他聚集类型的数据结构比例大。
          • heap
            • 分配动态对象,用指针访问,通常不是标量。全局变量和堆变量因为存在别名问题而无法分配寄存器
      • 如何寻址变量
      • 需要多少寄存器
      • 优化技术对指令使用频率的影响
      • 使用哪些控制结构
    • MIPS指令集结构
      • MIPS的寄存器
        • 32个64bit通用寄存器(GPRS)
          • r0,r1,...,r31
          • 整数寄存器
          • r0 = 0
        • 32个64bit浮点寄存器(FPRS)
          • f0,f1,...,f31
          • 用来存放32个单精度浮点数(32bit),也可以用来存放32个双精度浮点数(64bit)
          • 存放单精度数时,只用了FPR的一半;
        • 一些特殊寄存器
          • 可以与通用寄存器交换数据
          • 浮点状态寄存器保存浮点操作的结果
      • MIPS的数据表示
        • 整数
          • 字节8bit ;半字16bit;字32bit;双字64bit
          • 浮点数 单精度(32bit),双精度(64bit)
          • 字节、半字、字被装入64位寄存器时,零扩展或符号扩展。
      • 寻址方式
        • 立即数寻址和偏移量寻址,其立即数、偏移量字段都是16bit
        • 寄存器间接寻址是通过把0作为偏移量来实现的
        • 16bit绝对寻址是通过把R0作为基址寄存器来实现
        • mips的存储器按字节寻址,地址为64bit
        • 所有的存储器访问都是边界对齐
      • 指令格式
        • 寻址方式编码到操作码中
        • 所有指令都是32bit
        • 操作码占6bit
        • 3中指令格式
          • I类指令
            • ,立即数字段为16bit,用于提供立即数和偏移量
            • load指令

              访存有效地址:Regs[rs]+immediate

              从存储器取来的数据放入寄存器rt中
              store指令 访存有效地址:Regs[rs]+immediate 从存储器取来的数据放入寄存器rt中
              立即数指令 Regs[rt]<---Regs[rs] op immediate
              分支指令 目标转移地址:Regs[rs]+immediate rt无用
              寄存器跳转、寄存器跳转并连接 转移目标地址为Regs[rs]
          • R类指令
            • 包括ALU指令,专用寄存器读/写指令,move指令
            • ALU指令     Regs[rd]<---Regs[rs] func Regs[rt],func为具体的运算操作编码
          • J类指令
            • 包括跳转指令、跳转并连接指令、自陷指令、异常返回指令;
            • 指令字的低26位是偏移量,左移两位,与pc值相加,形成跳转的地址。
      • 指令的分类(load/store,ALU操作,分支与跳转,浮点操作)
        • 符号的意义
          • x<---ny:从y传送n位到x
          • x,y<---z:把z传送到x和y
          • 下标:表示字段中具体的位;对于指令和数字,按从最高位到最低位(左--》右)顺序依次编号,最高位为第0位,次高位为第1位。
            • 下表可以是数字或者一个范围;Regs[R4]0,即R4的符号位;Regs[R4]56...63的最低位
          • Mem:表示主存,按字节寻址
          • 上标:用于表示对字段进行复制的次数;032一个32位全0的字段
          • 符号##,用于连个字段的拼接,并且可以出现在数据传送的任何一边。eg,R8、R10为64位的寄存器,则Regs[R8]32..63<---32(Mem[Regs[R6]]0)24##Mem[Regs[R6]];表示的是,以R6的内容作为地址访问内存,得到的字节按符号位扩展的32位后存入R8的低32位,R8的高32位(即Regs[R8]0..31)不变。
        • LD R2,20(R3) 装入双字 Regs[R2]<---64(Mem[20+Regs[R3]])
          LW R2,40(R3) 装入字 Regs[R2]<---64(Mem[40+Regs[R3]]0)32 ## Mem[40+Regs[R3]]
          LB R2,30(R3) 装入字节 Regs[R2]<---64(Mem[30+Regs[R3]]0)56 ## Mem[40+Regs[R3]]
          LBU R2,40(R3) 装入无符号字节 Regs[R2]<---64056 ## Mem[40+Regs[R3]]
          LH R2,30(R3) 装入半字 Regs[R2]<---64(Mem[30+Regs[R3]]0)48 ## Mem[30+Regs[R3]]##Mem[31+Regs[R3]]
          L.S F2,60(R4) 装入半字 Regs[F2]<---64Mem[60+Regs[R4]] ## 032
          L.D F2,40(R3) 装入双精度浮点数 Regs[F2]<---64Mem[40+Regs[R3]]
          SD R4,300(R5) 保存双字 Mem[300+Regs[R5]]<---64Regs[R4]
          SW R4,300(R5) 保存字 Mem[300+Regs[R5]]<---32Regs[R4]
          S.S F2,40(R2) 保存单精度浮点数 Mem[40+Regs[R2]]<---32Regs[F2]0..31
          SH R5,502(R4) 保存半字 Mem[502+Regs[R4]]<---16Regs[R5]48..63
        • ALU指令
        • DADDU R1,R2,R3 无符号加  
          DADDIU R4,R5,R6 加无符号立即数  
          LUI R1,#4 把一个立即数装入到一个字的高16位 Regs[R1]<---032 ## 4 ## 016
          DSLL R1,R2,#5 逻辑左移 Regs[R1]<---Regs[R2]<<5
          DSLT R1,R2,R3 置小于

          if(Regs[R2]<Regs[R3]) then Regs[R1]<---1 else Regs[R1]<---0

        • 控制类指令
        • J name 跳转 PC36..63<---  name<<2
          JAL name 跳转并连接 Regs[R31]<-- PC+4;PC36..63<---name<<2;((PC+4)-227)<=neme<((PC+4)+227)
          JALR R3 寄存器跳转并连接 Regs[R31]<--- PC+4;PC<--Regs[R3]
          JR R5 寄存器跳转 PC<-- Regs[R5]
          BEQZ R4,name 等于零时分支 if(Regs[R4]==0) then PC<-- name;((PC+4)-217)<=name<((PC+4)+217)
          BNE R3,R4,name 不相等时分支 ((PC+4)-217)<= name < ((PC+4)+217)
          MOVZ R1,R2,R3 等于零时移动 if(Regs[R3]==0) then Regs[R1]<--Regs[R2]
        • 跳转指令(根据目标指令确定目标指令的方式不同以及是否跳转时连接,可以将跳转指令分为4类)
          • 目标地址的确定方式:把指令中的26位偏移量左移2位后,替换pc中的低28位;由指令中指定的一个寄存器来给出目标转移地址
          • 跳转的两种类型:简单跳转(把目标地址送入程序计数器);跳转并连接,将目标指令送入程序计数器,把返回地址(下一条)放入寄存器R31
        • 分支指令(跳转转移)
          • 分支指令指令的目标地址,由16位带符号偏移量左移两位后和pc相加决定。
          • 浮点条件分支指令:通过测试浮点状态寄存器来决定是否进行分支。

     

    展开全文
  • x86汇编指令集大全(带注释)

    万次阅读 多人点赞 2018-03-07 10:37:56
    汇编指令集太多,如果不用就会忘记,所以将i处理器官方的指令集大全写到博客上,有需要的人可以参考一下!X86和X87汇编指令大全(有注释) ---------- 一、数据传输指令 -----------------------------------------...

    汇编指令集太多,如果不用就会忘记,所以将i处理器官方的指令集大全写到博客上,有需要的人可以参考一下!

    X86和X87汇编指令大全(有注释)  
    ---------- 一、数据传输指令 ----------------------------------------------------  
    它们在存贮器和寄存器、寄存器和输入输出端口之间传送数据.  
    1. 通用数据传送指令.  
        MOV     传送字或字节.  
        MOVSX   先符号扩展,再传送.  
        MOVZX   先零扩展,再传送.  
        PUSH    把字压入堆栈.  
        POP     把字弹出堆栈.  
        PUSHA   把AX,CX,DX,BX,SP,BP,SI,DI依次压入堆栈.  
        POPA    把DI,SI,BP,SP,BX,DX,CX,AX依次弹出堆栈.  
        PUSHAD  把EAX,ECX,EDX,EBX,ESP,EBP,ESI,EDI依次压入堆栈.  
        POPAD   把EDI,ESI,EBP,ESP,EBX,EDX,ECX,EAX依次弹出堆栈.  
        BSWAP   交换32位寄存器里字节的顺序  
        XCHG    交换字或字节.(至少有一个操作数为寄存器,段寄存器不可作为操作数)  
        CMPXCHG 比较并交换操作数.(第二个操作数必须为累加器AL/AX/EAX)  
        XADD    先交换再累加.(结果在第一个操作数里)  
        XLAT    字节查表转换.----BX指向一张256字节的表的起点,AL为表的索引值(0-255,即0-FFH);返回AL为查表结果.([BX+AL]->AL)  
    2. 输入输出端口传送指令.  
        IN      I/O端口输入. ( 语法: IN   累加器,    {端口号│DX} )  
        OUT     I/O端口输出. ( 语法: OUT {端口号│DX},累加器 )输入输出端口由立即方式指定时,    其范围是 0-255; 由寄存器 DX 指定时,其范围是    0-65535.  
    3. 目的地址传送指令.  
        LEA     装入有效地址.例: LEA DX,string ;把偏移地址存到DX.  
        LDS     传送目标指针,把指针内容装入DS.例: LDS SI,string   ;把段地址:偏移地址存到DS:SI.  
        LES     传送目标指针,把指针内容装入ES.例: LES DI,string   ;把段地址:偏移地址存到ES:DI.  
        LFS     传送目标指针,把指针内容装入FS.例: LFS DI,string   ;把段地址:偏移地址存到FS:DI.  
        LGS     传送目标指针,把指针内容装入GS.例: LGS DI,string   ;把段地址:偏移地址存到GS:DI.  
        LSS     传送目标指针,把指针内容装入SS.例: LSS DI,string   ;把段地址:偏移地址存到SS:DI.  
    4. 标志传送指令.  
        LAHF    标志寄存器传送,把标志装入AH.  
        SAHF    标志寄存器传送,把AH内容装入标志寄存器.  
        PUSHF   标志入栈.  
        POPF    标志出栈.  
        PUSHD   32位标志入栈.  
        POPD    32位标志出栈.  
    ---------- 二、算术运算指令 ----------------------------------------------------  
        ADD     加法.  
        ADC     带进位加法.  
        INC     加 1.  
        AAA     加法的ASCII码调整.  
        DAA     加法的十进制调整.  
        SUB     减法.  
        SBB     带借位减法.  
        DEC     减 1.  
        NEG     求反(以    0 减之).  
        CMP     比较.(两操作数作减法,仅修改标志位,不回送结果).  
        AAS     减法的ASCII码调整.  
        DAS     减法的十进制调整.  
        MUL     无符号乘法.结果回送AH和AL(字节运算),或DX和AX(字运算),  
        IMUL    整数乘法.结果回送AH和AL(字节运算),或DX和AX(字运算),  
        AAM     乘法的ASCII码调整.  
        DIV     无符号除法.结果回送:商回送AL,余数回送AH, (字节运算);或 商回送AX,余数回送DX, (字运算).  
        IDIV    整数除法.结果回送:商回送AL,余数回送AH, (字节运算);或 商回送AX,余数回送DX, (字运算).  
        AAD     除法的ASCII码调整.  
        CBW     字节转换为字. (把AL中字节的符号扩展到AH中去)  
        CWD     字转换为双字. (把AX中的字的符号扩展到DX中去)  
        CWDE    字转换为双字. (把AX中的字符号扩展到EAX中去)  
        CDQ     双字扩展. (把EAX中的字的符号扩展到EDX中去)  
    ---------- 三、逻辑运算指令 ----------------------------------------------------  
        AND     与运算.  
        OR      或运算.  
        XOR     异或运算.  
        NOT     取反.  
        TEST    测试.(两操作数作与运算,仅修改标志位,不回送结果).  
        SHL     逻辑左移.  
        SAL     算术左移.(=SHL)  
        SHR     逻辑右移.  
        SAR     算术右移.(=SHR)  
        ROL     循环左移.  
        ROR     循环右移.  
        RCL     通过进位的循环左移.  
        RCR     通过进位的循环右移.  
                  以上八种移位指令,其移位次数可达255次.  
                  移位一次时, 可直接用操作码. 如 SHL AX,1.  
                  移位>1次时, 则由寄存器CL给出移位次数.  
                  如 MOV CL,04   SHL AX,CL  
    ---------- 四、串指令 ----------------------------------------------------------  
                  DS:SI 源串段寄存器 :源串变址.  
                  ES:DI 目标串段寄存器:目标串变址.  
                  CX 重复次数计数器.  
                  AL/AX 扫描值.  
                  D标志   0表示重复操作中SI和DI应自动增量; 1表示应自动减量.  
                  Z标志   用来控制扫描或比较操作的结束.  
        MOVS    串传送.( MOVSB 传送字符. MOVSW 传送字. MOVSD 传送双字. )  
        CMPS    串比较.( CMPSB 比较字符. CMPSW 比较字. )  
        SCAS    串扫描.把AL或AX的内容与目标串作比较,比较结果反映在标志位.  
        LODS    装入串.把源串中的元素(字或字节)逐一装入AL或AX中.( LODSB 传送字符. LODSW 传送字.    LODSD 传送双字. )  
        STOS    保存串.是LODS的逆过程.  
        REP         当CX/ECX<>0时重复.  
        REPE/REPZ   当ZF=1或比较结果相等,且CX/ECX<>0时重复.  
        REPNE/REPNZ 当ZF=0或比较结果不相等,且CX/ECX<>0时重复.  
        REPC        当CF=1且CX/ECX<>0时重复.  
        REPNC       当CF=0且CX/ECX<>0时重复.  
    ---------- 五、程序转移指令 ----------------------------------------------------  
    1. 无条件转移指令 (长转移)  
        JMP         无条件转移指令  
        CALL        过程调用  
        RET/RETF    过程返回.  
    2. 条件转移指令   (短转移,-128到+127的距离内)( 当且仅当(SF XOR OF)=1时,OP1<OP2 )  
        JA/JNBE     不小于或不等于时转移.  
        JAE/JNB     大于或等于转移.  
        JB/JNAE     小于转移.  
        JBE/JNA     小于或等于转移.  
            以上四条,测试无符号整数运算的结果(标志C和Z).  
        JG/JNLE     大于转移.  
        JGE/JNL     大于或等于转移.  
        JL/JNGE     小于转移.  
        JLE/JNG     小于或等于转移.  
            以上四条,测试带符号整数运算的结果(标志S,O和Z).  
        JE/JZ       等于转移.  
        JNE/JNZ     不等于时转移.  
        JC          有进位时转移.  
        JNC         无进位时转移.  
        JNO         不溢出时转移.  
        JNP/JPO     奇偶性为奇数时转移.  
        JNS         符号位为 "0" 时转移.  
        JO          溢出转移.  
        JP/JPE      奇偶性为偶数时转移.  
        JS          符号位为 "1" 时转移.  
    3. 循环控制指令(短转移)  
        LOOP            CX不为零时循环.  
        LOOPE/LOOPZ     CX不为零且标志Z=1时循环.  
        LOOPNE/LOOPNZ   CX不为零且标志Z=0时循环.  
        JCXZ            CX为零时转移.  
        JECXZ           ECX为零时转移.  
    4. 中断指令  
        INT         中断指令  
        INTO        溢出中断  
        IRET        中断返回  
    5. 处理器控制指令  
        HLT         处理器暂停,  直到出现中断或复位信号才继续.  
        WAIT        当芯片引线TEST为高电平时使CPU进入等待状态.  
        ESC         转换到外处理器.  
        LOCK        封锁总线.  
        NOP         空操作.  
        STC         置进位标志位.  
        CLC         清进位标志位.  
        CMC         进位标志取反.  
        STD         置方向标志位.  
        CLD         清方向标志位.  
        STI         置中断允许位.  
        CLI         清中断允许位.  
    ---------- 六、伪指令 ----------------------------------------------------------  
        DW          定义字(2字节).  
        PROC        定义过程.  
        ENDP        过程结束.  
        SEGMENT     定义段.  
        ASSUME      建立段寄存器寻址.  
        ENDS        段结束.  
        END         程序结束.  
    ---------- 七、处理机控制指令:标志处理指令 ------------------------------------  
        CLC     进位位置0指令  
        CMC     进位位求反指令  
        STC     进位位置为1指令  
        CLD     方向标志置1指令  
        STD     方向标志位置1指令  
        CLI     中断标志置0指令  
        STI     中断标志置1指令  
        NOP     无操作  
        HLT     停机  
        WAIT    等待  
        ESC     换码  
        LOCK    封锁  
    ========== 浮点运算指令集 ======================================================  
    ---------- 一、控制指令(带9B的控制指令前缀F变为FN时浮点不检查,机器码去掉9B)----  
    FINIT                 初始化浮点部件                  机器码  9B DB E3  
    FCLEX                 清除异常                         机器码  9B DB E2  
    FDISI                 浮点检查禁止中断                 机器码  9B DB E1  
    FENI                  浮点检查禁止中断二            机器码  9B DB E0  
    WAIT                  同步CPU和FPU                    机器码  9B  
    FWAIT                 同步CPU和FPU                    机器码  D9 D0  
    FNOP                  无操作                          机器码  DA E9  
    FXCH                  交换ST(0)和ST(1)                机器码  D9 C9  
    FXCH ST(i)            交换ST(0)和ST(i)                机器码  D9 C1iii  
    FSTSW ax              状态字到ax                       机器码  9B DF E0  
    FSTSW   word ptr mem  状态字到mem                      机器码  9B DD mm111mmm  
    FLDCW   word ptr mem  mem到状态字                      机器码  D9 mm101mmm  
    FSTCW   word ptr mem  控制字到mem                      机器码  9B D9 mm111mmm  
      
    FLDENV  word ptr mem  mem到全环境                      机器码  D9 mm100mmm  
    FSTENV  word ptr mem  全环境到mem                      机器码  9B D9 mm110mmm  
    FRSTOR  word ptr mem  mem到FPU状态                    机器码  DD mm100mmm  
    FSAVE   word ptr mem  FPU状态到mem                    机器码  9B DD mm110mmm  
      
    FFREE ST(i)           标志ST(i)未使用                   机器码  DD C0iii  
    FDECSTP               减少栈指针1->0 2->1             机器码  D9 F6  
    FINCSTP               增加栈指针0->1 1->2             机器码  D9 F7  
    FSETPM                浮点设置保护                       机器码  DB E4  
    ---------- 二、数据传送指令 ----------------------------------------------------  
    FLDZ                  将0.0装入ST(0)                  机器码  D9 EE  
    FLD1                  将1.0装入ST(0)                  机器码  D9 E8  
    FLDPI                 将π装入ST(0)                    机器码  D9 EB  
    FLDL2T                将ln10/ln2装入ST(0)             机器码  D9 E9  
    FLDL2E                将1/ln2装入ST(0)                机器码  D9 EA  
    FLDLG2                将ln2/ln10装入ST(0)             机器码  D9 EC  
    FLDLN2                将ln2装入ST(0)                  机器码  D9 ED  
      
    FLD    real4 ptr mem  装入mem的单精度浮点数             机器码  D9 mm000mmm  
    FLD    real8 ptr mem  装入mem的双精度浮点数             机器码  DD mm000mmm  
    FLD   real10 ptr mem  装入mem的十字节浮点数             机器码  DB mm101mmm  
      
    FILD    word ptr mem  装入mem的二字节整数              机器码  DF mm000mmm  
    FILD   dword ptr mem  装入mem的四字节整数              机器码  DB mm000mmm  
    FILD   qword ptr mem  装入mem的八字节整数              机器码  DF mm101mmm  
      
    FBLD   tbyte ptr mem  装入mem的十字节BCD数            机器码  DF mm100mmm  
      
    FST    real4 ptr mem  保存单精度浮点数到mem             机器码  D9 mm010mmm  
    FST    real8 ptr mem  保存双精度浮点数到mem             机器码  DD mm010mmm  
      
    FIST    word ptr mem  保存二字节整数到mem              机器码  DF mm010mmm  
    FIST   dword ptr mem  保存四字节整数到mem              机器码  DB mm010mmm  
      
    FSTP   real4 ptr mem  保存单精度浮点数到mem并出栈      机器码  D9 mm011mmm  
    FSTP   real8 ptr mem  保存双精度浮点数到mem并出栈      机器码  DD mm011mmm  
    FSTP  real10 ptr mem  保存十字节浮点数到mem并出栈      机器码  DB mm111mmm  
      
    FISTP   word ptr mem  保存二字节整数到mem并出栈           机器码  DF mm011mmm  
    FISTP  dword ptr mem  保存四字节整数到mem并出栈           机器码  DB mm011mmm  
    FISTP  qword ptr mem  保存八字节整数到mem并出栈           机器码  DF mm111mmm  
      
    FBSTP  tbyte ptr mem  保存十字节BCD数到mem并出栈     机器码  DF mm110mmm  
      
    FCMOVB                ST(0),ST(i) <时传送              机器码  DA C0iii  
    FCMOVBE               ST(0),ST(i) <=时传送             机器码  DA D0iii  
    FCMOVE                ST(0),ST(i) =时传送             机器码  DA C1iii  
    FCMOVNB               ST(0),ST(i) >=时传送             机器码  DB C0iii  
    FCMOVNBE              ST(0),ST(i) >时传送              机器码  DB D0iii  
    FCMOVNE               ST(0),ST(i) !=时传送            机器码  DB C1iii  
    FCMOVNU               ST(0),ST(i) 有序时传送        机器码  DB D1iii  
    FCMOVU                ST(0),ST(i) 无序时传送        机器码  DA D1iii  
    ---------- 三、比较指令   --------------------------------------------------------  
    FCOM                  ST(0)-ST(1)                      机器码  D8 D1  
    FCOMI                 ST(0),ST(i)  ST(0)-ST(1)         机器码  DB F0iii  
    FCOMIP                ST(0),ST(i)  ST(0)-ST(1)并出栈   机器码  DF F0iii  
    FCOM   real4 ptr mem  ST(0)-实数mem                      机器码  D8 mm010mmm  
    FCOM   real8 ptr mem  ST(0)-实数mem                      机器码  DC mm010mmm  
      
    FICOM   word ptr mem  ST(0)-整数mem                      机器码  DE mm010mmm  
    FICOM  dword ptr mem  ST(0)-整数mem                      机器码  DA mm010mmm  
    FICOMP  word ptr mem  ST(0)-整数mem并出栈               机器码  DE mm011mmm  
    FICOMP dword ptr mem  ST(0)-整数mem并出栈               机器码  DA mm011mmm  
      
    FTST                  ST(0)-0                          机器码  D9 E4  
    FUCOM  ST(i)          ST(0)-ST(i)                      机器码  DD E0iii  
    FUCOMP ST(i)          ST(0)-ST(i)并出栈                   机器码  DD E1iii  
    FUCOMPP               ST(0)-ST(1)并二次出栈             机器码  DA E9  
    FXAM                  ST(0)规格类型                    机器码  D9 E5  
    ---------- 四、运算指令   --------------------------------------------------------  
    FADD                  把目的操作数 (直接接在指令后的变量或堆栈缓存器) 与来源操作数 (接在目的操作数后的变量或堆栈缓存器)  相加,并将结果存入目的操作数  
    FADDP  ST(i),ST       这个指令是使目的操作数加上 ST  缓存器,并弹出 ST 缓存器,而目的操作数必须是堆栈缓存器的其中之一,最后不管目的操作数为何,经弹出一次后,目的操作数会变成上一个堆栈缓存器了  
    FIADD                 FIADD 是把 ST   加上来源操作数,然后再存入 ST 缓存器,来源操作数必须是字组整数或短整数形态的变数  
      
    FSUB                  减  
    FSUBP  
    FSUBR                 减数与被减数互换  
    FSUBRP  
    FISUB  
    FISUBR  
      
    FMUL                  乘  
    FMULP  
    FIMUL  
      
    FDIV                  除  
    FDIVP  
    FDIVR  
    FDIVRP  
    FIDIV  
    FIDIVR  
      
    FCHS                  改变 ST 的正负值  
      
    FABS                  把 ST  之值取出,取其绝对值后再存回去。  
      
    FSQRT                 将 ST  之值取出,开根号后再存回去。  
      
    FSCALE                这个指令是计算 ST*2^ST(1)之值,再把结果存入 ST 里而 ST(1)   之值不变。ST(1)  必须是在 -32768 到 32768 (-215 到 215 )之间的整数,如果超过这个范围计算结果无法确定,如果不是整数 ST(1)    会先向零舍入成整数再计算。所以为安全起见,最好是由字组整数载入到 ST(1) 里。  
      
    FRNDINT               这个指令是把 ST 的数值舍入成整数,FPU    提供四种舍入方式,由 FPU 的控制字组(control    word)中的 RC 两个位决定  
                              RC    舍入控制  
                              00    四舍五入  
                              01    向负无限大舍入  
                              10    向正无限大舍入  
                              11    向零舍去  
    ================================================================================  

     

     

     

    展开全文
  • MCU使用什么指令集主要由内核决定的,比如Cortex-M3使用的是Thumb-2指令集 ARM指令集: 编代码全部是 32bits 的,每条指令能承载更多的信息,因此使用最少的指令完成功能, 所以在相同频率下运行速度也是最...

    MCU使用什么指令集主要由内核决定的,比如Cortex-M3使用的是Thumb-2指令集

     

     

    ARM指令集:

    编代码全部是 32bits 的,每条指令能承载更多的信息,因此使用最少的指令完成功能, 所以在相同频率下运行速度也是最快的, 但也因为每条指令是32bits 的而占用了最多的程序空间。

     

    Thumb指令集:

    编代码全部是 16bits 的,每条指令所能承载的信息少,因此它需要使用更多的指令才能完成功能, 因此运行速度慢, 但它也占用了最少的程序空间

     

    Thumb-2指令集:
    在前面两者之间取了一个平衡, 兼有二者的优势, 当一个 操作可以使用一条 32bits指令完成时就使用 32bits 的指令, 加快运行速度, 而当一次操作只需要一条16bits 指令完成时就使用16bits 的指令,节约存储空间。

     

    转载于:https://www.cnblogs.com/god-of-death/p/7078347.html

    展开全文
  • 1、Thumb指令集来源 ARM的RISC体系结构的发展中已经提供了低功耗、小体积、高性能的方案。而为了解决代码长度的问题,ARM体系结构又开发了一种新的指令体系,就是Thumb指令集,称之为T变种。 Thumb是ARM体系结构的...

    1、Thumb指令集来源

    ARM的RISC体系结构的发展中已经提供了低功耗、小体积、高性能的方案。而为了解决代码长度的问题,ARM体系结构又开发了一种新的指令体系,就是Thumb指令集,称之为T变种。

    Thumb是ARM体系结构的扩展(thumb不是一个完整的体系结构,不能指望处理器只执行thumb指令集而不支持arm指令集。它从标准32位ARM指令集抽出来的36条指令格式,重新编成16位的操作码。这能带来很高的代码密度,例如:在1K的存储空间中,可以放32条ARM指令,就可以放64条Thumb指令,因此Thunb指令代码密度高。

    2、Thumb指令集和ARM指令的时间复杂度和空间复杂度对比

    在ARM处理器中,内核同时支持32位的ARM指令和16位的Thumb令。

    • 当用户使用C程序来处理应用时,如果编译为Thumb指令,Thumb代码使用的指令数要比ARM代码多约30%~40%,但最终生成的目标代码所需的存储空间约为ARM代码的60%~70%(因为每条指令所占空间是arm指令的一半)。

     

    • 使用32位存储器,ARM代码比Thumb代码快约40%;使用16位存储器,Thumb代码比ARM指令快约40%~50%。具体解释如下:

    在存储器是32位的情况下,ARM性能较好,这时因为同样的代码编译的结果Thumb指令将会比ARM 多,Thumb指令仍旧花费指令周期来从32-bit块内存预取。在16-bit内存上,即使有比ARM多的代码,这时Thumb性能也较好,因为Thumb每一条指令预取需要一个周期而每条ARM指令需要两个周期。
    另外在16-bit内存上,Thumb的性能降低了;这是因为数据去操作和特殊的堆栈操作,即使在Thumb下,堆栈操作仍是32-bit操作,导致低的性能在16-bit内存架构上。一个改进的方法是提供32-bit的内存来放置堆栈。在这种情况下的性能提高到了32-bit内存架构的水平。主要的差别是因为使用的整型的(32-bit)全局数据将仍被存储在16-bit内存上。

    与ARM代码相比较,使用Thumb代码,存储器的功耗会降低约30%。

    3、Thumb指令集和ARM指令的混合编程

    若两者结合使用,充分发挥其各自的优点,会取得更好的效果。Thumb以其较高的代码密度和在窄存储器上的性能,使得它在很多系统中得到广泛应用。但在很多情况下,还是不得不使用ARM指令,这是因为:

    ①ARM处理器的一些特定功能必须由ARM指令实现,其中包括PSR指令(不能直接访问CPSR 和SPSR,必须先切换到ARM状态下,再使用MSR和MRS来实现)、协处理器指令

    ②异常发生时,处理器自动进入ARM状态,即在异常中断处理程序入口的一些指令是ARM指令(ARM程序头ARMassemblerheader),然后根据需要程序可以切换到Thumb状态,在异常中断处理程序返回前,程序再切换到ARM状态。如果异常处理程序需要使用Thumb指令也必须通用一个。

    ③ARM处理器总是从ARM状态开始执行,如果要在调试器中运行Thumb程序,必须为该Thumb程序添加一个ARM程序头,然后再切换到Thumb状态,调用该Thumb程序。

     

    基于以上原因,即使程序需要由Thumb代码实现,也必须通过ARM-Thumb互交(ARM-Thumbinterworking)进入Thumb状态。ARM-Thumb互交是指对汇编语言和C/C++语言的ARM和Thumb代码进行连接的方法,它进行两种状态(ARM和Thumb状态)间的切换。在进行这种切换时,有时需使用额外的代码,这些代码被称为Veneer。AAPCS定义了ARM和Thumb过程调用的标准。
     

    ref:

    https://www.sohu.com/a/339622340_100281310

    https://www.21ic.com/app/mcu/201812/780644.htm

    http://www.elecfans.com/emb/574929.html

    https://www.21ic.com/embed/jiaocheng/jichu/201806/61024.html

    https://www.xuebuyuan.com/1257101.html

    https://www.cnblogs.com/fx427103/p/3968243.html

    展开全文
  • 复杂指令集和精简指令集

    千次阅读 2018-12-26 08:14:22
    复杂指令集和精简指令集复杂指令集(CISC)定义通俗理解复杂指令集(CISC)定义通俗理解 复杂指令集(CISC) 定义 在CISC微处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序串行执行的...
  • ARM指令集:ARM指令是32位的指令,编代码全部是 32bits 的,每条指令能承载更多的信息,因此使用最少的指令完成功能, 所以在相同频率下运行速度也是最快的, 但也因为每条指令是32bits 的而占用了最多的程序空间。...
  • ARM指令集 VS Thumb指令集

    千次阅读 2017-11-19 16:43:08
    1 thumb指令集概述 为兼容数据总线宽度为16位的应用系统,ARM体系结构除了支持执行效率很高的32位ARM指令集以外,同时支持16位的Thumb指令集。 Thumb指令集是ARM指令集的一个子集,是针对代码密度问题而提出的,它...
  • 精简指令集与复杂指令集

    千次阅读 2017-03-04 21:35:39
    于是就望文生意的认为,精简指令集就是指令少的指令集,而复杂指令集就是指令比较多的指令集。拿着自己的理解,和一些指令集想比较,还真是这个意思(运气而已,知其然,不知其所以然)。 随着技术的积累,见识的...
  • ARM指令集 --RISC精简指令集

    千次阅读 2018-10-15 10:18:59
    汇编语言是与硬件接触的美妙语言,...ARM处理器支持ARM指令集,也支持16位的Thumb指令集,从ARMv6开始,新的ARM处理器支持16/32位的Thumb-2指令集(ARMv7-M仅支持Thumb-2)。ARM指令集使用标准的,固定长度的32位指...
  • Thumb指令集 Thumb指令可以看做是ARM指令压缩形式的子集,是针对代码密度【1】的问题而提出的,它具有16为的代码密度。Thumb不是一个完整的体系结构,不能指望处理程序只执行Thumb指令而不支持ARM指令集。因此,...
  • 复杂指令集与精简指令集

    千次阅读 2015-12-24 23:27:01
    两种主要的计算机处理器体系结构:复杂指令集与精简指令集
  • MIPS指令集及汇编完全解析

    万次阅读 多人点赞 2019-01-07 17:48:14
    MIPS指令集及汇编 由于本人最近在看底层操作系统与汇编的有关书籍,故写此博文总结,以便后续本人及感兴趣朋友阅读。如有错误恳请指出,一起学习,一起进步!   目录 MIPS指令集及汇编 一、MIPS简介: 二、...
  • ARM 指令集 VS Thumb 指令集

    千次阅读 2016-02-23 22:45:27
    Thumb指令集    Thumb指令可以看做是ARM指令压缩形式的子集,是针对代码密度【1】的问题而提出的,它具有16为的代码密度。Thumb不是一个完整的体系结构,不能指望处理程序只执行Thumb指令而不支持ARM指令集。...
  • ARM指令集 VS thumb指令集

    千次阅读 2014-09-27 15:26:29
    1 thumb指令集概述 为兼容数据总线宽度为16位的应用系统,ARM体系结构除了支持执行效率很高的32位ARM指令集以外,同时支持16位的Thumb指令集。 Thumb指令集是ARM指令集的一个子集,是针对代码密度问题而提出...
  • SSE指令集

    2019-06-26 04:28:42
    其实,早在PIII正式推出之前,Intel公司就曾经通过各种渠道公布过所谓的KNI(Katmai New Instruction)指令集,这个指令集也就是SSE指令集的前身,并一度被很多传媒称之为MMX指令集的下一个版本,即MMX2指令集。...
  • 与之相对的另外一套常用的指令集架构是基于寄存器的指令集,最典型的就是x86的二地址指令集,说的通俗些,就是现在我们主流PC机中直接支持的指令集架构,这些指令依赖寄存器进行工作。那么,基于栈的指令集与基于...
  • 指令集的架构模型分为基于栈的指令集架构与基于寄存器的指令集架构两种,HotSpot虚拟机中的任何操作都需要入栈和出栈的步骤,即使用栈来管理运行,而HotSpot本身就是基于栈的指令集架构。 下图展示了栈式指令集架构...
  • RISC-V指令集介绍 - 整数基本指令集

    万次阅读 2018-06-17 14:35:20
    前段时间在修改 picorv32 核心(一个riscv-32的cpu核心),阅读了一下riscv指令集的手册。在此,做一下简单记录。RV32I:32位risc-v整数指令集1. 寄存器 32个x寄存器,RV32下x reg是32位宽 x0:硬连线 常数0 x1-x31...
  • 精简指令集和复杂指令集的区别

    万次阅读 多人点赞 2016-03-31 21:57:39
    RISC(精简指令集计算机)和CISC(复杂指令集计算机)是当前CPU的两种架构。它们的区别在于不同的CPU设计理念和方法。 CPU架构是厂商给属于同一系列的CPU产品定的一个规范,主要目的是为了区分不同类型CPU的重要标示 ...
  • Thumb指令集    Thumb指令能够看做是ARM指令压缩形式的子集。是针对代码密度【1】的问题而提出的。它具有16为的代码密度。Thumb不是一个完整的体系结构,不能指望处理程序仅仅运行Thumb指令而不支持ARM指令集。...
  • 指令集简介

    2018-11-12 21:59:55
    指令集简介
  • 不同指令集的CPU 不是频率越高就越好的 精简指令集 每个指令完成的时间都很短,完成的操作也很单一,指令执行性能较佳 复杂指令集 指令数目多而且复杂,每条指令的长度并不相同,因为指令执行较为复杂,所以每条指令...
  • Thumb指令集

    千次阅读 2018-08-23 10:28:11
    Thumb指令集概述 为兼容数据总线宽度为16位的应用系统,ARM体系结构除了支持执行效率很高的32位ARM指令集以外,同时支持16位的Thumb指令集。Thumb指令集是ARM指令集的一个子集,是针对代码密度问题而提出的,它具有...
  • CPU指令集

    2019-09-21 14:36:41
    CPU指令集是CPU厂家设计CPU的时候规定的,程序员根据这个CPU的指令集写程序 举个例子: 比如某厂家设计了一个CPU,指令集有(吃饭,睡觉,看电视),当程序员拿到这三个指令时,编写一个程序,只能让CPU做这三件事,其他的都...
  • 深度理解“指令集

    万次阅读 2017-07-29 01:33:58
    指令顾名思义就是用来引导某一硬件工作的方式的,集即集合的意思,也就是很多种不同引导指令的集合!... 其实指令集就是一组汇编指令的集合,不同的CPU使用的指令集不同。 过去比较常用的是lntel的X86C
  • 最近面试的时候被问到指令集,一头雾水,由于之前的工作没有涉及到指令集方面的知识,现总结成文。 定义 指令集架构(英语:Instruction Set Architecture,缩写为ISA),又称指令集指令集体系,是计算机体系结构...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 27,018
精华内容 10,807
关键字:

指令集