精华内容
参与话题
问答
  • 二维码(QR Code)的生成原理及解析

    千次阅读 2018-09-28 17:00:26
    二维码生成原理及解析代码 自从大街小巷的小商小贩都开始布满了腾讯爸爸和阿里爸爸的二维码之后,我才感觉到我大天朝共享支付的优越性。最近毕业论文写的差不多了,在入职之前多学一些东西也是好的。这里秉着好奇心...

    转载自:琦小虾
    https://blog.csdn.net/ajianyingxiaoqinghan/article/details/78837864#comments
    二维码生成原理及解析代码

    自从大街小巷的小商小贩都开始布满了腾讯爸爸和阿里爸爸的二维码之后,我才感觉到我大天朝共享支付的优越性。最近毕业论文写的差不多了,在入职之前多学一些东西也是好的。这里秉着好奇心,研究一下二维码的生成,并尝试性写一个二维码解析源码。

    注:暂时只有二维码原理,笔者这段时间会持续研究解析代码,并随进度持续更新。

    参考网址:
    《二维码的生成细节和原理》
    《QR Code Tutorial》
    《Hello World!》—— 知乎专栏文章
    《为程序员写的Reed-Solomon码解释》

    一. 二维码基本知识

    二维码另一个名称是QR Code(Quick Response Code),近年来在移动设备上经常使用,与传统条形码相比,可以存储更多的信息。二维码本质上是个密码算法,基本知识总结如下。
    首先,二维码存在 40 种尺寸,在官方文档中,尺寸又被命名为 Version。尺寸与 Version 存在线性关系:Version 1 是 21×21 的矩阵,Version 2 是 25×25 的矩阵,每增加一个 Version,尺寸都会增加 4,故尺寸 Size 与 Version 的线性关系为:

    Size=(Version1)×4Size=(Version−1)×4

    Version 的最大值是 40,故尺寸最大值是(40-1)*4+21 = 177,即 177 x 177 的矩阵。

    二维码结构如下图 1.1 所示:



    图1.1 二维码结构

    二维码的各部分都有自己的作用,基本上可被分为定位、功能数据、数据内容三部分。

    • 定位图案:
      • Position Detection Pattern, 定位图案:用于标记二维码矩形的大小;用三个定位图案即可标识并确定一个二维码矩形的位置和方向了;
      • Separators for Position Detection Patterns, 定位图案分割器:用白边框将定位图案与其他区域区分;
      • Timing Patterns, 时序图案:用于定位,二维码如果尺寸过大,扫描时容易畸变,时序图案的作用就是防止扫描时畸变的产生;
      • Alignment Patterns, 对齐图案:只有在 Version 2 及其以上才会需要;
    • 功能数据:
      • Format Information, 格式信息:存在于所有尺寸中,存放格式化数据;
      • Version Information, 版本信息:用于 Version 7 以上,需要预留两块 3×6 的区域存放部分版本信息;
    • 数据内容:剩余部分存储数据内容
      • Data Code, 数据码;
      • Error Correction Code, 纠错码;

    二. 数据编码

    2.1 数据编码信息

    二维码的数据编码信息如下图 2.1, 2.2 中的列表所示:



    图2.1 模式编号指示器



    图2.2 字符计数指示器中的位数

    上图 2.1 中,展示的是二维码支持的数据编码模式。
    :其中中文编码模式为 1101;

    上图 2.2 中展示了不同版本(即不同尺寸)的二维码,单个编码对应二进制的位数。
    :二维码规格说明书中,存在各式各样的编码规范表;

    图2.1, 2.2 表格具体含义,在后面的例程中会具体讲解。

    2.2 数据编码形式

    2.2.1 数字编码(Numeric Mode)

    数字编码的范围为 0~9。
    对于数字编码,统计需要编码数字的个数是否为 3 的倍数:如果不是 3 的倍数,则剩下的 1 位或 2 位会被转为 4bits 或 8bits(十进制转二进制),每三位数字都会被编成 10bits, 12bits, 14bits,具体编码长度仍然需要二维码尺寸决定。

    2.2.2 字符编码(Alphanumeric Mode)

    字符编码的范围有:

    • 数字 0~9;
    • 大写 A~Z(无小写);
    • 几个符号$ % * + - . / 和空格。

    上述字符映射为一个索引表,如下图 2.3 所示:



    图2.3 字符映射索引表

    图中 Char 表示字符,Value 表示字符对应的索引值。
    索引表中共 45 种对应关系,字符编码的过程,就是将每两个字符分为一组,然后转成上图 2.3 的 45 进制,再转为 11bits 的二进制结果。对于落单的一个字符,则转为 6bits 的二进制结果。
    此外,根据上图 2.2 的设定,对不同 Version 的二维码使用 9/11/13 个二进制表示。

    注:
    上图 2.3 中的 SP 代表空格。

    2.2.3 字节编码(Byte Mode)

    可以是 0-255 的 ISO-8859-1 字符。有些二维码的扫描器可以自动检测是否是 UTF-8 的编码。

    2.2.4 日文编码(Kanji Mode)

    日文编码同时也是双字节编码,同样也可以用于中文编码。
    日文与中文编码流程基本相似:

    1. 首先减去一个值;
    2. 挑出差值结果的前两个 16 进制,乘以 0xC0;
    3. 加上后两个 16 进制位;
    4. 转为 13bits 编码;

    按照日文编码集 SHIFT_JIS为参照,可查询日文字符的对应编码。以“雅”与“芒”为例,转换过程如下图 2.4 所示:



    图2.4 日文编码流程展示

    2.2.5 其他编码

    其他类型的编码本文中不详细说明。其中包括:

    • 特殊字符集(Extended Channel Interpretation Mode):主要用于特殊的字符集,并不是所有的扫描器都支持这种编码;
    • 混合编码(Structured Append Mode):说明该二维码中包含了多种编码格式;
    • 特殊行业编码(FNC1 Mode):主要是给一些特殊的工业或行业用的,如GS1条形码等;

    2.3 数据编码示例说明

    分别用一个数字编码与字符编码的示例,说明数据编码的过程:

    2.3.1 例程1:数字编码

    问题:对于 Version 1 尺寸的二维码,纠错级别为 H,编码为:01234567
    解析步骤:

    1. 将上述数字分为三组:012, 345, 67;
    2. 查询图 2.2 表格内容,Version 1 二维码的数字编码应转换为 10bits 的二进制数字,故将上面三组数字转为二进制分别为:012→0000001100, 345→0101011001, 67→1000011;
    3. 将三个二进制串连接起来:0000001100 0101011001 1000011;
    4. 将数字的个数转成二进制:对于数字编码,数字长度依旧用图 2.2 表格中查到的 10bits 二进制数字来表示,数字共有 8 个,故数字个数的二进制形式为:8→0000001000;
    5. 查询图 2.1 表格内容,数字编码的标志为 0001,将编码标志与步骤 4 编码结果加到步骤 3 结果之前,故最终结果为:0001 0000001000 0000001100 0101011001 1000011

    2.3.2 例程2:字符编码

    问题:对于 Version 1 尺寸的二维码,纠错级别为 H,编码为:AE-86
    解析步骤:

    1. 在图 2.3 的字符索引表中分别找到 AE-86 五个字符的索引分别为:(10, 14, 41, 8, 6);
    2. 将五个字符两两分组:(10, 14) (41, 8) (6);
    3. 字符编码应将字符组转换为 11bits 的二进制,故上述三组字符首先转为 45 进制后再转为二进制:
      • (10, 14):转为 45 进制:10×45+14=464;再转为 11bits 的二进制:00111010000;
      • (41, 8):转为 45 进制:41×45+8=1853;再转为 11bits 的二进制:11100111101;
      • (6):转为 45 进制:6;再转为 6bits 的二进制:000110;
    4. 将步骤 3 中得到的三个二进制结果连接起来:00111010000 11100111101 000110;
    5. 查询图 2.2 表格内容,Version 1 二维码的字符个数应转换为 9bits 的二进制数字,对于 5 个字符,二维码字符个数转为 9bits 二进制为:000000101;
    6. 查询图 2.1 表格内容,字符编码的标志为 0010,将编码标志与步骤 5 编码结果加到步骤 4 结果之前,故最终编码结果为:0010 000000101 00111010000 11100111101 000110;

    三. 结束符与补齐符

    对于结束符和补齐符,我们直接举例进行说明。
    问题:对于 Version 1 尺寸的二维码,纠错级别为 H,以笔者的英文名作为编码:CHANDLERGENG
    按照 2.3.2 字符编码例程进行分析,得到编码如下:

    编码 字符数 CHANDLERGENG 的编码
    0010 000001101 01000101101 00111011001 01001011110 01010010001 01011011110 10000011011

    3.1 结束符

    在需要在对于上述字符的编码,需要在最后加上结束符。结束符为连续 4 个 0 值。加上结束符后,得到的编码如下:

    编码 字符数 CHANDLERGENG 的编码 结束
    0010 000001101 01000101101 00111011001 01001011110 01010010001 01011011110 10000011011 0000

    如果所有的编码加起来不是 8 的倍数,则还需要在后面加上足够的 0。如上面一共有 83bits,所以与 8 的倍数还相差两位,故在最后加上 5 个 0,上表最终的数据变为:
    00100000 01101010 00101101 00111011 00101001 01111001 01001000 10101101 11101000 00110110 00000000

    3.2 补齐符

    如果最后还没有达到我们最大的 Bits 数限制,则需要在编码最后加上补齐符(Padding Bytes)。
    补齐符内容是不停重复两个字节:1110110000010001。这两个二进制转成十进制,分别为 236 与17,具体不知道为什么选这两个值……关于每一个Version的每一种纠错级别的最大Bits限制,可以参看 QR Code Spec 的第35页到44页的 Table-7 一表(笔者参考的是《ISO/IEC 18004》2000版),大致如下图 3.1 所示:



    图3.1 二维码纠错级别的最大Bits限制(部分)

    上图 3.1 中提到的 codewords,可译为码字,一个码字是一个字节。对于 Version 1 的 H 纠错级别,共需要 26 个码字,即 104bits。现在加上用 0 补全的结束符,已经有了 88bits,故还需要补上 16 bits。补齐后的编码为:

    00100000 01101010 00101101 00111011 00101001 01111001 01001000 10101101 11101000 00110110 00000000 11101100 00010001

    以上数据即为数据码(Data Codewords)

    四. 纠错码

    前文提到了不同的纠错级别(Error Correction Code Level)。有了纠错机制,才可以使得有些二维码有了残缺也可以扫码解析出来,才可以使得二维码中心位置可以供某些商家加上对解析不必要的图标。
    二维码一共有四种纠错级别:

    纠错水平 可被修正容量
    L 7% 码字
    M 15% 码字
    Q 25% 码字
    H 30% 码字

    二维码对数据码加上纠错码的过程,首先要对数据码进行分组,即分成不同的块(Block)。参看如上图 3.1 所示 QR Code Spec 的第35页到44页的 Table-7 中的最下方说明了分组的定义表:



    图4.1 二维码纠错级别说明(部分)

    对于表中的最后两列的内容:

    • 纠错块个数(Number of error correction blocks):需要划分纠错快的个数;
    • 纠错块码字数(Error Correction Code Per Blocks):每个块中的码字个数,即有多少个字节Bytes;

    表中最下面关于 (c,k,r) 的解释:

    • c:码字总个数;
    • k:数据码个数;
    • r:纠错码容量

    注:

    • c,k,r的关系公式:c=k+2×rc=k+2×r
    • 纠错码容量小于纠错码个数的一般

    以上图 4.1 中的 Version 5 + H 纠错机为例:图中红色方框说明共需要 4 个块(上下行各一组,每组 2 个块)。

    第一组的属性:

    • 纠错块个数 = 2:该组中有两个块;
    • (c, k, r) = (33, 11, 11):该组中每个块共有 33 个码字,其中 11 个数据码, 11×2=22 个纠错码;

    第二组的属性:

    • 纠错块个数 = 2:该组中有两个块;
    • (c, k, r) = (34, 12, 11):该组中每个块共有 34 个码字,其中 12 个数据码, 11×2=22 个纠错码;

    具体示例如下表所示,且由于使用二进制会使得表格过大,故转为范围在 0~255 的十进制。其中组 1 的每个块,都有 11 个数据码, 22 个纠错码;组 2 的每个块,都有 12 个数据码,22 个纠错码。

    数据 每个块的纠错码
    1 1

    2
    67 85 70 134 87 38 85 194 119 50 6

    66 7 118 134 242 7 38 86 22 198 199
    199 11 45 115 247 241 223 229 248 154 117 236 38 6 50 17 7 236 213 87 148 235

    177 212 76 133 75 242 238 76 195 230 189 106 248 134 76 40 154 27 195 255 117 129
    2 1

    2
    247 119 50 7 118 134 87 38 82 6 134 151

    194 6 151 50 16 236 17 236 17 236 17 236
    96 60 202 182 124 157 200 134 27 129 209 182 70 85 246 230 247 70 66 247 118 134

    173 24 147 59 33 106 40 255 172 82 2 157 242 33 229 200 238 106 248 134 76 40

    二维码的纠错码主要是通过里德-所罗门纠错算法(Reed-Solomon Error Correction)实现的。

    (关于 Reed-Solomon 算法,现在此处占坑,回头研究了再写上去)

    五. 最终编码

    此时得到了数据,但还不能开始画图,因为二维码还需要将数据码与纠错码的各个字节交替放置。

    5.1 穿插放置

    继续以第四章中给出的示例为例,给出其穿插放置的过程。

    5.1.1 数据码穿插放置

    第四章示例中的数据码如下表所示:

    块数
    块1 67 85 70 134 87 38 85 194 119 50 6
    块2 66 7 118 134 242 7 38 86 22 198 199
    块3 247 119 50 7 118 134 87 38 82 6 134
    块4 194 6 151 50 16 236 17 236 17 236 17

    提取每一列数据:

    • 第一列:67, 66, 247, 194;
    • 第二列:85, 7, 119, 6;
    • ……
    • 第十一列:6, 199, 134, 17;
    • 第十二列:151, 236;

    将上述十二列的数据拼在一起:67, 66, 247, 194, 85, 7, 119, 6,…, 6, 199, 134, 17, 151, 236。

    纠错码如下表所示:

    块数
    块1 199 11 45 115 247 241 223 229 248 154 117
    块2 177 212 76 133 75 242 238 76 195 230 189
    块3 96 60 202 182 124 157 200 134 27 129 209
    块4 173 24 147 59 33 106 40 255 172 82 2

    同样的方法,将 22 列数据放在一起:199, 177, 96, 173, 11, 212, 60, 24, …, 148, 117, 118, 76, 235, 129, 134, 40。

    上述部分即为二维码的数据区。

    5.2 剩余位 (Remainder Bits)

    对于某些 Version 的二维码,得到上面的数据区结果长度依旧不足,需要加上最后的剩余位。比如对于 Version 5 + H 纠错等级的二维码,剩余位需要加 7bits,即加 7 个 0。参看 QR Code Spec 的 Table-1 一表即可查询不同 Version 的剩余位信息,如下图 5.1 所示:



    图5.1 不同 Version 的剩余位

    六. 二维码的绘制

    终于讲到二维码绘制过程了,绘制的过程按照顺序对图 1.1 中各个重要部分依次讲解。

    6.1 定位图案 (Position Detection Pattern)

    首先在二维码的三个角上绘制定位图案。定位图案与尺寸大小无关,一定是一个 7×7 的矩阵。如下图 6.1 所示:



    图6.1 定位图案 (Position Detection Pattern)

    6.2 对齐图案 (Alignment Pattern)

    然后绘制对齐图案。对齐图案与尺寸大小无关,一定是一个 5×5 的矩阵。如下图 6.2 所示:



    图6.2 对齐图案 (Alignment Pattern)

    对齐图案绘制的位置,可参看 QR Code Spec 的 Table-E.1 一表查询,部分内容如下图 6.3 所示:



    图6.3 对齐图案位置索引表(部分)

    下图 6.4 是上述表格中 Version 8 的一个例子,对于 Version 8 的二维码,行列值在 6, 24, 42 的几个点都会有对齐图案。



    图6.4 对齐图案例程 1

    下图 6.5 是最近我老妈怂恿我用支付宝抢红包时给我发来的二维码,该二维码中只有一个对齐图案, 故 Version 应在 V2——V6 之间。



    图6.5 对齐图案例程 2

    6.3 时序图案 (Timing Pattern)

    时序图案是两条连接三个定位图案的线,如下图 6.6 所示:



    图6.6 时序图案例程 1

    依旧拿支付宝红包的二维码为例,其时序图案如图 6.7 所示:



    图6.7 时序图案例程 2

    这里写图片描述

    6.4 格式信息

    格式信息如下图 6.8 所示:



    图6.8 格式信息

    格式信息在定位图案周围分布,由于定位图案个数固定为 3 个,且大小固定,故格式信息也是一个固定 15bits 的信息。每个 bit 的位置如下图 6.9 所示:(注:图中的 Dark Module 是固定永远出现的



    图6.9 格式信息位置

    15bits 中数据,按照 5bits 的数据位 + 10bits 纠错位的顺序排列:

    • 数据位占 5bits:其中 2bits 用于表示使用的纠错等级 (Error Correction Level),3bits 用于表示使用的蒙版 (Mask) 类别;
    • 纠错位占 10bits:主要通过 BCH Code 计算;

    为了减少扫描后图像识别的困难,最后还需要将 15bits 与 101010000010010 做异或 XOR 操作。因为我们在原格式信息中可能存在太多的 0 值(如纠错级别为 00,蒙版 Mask 为 000),使得格式信息全部为白色,这将增加分析图像的困难。

    纠错等级的编码如下图 6.10 的表格所示:



    图6.10 纠错等级编码

    关于蒙版图案的生成,在后文 6.7 中具体说明。格式信息的示例如下:

    假设存在纠错等级为 M(对应 00),蒙版图案对应 000,5bits 的数据位为 00101,10bits 的纠错位为 0011011100
    则生成了在异或操作之前的 bits 序列为:001010011011100
    101010000010010 做异或 XOR 操作,即得到最终格式信息:100000011001110

    6.5 版本信息 (Version Information)

    对于 Version 7 及其以上的二维码,需要加入版本信息。如下图 6.11 蓝色部分所示:



    图6.11 版本信息

    版本信息依附在定位图案周围,故大小固定为 18bits。水平竖直方向的填充方式如下图 6.12 所示:



    图6.12 版本信息填充方式

    18bits 的版本信息中,前 6bits 为版本号 (Version Number),后 12bits 为纠错码 (BCH Bits)。示例如下:

    假设存在一个 Version 为 7 的二维码(对应 6bits 版本号为 000111),其纠错码为 110010010100;
    则版本信息图案中的应填充的数据为:000111110010010100

    6.6 数据码与纠错码

    此后即可填充第五章得到的数据内容了。填充的思想如下图 6.13 的 Version 3 二维码所示,从二维码的右下角开始,沿着红线进行填充,遇到非数据区域,则绕开或跳过。



    图6.13 二维码数据填充(原始版)

    然而这样难以理解,我们可以将其分为许多小模块,然后将许多小模块串连在一起,如下图 6.14 所示(截取自 QR Code Spec 的图 15):



    图6.14 二维码数据填充

    小模块可以分为常规模块和非常规模块,每个模块的容量都为 8。常规情况下,小模块都为宽度为 2 的竖直小矩阵,按照方向将 8bits 的码字填充在内。非常规情况下,模块会产生变形。
    填充方式上图 6.14,图中深色区域(如 D1 区域)填充数据码,白色区域(如 E15 区域)填充纠错码。遍历顺序依旧从最右下角的 D1 区域开始,按照蛇形方向(D1→D2→…→D28→E1→E2→…→E16→剩余码)进行小模块的填充,并从右向左交替着上下移动。下面给出若干填充原则:

    原则 1:无论数据的填充方向是向上还是向下,常规模块(即 8bits 数据全在两列内)的排列顺序应是从右向左,如下图 6.15所示;



    图6.15 常规模块内的填充方向

    原则 2:每个码字的最高有效位(即第7个bit)应置于第一个可用位。对于向上填充的方向,最高有效位应该占据模块的右下角;向下填充的方向,最高有效位占据模块的右上方。
    注:对于某些模块(以下图 6.17 为例),如果前一个模块在右边模块的列内部结束,则该模块成为不规则模块,且与常规模块相比,原本填充方向向上时,最高位应该在右上角,此时则变为左下角;
    原则 3:当一个模块的两列同时遇到对齐图案或时序图案的水平边界时,它将继续在图案的上方或下方延续;
    原则 4:当模块到达区域的上下边界(包括二维码的上下边界、格式信息、版本信息或分隔符)时,码字中任何剩余 bits 将填充在左边的下一列中,且填充方向反转;如下图 6.16 中的两个模块遇到了二维码的上边界,则方向发生变化;



    图6.16 非常规模块填充方向的改变(举例于 QR Code Spec 图 13)

    原则 5:当模块的右一列遇到对齐图案,或遇到被版本信息占据的区域时,数据位会沿着对齐图案或版本信息旁边的一列继续填充,并形成一个不规则模块。如果当前模块填充结束之前,下一个的两列都可用,则下一个码字的最高有效位应该放在单列中,如下图 6.17 所示:



    图6.17 模块单列填充

    6.7 蒙版图案

    按照上述思路即可将二维码填充完毕。但是那些点并不均衡,如果出现了大面积的空白或黑块,扫描识别会十分困难,所以按照在前文 6.4 中格式信息的处理思路,对整个图像与蒙版进行蒙版操作(Masking),蒙版操作即为异或 XOR 操作。
    二维码又 8 种蒙版可以使用,如下图 6.18 所示,公式也在图中说明。蒙版只会和数据区进行异或操作,不会影响与格式信息相关的功能区。
    注:选择一个合适的蒙版也是有一定算法的。

    蒙版图案如下图 6.18 所示,对应的产生公式与蒙版 ID 如下图 6.19 的表格所示:



    图6.18 蒙版图案



    图6.19 蒙版图案产生公式

    蒙版操作的过程与对比图如下图 6.20 所示,图中最上层是没有经过蒙版操作的原始二维码,其中存在大量黑色区域,难以后续的分析识别。经过两种不同蒙版的处理,可以看到最后生成的二维码变的更加混乱,容易识别。



    图6.20 蒙版操作示例

    蒙版操作之后,得到的二维码即为最终我们平常看到的结果。

    七. 源码

    笔者原本准备用 C++ 与 OpenCV 写一个二维码解析程序,现在学了二维码的原理后,发现好难。另外网上关于二维码解析与生成的程序基本都是用 Python 写的,笔者又想找个合适机会学习一下 Python,所以这段时间就准备从二维码入手,学习一下 Python 的基础~

    源码及解析笔者会随学习的进度持续更新~

    八. 后记

    笔者学习完毕二维码内容后不禁感叹,二维码规则的制定当真是凝聚了多少研究者的心血。学无止境,在知识的海洋中,当真是需要抱着敬畏之心和谦卑的态度,才能体会到这片海洋的浩瀚。
    研究二维码的过程十分有趣,学到了不少东西,后续过程中笔者会持续更新对二维码的学习心得体会~

    展开全文
  • 二维码原理详解

    万次阅读 多人点赞 2019-08-02 21:55:01
    一:二维码 /QR Code(Quick Response)简介 是一种编码方式,它比传统的 Bar Code 条形码能存更多的信息,也能表示更多的数据类型:比如:字符,数字,日文,中文等等。近几年随着我国移动支付等等发展迅猛,变得非常...

    一:二维码 / QR Code(Quick Response)简介

    是一种编码方式,它比传统的 Bar Code 条形码能存更多的信息,也能表示更多的数据类型:比如:字符,数字,日文,中文等等。近几年随着我国移动支付等等发展迅猛,变得非常流行,但这个东西好像是日本人发明的...

    从字面上看就是用两个维度(水平方向和垂直方向)来进行数据的编码,条形码只利用了一个维度(水平方向)表示信息,在另一个维度(垂直方向)没有意义,所以二维码比条形码有着更高的数据存储容量。

    从形成方式上,二维码可以分为两类:堆叠式二维码:在一维条形码的基础上,将多个条形码堆积在一起进行编码,常见的编码标准有PDF417等.这个是美国人发明的,不常用.矩阵式二维码:在一个矩阵空间中通过黑色和白色的方块进行信息的表示,黑色的方块表示1,白色的方块表示0,相应的组合表示了一系列的信息,常见的编码标准有QR 码,在我国非常常用.

    图1 PDF417码示例
    图2 QR码示例 

     

    由于学习需要,所以看了一些相关知识,觉得这个玩意就是一个密码算法.

    二:基本概念

    首先,我们先说一下二维码一共有 40 个尺寸。官方叫版本 Version。Version 1 是 21 x 21 的矩阵,Version 2 是 25 x 25 的矩阵,Version 3 是 29 的尺寸,每增加一个 version,就会增加 4 的尺寸,公式是:(V-1)*4 + 21(V是版本号) 最高 Version 40,(40-1)*4+21 = 177,所以最高是 177 x 177 的正方形。

    三.二维码组成及对应功能

    图3 QR码图示

     

    A:功能图形区:起到定位的作用

    a:定位图形

    由两条黑白相间的直线组成,便于确定二维码的角度,纠正扭曲。

    b:校正图形      

    仅在版本2以上存在,由三个黑白相间的小正方形嵌套组成,便于确定中心,纠正扭曲。

    c:位置探测图形

    由三个黑白相间的大正方形嵌套组成,分别位于二维码左上角、右上角、左下角,目的是为了确定二维码的大小和位置。

    B:数据编码区:记录了具体的数据信息,纠错信息与版本信息。

    d:数据码和纠错码

    数据码(Data Code ):存储要存放的数据信息

    纠错码(Error Correction Code ):纠错码的存在使得当二维码的数据出现允许范围内的错误时,也可以正确解码。这就是为什么二维码有残缺还能扫出来,也就是为什么有人在二维码的中心位置加入图标。二维码存在4个级别的纠错等级,每个纠错级别可修正的错误与标识见图4,纠错级别越高,可以修正的错误就越多,需要的纠错码的数量也变多,相应的可储存的数据就会减少,版本1的二维码在L级别下可储存25个字符,在H级别下只能储存10个字符。

    图4 

    e:版本信息      

    仅在版本7以上存在,记录具体的版本信息。

    f:格式信息      

    记录使用的掩码和纠错等级。

    g:数据编码

    不在详述,见编码规则

    C:此外二维码的外围还留有一圈空白区:主要是为了便于识别而存在。

    四.编码规则(重点,所以单列)

    数据编码的方式有很多,如Numeric mode数字编码;Byte mode,字节编码;Alphanumeric mode 字符编码;Kanji mode 这是日文编码,也是双字节编码;Extended Channel Interpretation (ECI) mode 主要用于特殊的字符集。并不是所有的扫描器都支持这种编码;Structured Append mode 用于混合编码,也就是说,这个二维码中包含了多种编码格式;FNC1 mode 等;

    每一个编码方式都有其独有的id进行标识,这些标识会记录在数据区的前端,使得解码器可以根据二维码使用的编码方式对数据进行解码.

    图5 编码方式及其标识

     

    1.字符编码示例

    Alphanumeric mode 字符编码。包括 0-9,大写的A到Z(没有小写),以及符号$ % * + – . / : 包括空格。这些字符会映射成一个字符索引表。如图6所示:(其中的 SP 是空格,Char 是字符,Value 是其索引值) 编码的过程是把字符两两分组,然后转成下表的 45 进制,然后转成 11bits 的二进制,如果最后有一个落单的,那就转成 6bits 的二进制。而编码模式和字符的个数需要根据不同的 Version 尺寸编成9, 11 或 13 个二进制(如图7)

    先简单举个例子让大家觉得很简单明了:

    A B C D E F
    10 11 12 13 14 15

    那么字符串AB=10*45+11.

    为什么以长度为二的字符串举例,因为字符编码是两两分组

    接下来进入正题:

    在 Version 1 的尺寸下,纠错级别为H的情况下,编码: AC-42

    第一步:先两两分组:(AC)(-4)(2),然后把每一组转成 11bits 的二进制:

    (AC)=10*45+12 等于 462 转成 00111001110

    (41,4)=41*45+4 等于 1849 转成 11100111001

    (2) 转成 000010  落单就是6bits

    第二步:把这些二进制连接起来:00111001110 11100111001 000010,把字符的个数转成二进制 (Version 1-H 为 9 bits ): 5 个字符,5 转成 000000101(9bits图7)

    最后,在头上加上编码标识 0010(如图5) 和第 5二步的个数编码:  0010 000000101 00111001110 11100111001 000010

     

    图6  字符索引表

     

    2.数字编码示例

    Numeric mode 数字编码,从 0 到9。如果需要编码的数字的个数不是 3 的倍数,那么,最后剩下的 1 或 2 位数会被转成 4 或 7bits,则其它的每 3 位数字会被编成 10,12,14bits,编成多长还要看二维码的尺寸(图7说明了这点)

    在 Version 1 的尺寸下,纠错级别为H的情况下,编码: 01234567(和前面的字符编码差不多)

      1. 把上述数字分成三组: 012 345 67

      2. 把他们转成二进制:  012 转成 0000001100;  345 转成 0101011001;  67 转成 1000011。

      3. 把这三个二进制串起来: 0000001100 0101011001 1000011

      4. 把数字的个数转成二进制 (version 1-H 是 10 bits ): 8 个数字的二进制是 0000001000

      5. 把数字编码的标志 0001 和第 4 步的编码加到前面:  0001 0000001000 0000001100 0101011001 1000011

    图7

    五:结束符和补齐码

    1.结束符

    假如我们有个HELLO WORLD的字符串要编码,根据上面的示例二,我们可以得到下面的编码:

    编码 字符数 HELLO WORLD的编码 加上的结束符
    0010 000001011 01100001011 01111000110 10001011100 10110111000 10011010100 001101 0000

    按8bits重排:如果所有的编码加起来不是8个倍数我们还要在后面加上足够的0,比如上面一共有78个bits,所以,我们还要加上2个0,然后按8个bits分好组:

    00100000   01011011   00001011   01111000   11010001   01110010   11011100   01001101   01000011   01000000                                   2.补齐码

    最后,如果如果还没有达到我们最大的bits数的限制,我们还要加一些补齐码(Padding Bytes),Padding Bytes就是重复下面的两个bytes:11101100 00010001 (这两个二进制转成十进制是236和17,我也不知道为什么,只知道Spec上是这么写的)关于每一个Version的每一种纠错级别的最大Bits限制,可以参看QR Code Spec的第28页到32页的Table-7一表。

    假设我们需要编码的是Version 1的Q纠错级,那么,其最大需要104个bits,而我们上面只有80个bits,所以,还需要补24个bits,也就是需要3个Padding Bytes,我们就添加三个,于是得到下面的编码:

    00100000 01011011 00001011 01111000 11010001 01110010 11011100 01001101 01000011 01000000 11101100 00010001 11101100

    上面的编码就是数据码了,叫Data Codewords,每一个8bits叫一个codeword,我们还要对这些数据码加上纠错信息。

    六.纠错码

    见图四及其上面简述(思路有点混乱,排版出了点问题)

    那么,QR是怎么对数据码加上纠错码的?首先,我们需要对数据码进行分组,也就是分成不同的Block,然后对各个Block进行纠错编码,对于如何分组,我们可以查看QR Code Spec的第33页到44页的Table-13到Table-22的定义表。注意最后两列

    Number of Error Code Correction Blocks  需要分多少个块
    Error Correction Code Per Blocks 每一个块中的code个数,所谓的code的个数,也就是有多少个8bits的字节
    图8 不同Version +不同纠错级对应的值

    举个例子:上述的Version 5 + Q纠错级:需要4个Blocks(2个Blocks为一组,共两组),头一组的两个Blocks中各15个bits数据 (k)+ 各 9个bits的纠错码(r)(注:表中的codewords就是一个8bits的byte)(再注:最后一例中的(c, k, r )的公式为:c = k + 2 * r,因为后脚注解释了:纠错码的容量小于纠错码的一半)

    下图给一个5-Q的示例(因为二进制写起来会让表格太大,所以,我都用了十进制,我们可以看到每一块的纠错码有18个codewords,也就是18个8bits的二进制数)

    注意不要错误以为是上面的编码数据,上面的是Version 1的Q纠错级,而这个是Version 5 + Q纠错级,只是举个例子

    图9

     

    注:二维码的纠错码主要是通过Reed-Solomon error correction(里德-所罗门纠错算法)来实现的。由于这个算法相当的复杂,所以...

    七.最终编码

    放置规则:穿插放置

    如果你以为我们可以开始画图,你就错了。二维码的混乱技术还没有玩完,它还要把数据码和纠错码的各个codewords交替放在一起。如何交替呢,规则如下:

    对于数据码:把每个块的第一个codewords先拿出来按顺度排列好,然后再取第一块的第二个,如此类推。如:上述示例中的Data Codewords如下:

    数据码表
    块1 67 85 70 134 87 38 85 194 119 50 6 18 6 103 38  
    块2 246 246 66 7 118 134 242 7 38 86 22 198 199 146 6  
    块3 182 230 247 119 50 7 118 134 87 38 82 6 134 151 50 7
    块4 70 247 118 86 194 6 151 50 16 236 17 236 17 236 17 236

     

    我们先取第一列的:67, 246, 182, 70

    然后再取第二列的:67, 246, 182, 70, 85,246,230 ,247

    如此类推:67, 246, 182, 70, 85,246,230 ,247 ………  ……… ,38,6,50,17,7,236

    对于纠错码,也是一样:

    纠错码表
    块1 233 199 11 45 115 247 241 223 229 248 154 117 154 111 86 161 111 39
    块2 87 204 96 60 202 182 124 157 200 134 27 129 209 17 163 163 120 133
    块3 148 116 177 212 76 133 75 242 238 76 195 230 189 10 108 240 192 141
    块4 235 159 5 173 24 147 59 33 106 40 255 172 82 2 131 32 178 236

    和数据码取的一样,得到:213,87,148,235,199,204,116,159,…… …… 39,133,141,236

    然后,再把这两组放在一起(纠错码放在数据码之后)得到:

    67, 246, 182, 70, 85, 246, 230, 247, 70, 66, 247, 118, 134, 7, 119, 86, 87, 118, 50, 194, 38, 134, 7, 6, 85, 242, 118, 151, 194, 7, 134, 50, 119, 38, 87, 16, 50, 86, 38, 236, 6, 22, 82, 17, 18, 198, 6, 236, 6, 199, 134, 17, 103, 146, 151, 236, 38, 6, 50, 17, 7, 236, 213, 87, 148, 235, 199, 204, 116, 159, 11, 96, 177, 5, 45, 60, 212, 173, 115, 202, 76, 24, 247, 182, 133, 147, 241, 124, 75, 59, 223, 157, 242, 33, 229, 200, 238, 106, 248, 134, 76, 40, 154, 27, 195, 255, 117, 129, 230, 172, 154, 209, 189, 82, 111, 17, 10, 2, 86, 163, 108, 131, 161, 163, 240, 32, 111, 120, 192, 178, 39, 133, 141, 236

    这就是我们的数据区。

    最后再加上Reminder Bits,对于某些Version的QR,上面的还不够长度,还要加上Remainder Bits,比如:上述的5Q版的二维码,还要加上7个bits,Remainder Bits加零就好了。关于哪些Version需要多少个Remainder bit,可以参看QR Code Spec的第15页的Table-1的定义表。

    八.画出二维码图

    1.Position Detection Pattern

    首先,先把Position Detection图案画在三个角上。(无论Version如何,这个图案的尺寸就是这么大)

    位置探测图像

    2.Alignment Pattern

    然后,再把Alignment图案画上(无论Version如何,这个图案的尺寸就是这么大)

    校正图像

    关于Alignment的位置,可以查看QR Code Spec的第81页的Table-E.1的定义表(下表是不完全表格)

    下图是根据上述表格中的Version8的一个例子(6,24,42)

    3.Timing Pattern

    定位图形

    4.Format Information(下图中的蓝色部分)

    格式信息

    Format Information是一个15个bits的信息:

    这15个bits中包括:

    • 5个数据bits:其中,2个bits用于表示使用什么样的Error Correction Level, 3个bits表示使用什么样的Mask
    • 10个纠错bits。主要通过BCH Code来计算

    然后15个bits还要与101010000010010做XOR(异或)操作。这样就保证不会因为我们选用了00的纠错级别和000的Mask,从而造成全部为白色,这会增加我们的扫描器的图像识别的困难。

    5.Version Information(版本7以后需要这个编码,下图中的蓝色部分)

    版本信息

    Version Information一共是18个bits,其中包括6个bits的版本号以及12个bits的纠错码

    6.数据和数据纠错码

    然后是填接我们的最终编码,最终编码的填充方式如下:从左下角开始沿着红线填我们的各个bits,1是黑色,0是白色。如果遇到了上面的非数据区,则绕开或跳过。

    7.掩码图案

    这样下来,我们的图就填好了,但是,也许那些点并不均衡,如果出现大面积的空白或黑块,会告诉我们扫描识别的困难。所以,我们还要做Masking操作(掩膜操作)QR的Spec中说了,QR有8个Mask你可以使用,如下所示:其中,各个mask的公式在各个图下面。所谓mask,说白了,就是和上面生成的图做XOR操作。Mask只会和数据区进行XOR,不会影响功能区。

    其Mask的标识码如下所示:(其中的i,j分别对应于上图的x,y)

    下面是Mask后的一些样子,我们可以看到被某些Mask XOR了的数据变得比较零散了。

    Mask过后的二维码就成最终的图了。

    九:总而言之

    二维码的原理可以简单总结为:

    将我们想要存储的信息,通过不同的编码格式转换为二进制字符串,字符在变成0和1组成的序列之后,再进行一系列优化算法,就得到了最终的二进制编码.1对应黑色小方块,0对应白色小方块,然后将这些小方块八个一组填进大方块里.就变成了大家看到的二维码了.(说法过于简单,不要深究.当然里面除了要存储的信息还有类似上面所述的定位图案,功能性数据,纠错码,掩码等)

    展开全文
  • 二维码生成以及扫一扫解析二维码原理 1、生成URL,确定要通过二维码传达的信息,也就是通过扫一扫可以获得地址和数据信息 1、// 得到随机数,用随机数得到签名,签名验证身份 String ranString = ...
    二维码生成以及扫一扫解析二维码原理


    1、生成URL,确定要通过二维码传达的信息,也就是通过扫一扫可以获得地址和数据信息


    1、// 得到随机数,用随机数得到签名,签名验证身份
    String ranString = RandomStringUtils.randomAlphanumeric(10);


    2、其他参数信息,在二维码中存储的信息非常有限,所有在微信,支付宝的二维码一般不带参数,而是只包含地址信息,在其地址中就包含相应的信息,微信或者支付宝
    //在这一般上送标识字段不上送数据信息,状态字段用于判断什么状态下执行什么操作
    String orderNo = "123456";
    Map<String, String> maps = new HashMap<String, String>();
    maps.put("orderNo", orderNo);
    maps.put("xx", xx);


    3、// 根据规则生成URL,这个URL就是存放到二维码中的数据
    String url = generateUrl(ranString, maps);
    System.out.println("生成后的URL为: " + url);


    4、生成URL方法

    // 扫描二维码需要访问的URL,如果是想访问自己的App,则把相应的APP地址放到二维码中
    private static final String BASE_URL = "https://st1.tyest.com/app-server";
    /**
    * 生成二维码URL地址
    * @param paramMaps
    *            上送字段map
    * @param RanSign
    *            随机数
    * @return
    * @throws Exception
    */
    public static String generateUrl(String RanSign, Map<String, String> paramMaps) {
    String url = null;
    String data = "";
    try {
    // 拼接业务信息字符串,需要上送的字段信息
    for (Iterator<Entry<String, String>> it = paramMaps.entrySet()
    .iterator(); it.hasNext();) {
    Entry<String, String> entry = it.next();
    String inputPartkey = entry.getKey();
    String inputPart = entry.getValue();
    data += inputPartkey + "=" + inputPart + "&";
    }
    // 对数据信息加密,可以加密,但是二维码存放不下aes加密后的数据,太大了
    /*AES aes = new AES();
    String HexString = aes.encrypt(data, AES_KEY);*/
    //拼接的字符串多了&,类似data=XXX&sign=XXX
    data=(String) data.subSequence(0, data.length()-1);
    System.out.println("业务信息字符串: " + data);
    // 对业务信息进行签名,得到签名信息,包含上送字段,这就是通过扫一扫后得到地址后面一串很长的字符串
    String sign = SHA1.genSign(RanSign);
    System.out.println("签名: " + sign);
    // 后面的则是需要访问的具体的接口,以及需要上送的参数,上送字段可以选择是否加密
    url = BASE_URL + "/test/testInterface?sign=" + sign + "&data=" + data;
    } catch (Exception e) {
    e.printStackTrace();
    }
    return url;
    }


    5、绘制二维码


    // 根据URL生成二维码图片,把上面的URL以及参数信息写到二维码中,添加logo图片的路径


    String logoPath = "D:\\testbail.png";
    BufferedImage image = QrCodeImgUtil.qrCodeEncode(url, logoPath);

    // 得到outputStream把数据信息写出来
    OutputStream out = new FileOutputStream(new File("D:\\testbail.png"));
    //把图片绘制到给出的画板上
    ImageIO.write(image, "png", out);
    System.out.println("图片生成完成");
    System.out.println("ranString=" + ranString);


    6、绘制方法,网上其实有很多的类似方法,不过还是说下吧
    public static BufferedImage qrCodeEncode(String encodeddata,String logoPath)
    throws IOException {
    Qrcode qrcode = new Qrcode();
    // 纠错级别(L 7%、M 15%、Q 25%、H 30%)和版本有关
    qrcode.setQrcodeErrorCorrect('M'); 
    qrcode.setQrcodeEncodeMode('B');
    qrcode.setQrcodeVersion(7); // 设置Qrcode包的版本

    byte[] d = encodeddata.getBytes("utf-8"); // 字符集
    BufferedImage bi = new BufferedImage(width, height, BufferedImage.TYPE_INT_RGB);
    // 创建图层
    Graphics2D g = bi.createGraphics();

    g.setBackground(Color.WHITE); // 设置背景颜色(白色)
    g.clearRect(0, 0, width, height); // 矩形 X、Y、width、height
    g.setColor(Color.BLACK); // 设置图像颜色(黑色)


    if (d.length > 0 && d.length < 123) {
    boolean[][] b = qrcode.calQrcode(d);
    for (int i = 0; i < b.length; i++) {
    for (int j = 0; j < b.length; j++) {
    if (b[j][i]) {
    g.fillRect(j * 3 + 2, i * 3 + 2, 3, 3);
    }
    }
    }
    }


    /* 添加logo图片 */  
    if(logoPath!=null){  
    int width_4 = width / 4;  
    int width_8 = width_4 / 2;  
    int height_4 = height / 4;  
    int height_8 = height_4 / 2;  
    Image img = ImageIO.read(new File(logoPath));  
    g.drawImage(img, width_4 + width_8, height_4 + height_8,width_4,height_4, null);  
    g.dispose();    
    bi.flush();  



    g.dispose(); // 释放此图形的上下文以及它使用的所有系统资源。调用 dispose 之后,就不能再使用 Graphics 对象
    bi.flush(); // 刷新此 Image 对象正在使用的所有可重构的资源
    return bi;
    }

    6、打开D:\\testbail.png生产的二维码图片,通过扫一扫可以得到如下的类似信息

    https://st1.tyest.com/app-server/test/testInterface?sign=a094bb8f56bd2beac35949a76e2ca35dd6e69c87&orderNo=123456

    这个就是我们常见的URL了,通过浏览器就可以访问了。



    2、 二维码的解析:


    1、代码解析二维码图片

    //解析的二维码路径
    String imgPath = "D:\\testbail.png";
    File imageFile = new File(imgPath);
    // 测试解析二维码图片内容
    String decoderContent = QrCodeImgUtil.qrCodeDecode(imageFile);
    System.out.println(decoderContent);
    System.out.println("=========解码成功===========");

    首先我们要知道,代码解析会解析图片上的所有信息,当然包括图片信息,
    然而图片logo是外加入的,所以通过代码解析不了带有logo的二维码,这一点
    我还没想到怎么做,有知道的

    相关实现方法:
    /**
    * 解析二维码,返回解析内容

    * @param imageFile
    * @return
    */
    public static String qrCodeDecode(File imageFile) {
    String decodedData = null;
    QRCodeDecoder decoder = new QRCodeDecoder();
    BufferedImage image = null;
    try {
    image = ImageIO.read(imageFile);
    } catch (IOException e) {
    System.out.println("Error: " + e.getMessage());
    }


    try {
    decodedData = new String(decoder.decode(new J2SEImage(image)),"utf-8");
    } catch (DecodingFailedException dfe) {
    System.out.println("Error: " + dfe.getMessage());
    } catch (UnsupportedEncodingException e) {
    e.printStackTrace();
    }
    return decodedData;
    }

    得到结果:
    https://st1.tyest.com/app-server/test/testInterface?sign=d4b8ae6e19daf14fb8dbaac9ce6ce9bc6f8679f5&orderNo=123456
    =========解码成功===========

    2、通过扫一扫工具解析(最简单的一种解析方式)


    3、扫描二维码背后的故事:

    通过上面的方式我们生产了我们自己的二维码,通过扫一扫就可以访问我们自己的系统实现相应的功能,
    在这里我们模拟实现一下


    String sign = "82385294b5eee3adb2fcedcf0868a219e0e69e1f";
    String data = "orderNo=123456";
    String ranString ="GJ5U6PfwbyvA8WZxEJt8s7rKqYQzEl6v";
    // 假设该方法就是我们定义的接口,而这两个参数正式通过扫一扫获得数据信息。模拟调接口
    testInterface(ranString, sign, data);


    private static void testInterface(String ranString, String sign, String data) {
    // 首先我们验证签名信息,正确则继续,否则验证不通过,二维码有误,在这里我们就知道了,用支付宝或者微信扫描彼此的二维码,就会提示无效的二维码
    // 就是因为在验签的时候失败了,就无法继续
    if (SHA1.verifySign(ranString, sign)) {
    // 验签成功
    // 对数据信息解密,如果数据加密的话
    AES aes = new AES();
    try {
    String deString = aes.decrypt(data, AES_KEY);
    System.out.println(deString);


    // 做相应的业务处理逻辑

    } catch (CryptException e) {
    e.printStackTrace();
    }


    } else {
    //扫二维码验签失败,说明不是可处理的二维码
    System.out.println("二维码有误!");
    }


    }

    扫描二维码就是访问接口,和我们平时写的接口一样的道理,多看看就会明白。
    在我的资源里上传了二维码的代码,有需要的支持下,有不当之处,望各位猿友之处,万分感谢。


    通过此实例,相信对二维码有了进一步的认识。

    每天努力一点,每天都在进步。


    展开全文
  • 二维码(QR code)基本结构及生成原理

    万次阅读 多人点赞 2016-11-27 00:14:49
    什么是二维码二维码 (2-dimensional bar code),是用某种特定的几何图形按一定规律在平面(二维方向上)分布的黑白相间的图形记录数据符号信息的。在许多种类的二维条码中,常用的码制有:Data Matrix, Maxi ...

    什么是二维码

    二维码 (2-dimensional bar code),是用某种特定的几何图形按一定规律在平面(二维方向上)分布的黑白相间的图形记录数据符号信息的。

    在许多种类的二维条码中,常用的码制有:Data Matrix, Maxi Code, Aztec, QR Code, Vericode, PDF417, Ultracode, Code 49, Code 16K等。

    二维条码/二维码可以分为堆叠式/行排式二维条码和矩阵式二维条码。

    1.堆叠式/行排式二维条码,堆叠式/行排式二维条码又称堆积式二维条码或层排式二维条码,其编码原理是建立在一维条码基础之上,按需要堆积成二行或多行。它在编码设计、校验原理、识读方式等方面继承了一维条码的一些特点,识读设备与条码印刷与一维条码技术兼容。但由于行数的增加,需要对行进行判定,其译码算法与软件也不完全相同于一维条码。有代表性的行排式二维条码有:Code 16K、Code 49、PDF417、MicroPDF417 等。

    2.矩阵式二维码,最流行莫过于QR CODE ,我们常说的二维码就是它了。矩阵式二维条码(又称棋盘式二维条码)它是在一个矩形空间通过黑、白像素在矩阵中的不同分布进行编码。在矩阵相应元素位置上,用点(方点、圆点或其他形状)的出现表示二进制“1”,点的不出现表示二进制的“0”,点的排列组合确定了矩阵式二维条码所代表的意义。矩阵式二维条码是建立在计算机图像处理技术、组合编码原理等基础上的一种新型图形符号自动识读处理码制。具有代表性的矩阵式二维条码有:Code One、MaxiCode、QR Code、 Data Matrix、Han Xin Code、Grid Matrix 等。

    二维码在现实生活中的应用越来越普遍由于QR CODE的流行,二维码又称QR code。

    QR码的特点

    1.存储大容量信息

    传统的条形码只能处理20位左右的信息量,与此相比,QR码可处理条形码的几十倍到几百倍的信息量。

    另外,QR码还可以支持所有类型的数据。(如:数字、英文字母、日文字母、汉字、符号、二进制、控制码等)。一个QR码最多可以处理7089字(仅用数字时)的巨大信息量。

    2.在小空间内打印

    QR码使用纵向和横向两个方向处理数据,如果是相同的信息量,QR码所占空间为条形码的十分之一左右。(还支持Micro QR码,可以在更小空间内处理数据。)

    这里写图片描述

    3.有效表现各种字母

    QR码是日本国产的二维码,因此非常适合处理日文字母和汉字。QR码字集规格定义是按照日本标准“JIS第一级和第二级的汉字”制定的,因此在日语处理方面,每一个全角字母和汉字都用13比特的数据处理,效率较高,与其他二维码相比,可以多存储20%以上的信息。

    这里写图片描述

    4.对变脏和破损的适应能力强

    QR码具备“纠错功能”,即使部分编码变脏或破损,也可以恢复数据。数据恢复以码字为单位(是组成内部数据的单位,在QR码的情况下,每8比特代表1码字),最多可以纠错约30%(根据变脏和破损程度的不同,也存在无法恢复的情况)。

    5.可以从任意方向读取

    QR码从360°任一方向均可快速读取。其奥秘就在于QR码中的3处定位图案,可以帮助QR码不受背景样式的影响,实现快速稳定的读取。

    这里写图片描述

    6.支持数据合并功能

    QR码可以将数据分割为多个编码,最多支持16个QR码。使用这一功能,还可以在狭长区域内打印QR码。另外,也可以把多个分割编码合并为单个数据。

    这里写图片描述

    QR码的信息量和版本

    QR码设有1到40的不同版本(种类),每个版本都具备固有的码元结构(码元数)。(码元是指构成QR码的方形黑白点。)

    “码元结构”是指二维码中的码元数。从版本1(21码元×21码元)开始,在纵向和横向各自以4码元为单位递增,一直到版本40(177码元×177码元)。

    这里写图片描述

    QR码的各个版本结合数据量、字符类型和纠错级别,均设有相对应的最多输入字符数。也就是说,如果增加数据量,则需要使用更多的码元来组成QR码,QR码就会变得更大。

    例如,需要输入的数据为100位的数字时,通过以下步骤来选定。
    1.假设要输入的数据种类为“数字”
    2.从“L”“M”“Q”“H”中选择纠错级别。(假设选择“M”)
    3.查看下表,先从数字列找出数字为100以上且接近100的,其次找出纠错级别“M”,两者交叉的部分就是最佳版本。

    这里写图片描述

    通过下面的计算为每个字符类型,总比特数的计算方法。
    这里写图片描述

    QR码的纠错

    QR码具有“纠错功能”。即使编码变脏或破损,也可自动恢复数据。这一“纠错能力”具备4个级别,用户可根据使用环境选择相应的级别。调高级别,纠错能力也相应提高,但由于数据量会随之增加,编码尺寸也也会变大。
    用户应综合考虑使用环境、编码尺寸等因素后选择相应的级别。 在工厂等容易沾染赃物的环境下,可以选择级别Q或H,在不那么脏的环境下,且数据量较多的时候,也可以选择级别L。一般情况下用户大多选择级别M(15%)。
    这里写图片描述

    纠错级别的比率,是指全部码字与可以纠错的码字的比率。
    例如,需要编码的码字数据有100个,并且想对其中的一半,也就是50个码字进行纠错,则计算方法如下。纠错需要相当于码字2倍的符号(RS编码※),因此在这种情况下的数量为50个×2=100码字。因此,全部码字数量为200个,其中用作纠错的码字为50个,所以计算得出,相对于全部码字的纠错率就是25%。这一比率相当于QR码纠错级别中的“Q”级别。

    另外,在上述例子当中,也可以认为相对于码字数据的纠错率为50%,但变脏或破损的部位不仅仅局限于码字数据部分,因此,在QR码中,还是用相对于全部码字的比率来描述纠错率。

    ※ RS编码:QR码的纠错功能是通过将RS编码附加到原数据中的方式实现的。RS编码是应用于音乐CD等用途的数学纠错方法。它能以字节为单位进行纠错,适合用于错误位置会集中的突发错误。

    QR码的种类

    这里写图片描述

    QR码的基本结构

    QR(Quick-Response) code是被广泛使用的一种二维码,解码速度快。它可以存储多用类型,下图是qrcode的基本结构:

    这里写图片描述

    位置探测图形、位置探测图形分隔符、定位图形:用于对二维码的定位,对每个QR码来说,位置都是固定存在的,只是大小规格会有所差异;
    校正图形:规格确定,校正图形的数量和位置也就确定了;
    格式信息:表示改二维码的纠错级别,分为L、M、Q、H;

    版本信息:即二维码的规格,QR码符号共有40种规格的矩阵(一般为黑白色),从21x21(版本1),到177x177(版本40),每一版本符号比前一版本 每边增加4个模块。

    数据和纠错码字:实际保存的二维码信息,和纠错码字(用于修正二维码损坏带来的错误)。

    QR码的编码过程

    下面是简要QR编码过程:

    1.数据分析:确定编码的字符类型,按相应的字符集转换成符号字符; 选择纠错等级,在规格一定的条件下,纠错等级越高其真实数据的容量越小。

    2.数据编码:将数据字符转换为位流,每8位一个码字,整体构成一个数据的码字序列。其实知道这个数据码字序列就知道了二维码的数据内容。

    容量如下:

    格式 容量
    数字 最多7089字符
    字母 最多4296字符
    二进制数(8 bit) 最多2953字节
    日文汉字/片假名 最多1817字符(采用Shift JIS)
    中文汉字 最多984字符(采用UTF-8)
    中文汉字 最多1800字符(采用BIG5)

    模式编码如下:

    模式 指示符
    ECI 0111
    数字 0001
    字母数字 0010
    8位字节 0100
    日本汉字 1000
    中文汉字 1101
    结构链接 0011
    FNCI 0101(第一位置)
    1001(第二位置)
    终止符(信息结尾) 0000

    数据可以按照一种模式进行编码,以便进行更高效的解码,例如:对数据:01234567编码(版本1-H),
    1)分组:012 345 67
    2)转成二进制:
    012→0000001100
    345→0101011001
    67 →1000011
    3)转成序列:0000001100 0101011001 1000011
    4)字符数 转成二进制:8→0000001000
    5)加入模式指示符(上图数字)0001:0001 0000001000 0000001100 0101011001 1000011

    对于字母、中文、日文等只是分组的方式、模式等内容有所区别。基本方法是一致的。

    3.纠错编码:按需要将上面的码字序列分块,并根据纠错等级和分块的码字,产生纠错码字,并把纠错码字加入到数据码字序列后面,成为一个新的序列。

    纠错等级 纠错水平
    L 7%字码修正
    M 15%字码修正
    Q 25%字码修正
    H 30%字码修正

    在二维码规格和纠错等级确定的情况下,其实它所能容纳的码字总数和纠错码字数也就确定了,比如:版本10,纠错等级时H时,总共能容纳346个码字,其中224个纠错码字。

    就是说二维码区域中大约1/3的码字时冗余的。对于这224个纠错码字,它能够纠正112个替代错误(如黑白颠倒)或者224个据读错误(无法读到或者无法译码),这样纠错容量为:112/346=32.4%。

    4.构造最终数据信息:在规格确定的条件下,将上面产生的序列按次序放如分块中。

    按规定把数据分块,然后对每一块进行计算,得出相应的纠错码字区块,把纠错码字区块 按顺序构成一个序列,添加到原先的数据码字序列后面。
    如:D1, D12, D23, D35, D2, D13, D24, D36, … D11, D22, D33, D45, D34, D46, E1, E23,E45, E67, E2, E24, E46, E68,…

    5.构造矩阵:将探测图形、分隔符、定位图形、校正图形和码字模块放入矩阵中。

    这里写图片描述

    把上面的完整序列填充到相应规格的二维码矩阵的区域中。

    6.掩摸:将掩摸图形用于符号的编码区域,使得二维码图形中的深色和浅色(黑色和白色)区域能够比率最优的分布。

    7.格式和版本信息:生成格式和版本信息放入相应区域内。

    版本7-40都包含了版本信息,没有版本信息的全为0。二维码上两个位置包含了版本信息,它们是冗余的。

    版本信息共18位,6X3的矩阵,其中6位时数据为,如版本号8,数据位的信息时 001000,后面的12位是纠错位。

    QR码的应用

    QR码可以很“方便”地应用于各种场合。除了传单和名片等印刷物之外,还可以应用于各种广泛领域,如结算系统等与生活息息相关的领域以及工厂、流通等各种商业领域。QR码已经成为日常生活不可或缺的工具。2012年,公益财团法人日本设计振兴会对QR码表示了高度评价,由于QR码的功能非常贴近生活,设计精致,在其主办的设计推荐制度中授予QR码“优秀设计奖”。

    QR码的标准化

    “想让更多人使用QR码”,秉承这一理念,DENSO WAVE全面公开了QR码的相关标准。目前,QR码已经在国家标准和国际标准中实现标准化,任何人都可以随意查看该标准。

    ※DENSO WAVE INCORPORATED已宣布,不行使本公司就标准QR码拥有的专利权(专利第2938338号)。

    1997年 10月 被采纳为AIM International(国际自动识别工业会)标准(ISS - QR Code)
    1998年 3月 被采纳为JEIDA(日本电子工业振兴协会)标准(JEIDA-55)
    1999年 1月 被采纳为JIS(日本工业标准)(JIS X 0510)
    2000年 6月 被采纳为ISO国际标准 (ISO/IEC18004)
    2004年 11月 Micro QR码被采纳为JIS(日本工业标准)(JIS X 0510)
    2011年 12月 国际标准化组织GS1将QR码采纳为面向移动终端的标准

    QR码的简要标准
    这里写图片描述

    QR码标准文件下载

    QR码在ISO(ISO/IEC18004)中得到 标准化。因此,请从以下团体的网站购买QR码标准文件,在下面网址中搜索18004。

    http://www.iso.ch/iso/en/prods-services/ISOstore/store.html

    不过2016标准版的价格略贵,可到本人的资源中下载2006标准版的,链接如下:

    http://download.csdn.net/detail/u012611878/9687105

    另外,这里提供一个c++编写的qrcode编码解码工具,基于zxing的编码库,libqrcode的解码库,通过命令行完成二维码图片与文本之间的相互转换,链接如下:

    http://download.csdn.net/detail/u012611878/9705048

    欢迎下崽。

    展开全文
  • 二维码基本原理

    2019-09-25 14:24:10
    二维条码是指在一维条码的基础上扩展出另一维具有可读性的条码,使用黑白矩形图案表示二进制数据,被设备扫描后可获取其中所包含的信息。一维条码的宽度记载着数据,而其长度没有记载数据。二维条码的长度、宽度均...
  • 二维码生成原理及解析代码

    千次阅读 2019-06-14 17:33:39
    自从大街小巷的小商小贩都开始布满了腾讯爸爸和阿里爸爸的二维码之后,我才感觉到我大天朝共享支付的优越性。最近毕业论文写的差不多了,在入职之前多学一些东西也是好的。这里秉着好奇心,研究一下二维码的生成,并...
  • 二维码原理以及实现

    2018-03-26 14:37:51
    二维码原理的详细说明以及实现,java二维码工具类,供初学者使用
  • 二维码原理及库的使用

    千次阅读 2018-07-18 16:42:25
    二维码原理: 二维码编码流程: 二维码容量计算: 其中的只有黄色的是存储数据的内容,在第一版本中只有217(21×21 - 8*9*3 -8)个存储数据的数空间,而其中有用的数据是 217 - 1个数据结尾标志 = 216 ,在...
  • 二维码登录原理

    2019-04-24 11:36:00
    2019独角兽企业重金招聘Python工程师标准>>> ...
  • 二维码QRCODE原理详解

    千次阅读 2019-04-25 18:30:32
    QR(Quick-Response) CODE是被广泛使用的一种二维码,解码速度快。 如上图是一个二维码的基本结构,其中: 位置探测图形、位置探测图形分隔符、定位图形:用于对二维码的定位,对每个QR码来说,位置都是固定存在的...
  • 二维码的生成细节和原理

    万次阅读 多人点赞 2016-03-09 23:10:38
    二维码又称QR Code,QR全称Quick Response,是一个近几年来移动设备上超流行的一种编码方式,它比传统的Bar Code条形码能存更多的信息,也能表示更多的数据类型:比如:字符,数字,日文,中文等等。这两天学习了...
  • 二维码生成原理

    万次阅读 2018-03-20 12:07:04
    QR码生成原理(一) 一、什么是QR码 QR码属于矩阵式二维码中的一个种类,由DENSO(日本电装)公司开发,由JIS和ISO将其标准化。QR码的样子其实在很多场合已经能够被看到了,我这还是贴个图展示一下: 这个图如果被正确...
  • Android二维码原理与优化方向

    千次阅读 多人点赞 2020-03-03 16:37:31
    做过Android的二维码扫描的童鞋可能会遇到过,很多二维码识别不了,或者识别速度慢。一般造成这个识别不出来的原因,大概以下几点: Android手机配置不一样,手机像素高低也有不同,有的手机还不支持自动对焦 环境...
  • 二维码原理简介

    万次阅读 热门讨论 2012-12-04 10:06:02
    二维码的定义: 二维码 (2-dimensional bar code),是用某种特定的几何图形按一定规律在平面(二维方向上) 分布的黑白相间的图形记录数据符号信息的。 在许多种类的二维条码中,常用的制有:Data Matrix, ...
  • 二维码扫码支付原理

    千次阅读 2019-09-26 18:28:29
    线下扫码支付大大的提高了我们付款的效率,今天就主要谈一谈扫码支付的实现流程,让我们享受快捷的同时,也了解其中的原理二维码——信息的载体 说起扫码支付,就不得不提二维码。线下所有的扫码支付都是以扫...
  • 二维码扫码登录原理

    2020-05-04 18:10:57
    简要明了,步步深入,图文并茂地解析二维码扫码登录原理,让你在相同或相似的业务场景中安全可靠的实现二维码扫码登录。
  • 是java后台的二维码生成以及解析二维码原理的实例,包含二维码生产,以及解析原理,代码实现不易。
  • 二维码支付工作原理那点事

    千次阅读 2020-01-03 16:08:45
    二维码支付这些年发展的如火如荼,前两年在另外一个站上也大致分析过二维码支付的原理,年底摸摸鱼,重新整理一下吧。 (说实话我很讨厌有的人借着学习的名义把博客上的文章抄来抄去) 1、数字支付 数字支付...
  • QR生成原理(一) 一、什么是QR QR属于矩阵式二维码中的一个种类,由DENSO(日本电装)公司开发,由JIS和ISO将其标准化。QR的样子其实在很多场合已经能够被看到了,我这还是贴个图展示一下: 这...
  • 安卓开发
  • 二维码原理

    2019-11-07 08:53:39
    常见的二维码QR Code在1994年由日本的腾弘原发明,由条形发展而来,相比条形,存储能力大大提升了。 二维码组成和各部分含义 生成过程 1.Position Detection Pattern 首先,先把Position Detection图案画...
  • 二维码原理与编码介绍

    千次阅读 2014-07-05 16:25:16
    二维条码(二维码)是用某种特定的几何图形按一定规律在平面(二维方向)分布的黑白相间的图形记录数据符号信息的。二维码是DOI(Digital Object Unique Identifier,数字对象唯一识别符)的一种。 在代码编制上...
  • 视频二维码原理

    2019-11-12 11:23:56
    其实它的工作原理就跟商品外包装上底端的条形是一样的,只不过条形靠的是黑白条纹来存储。 二维码又称二维条码,常见的二维码为QR Code,QR全称Quick Response,是一个近几年来移动设备上超流...
  • 二维码原理介绍

    2017-10-20 15:11:17
    二维码结构 1.版本信息:version1(21*21),version2,...,version40,一共40个版本。版本代表每行有多少模块,每一个版本比前一个版本增加4个码元,计算公式为(n-1)*4+21,每个码元存储一个二进制0或者 1。1...
  • 二维码扫描登陆的原理及深入解析

    千次阅读 2018-10-30 17:38:19
     基本的实现流程:  ...redirect_uri=monitor.wx.com,服务端响应带有uuid=456和状态200的内容,再次发起两个ajax请求,一个长轮询/长连接请求monitor.wx.com/is_associate?uuid=456监听服务端uuid...
  • 条形二维码原理简介

    万次阅读 2018-03-20 12:04:33
    转自: ... ... 一维: 一、概念 条形由宽度不同、反射率不同的条(黑色)和空(白色)组成。按照特定的编码规则编制,用来表达一组数字、字母信息的图形标识符...
  • java生成二维码原理
  • 小知识:浅谈二维码的生成和识别原理

    万次阅读 多人点赞 2019-12-26 15:14:15
    条形 静态二维码 二进制生成图形 二维码的定位 前言 不知不觉中,我们的生活到处充满了二维码。登录账户需要二维码;加好友需要二维码;共享单车需要二维码;商品包装上也有二维码;甚至连楼下卖水果的...
  • 微信扫描二维码登陆的原理

    千次阅读 2017-08-27 16:40:12
    作者:吕十田 ... 来源:知乎 ...1、你用浏览器打开http://wx.qq.com的时候,微信给你随机分配了一个链接,【相当于给你开了间房,房号1024,注意,只给你房号,没给你钥匙】,用二维码包装着,并且
  • 说一说现在比较流行的扫码登录的实现原理。 需求介绍 首先,介绍下什么是扫码登录。现在,大部分同学手机上都装有qq和淘宝,天猫等这一类的软件。而开发这些app的企业,都有他们相对应的网站。为了让用户在使用他们...

空空如也

1 2 3 4 5 ... 20
收藏数 36,502
精华内容 14,600
关键字:

二维码原理