精华内容
下载资源
问答
  • 压缩原理及步骤&&压缩比的计算压缩原理及步骤压缩的第一步: 将一个文件以各个字符出现的次数为权值建立哈夫曼树,这样每个字符可以用从树根到该字符所在到叶子节点的路径来表示。(左为0,右为1) 压缩第二步: ...

    压缩原理及步骤&&压缩比的计算

    压缩原理及步骤

    压缩的第一步:

    将一个文件以各个字符出现的次数为权值建立哈夫曼树,这样每个字符可以用从树根到该字符所在到叶子节点的路径来表示。(左为0,右为1)

    压缩第二步:

    哈夫曼编码有一个很重要的特性:每个字符编码不会成为另一个编码的前缀。这个特性保证了即使我们把不同长度的编码存在一起,仍然也可以把它们分离开,不会出现认错人的冲突。
    那么我们就可以把所有的字符按照原有顺序用其编码替换,构建新的字符串作为其压缩后的串。

    压缩第三步:

    有的小伙伴可能要问了,这样一搞不是越变越多了么,哪是什么压缩。哈哈,大部分孩子可能已经想到啦,既然单位编码除了0就是1为什么还要用字节来存呢,用位来保存,8个单位编码为1位。这样转化完成后的串才是真正压缩后的串。

    当然,因为我们还要进行解压,所以这里构建的树也要和串一并加入到文件。

    压缩比的计算

    介绍完步骤,我们来计算一下哈夫曼编码的压缩比。 用len表示串长度,path(i)表示每i个字符的编码长度,那么根据上文所介绍的原理,我们可以很容易知道,串通过哈夫曼压缩后的长度为
    sum(path(i)) 1<=i<=len
    这个式子虽然正确但不能直观的感受的压缩比,所以我们来假设一种平均情况进行估算 假如一个 串长度为n,一共包含 m个不同的字符,那么所构建成的哈夫曼树的 总结点数为 2*m-1。 假设,n很大,那么可以忽略树的保存所占用的空间。如果假设此串中每个字符出现的次数都是相同的,那么也可以假设,它们所生成的哈夫曼树是完全二叉树. 即每个叶子(字符)的 深度为log(m)+1,则路径长度为log(m)。log(m)即为该串字符的平均路径长度,那么压缩后的串长为log(m)/8。 由上可以得出平均压缩比的公式为:
    n*log(2*m-1)/8/n = log(2*m-1)/8;
    可见压缩比的大小主要与m有关,即不同的字符越少越好。 ascii码的范围为0~255,共有256种不同字符,代入上式得
    log(2*256-1) = 6.23 …
    向上取整为7(路径个数哪有小数)
    7/8 = 0.875 = %87.5
    所以哈夫曼编码的平均压缩比为%87.5。

    强调

    上述的假设在计算情况中忽略了对哈夫曼树的保存,所以只在文件总长度与不同字符总数相差很大时才生效。

    考虑ascii码外的其它语言

    一开始为考虑这个钻了牛角尖,想着去统一用wchar_t保存或是转为Unicode等等什么的。但其实不必那么复杂,因为汉字(不仅仅汉字,任何字符都是这样的)都是以字节为单位的,由多个字节组成的,将其分开对待,因为最终解压时恢复原串还是按照原有顺序组装,所以和纯英文文件的实现没有什么区别);

    需要注意的地方

    所有字符路径的总长不一定整除8,所以在按为保存时,要注意最后一项不足8的情况,进行补零,且要将补零的个数保存起来。

    代码对不同类型文档的压缩比测试情况

    英语文章

    样例文档:西游记英文节选

    原大小:7720
    压缩后:10476
    压缩比:1.356 – %135
    此处的文件压缩后不降反增,因为文件本身大小与不同字符的数量相差并不大,加上对树的保存后,空间大于压缩前。

    纯汉语文档

    样例文档:西游记
    原大小:1921978
    压缩后:1781234
    压缩比:0.926 – %92
    不同汉字的数量多。

    程序代码

    样例文档:github网页源代码
    原大小:46500
    压缩后:35116
    压缩比:0.755 – %76
    源代码中全是英文字母与符号,不超过100种,总大小与其相差近500倍,且代码重复词比较多。

    英语单词文档

    样例文档:英语单词5000
    原大小:20813
    压缩后:13523
    压缩比:0.649 – %65

    测试情况

    源代码

    压缩程序源文件 compress.cpp

    #include <iostream>
    #include <locale>
    #include <cstdlib>
    #include <fstream>
    #include <vector>
    #include <queue>
    
    using namespace std;
    
    const long long MAX_SIZE = 10000000000;//
    const int MAX_TYPE = 300;
    unsigned int *f = new unsigned int[MAX_TYPE];//计数
    unsigned int *p = new unsigned int[MAX_TYPE];//计下标
    char *v = new char[MAX_TYPE];
    char filename[20];
    char *s[MAX_TYPE];
    
    struct Node
    {
        unsigned int weight, parent, lson, rson;
        Node(){};
    }HuffmanTree[MAX_TYPE<<1];
    
    struct NodeCmp
    {
        bool operator()(int a, int b)
        {
            return HuffmanTree[a].weight > HuffmanTree[b].weight;
        }
    };
    
    int CreatTree(char *str, long long len)
    {
        int num = 1;
        for(int i=0;i<len;i++)
            f[str[i]]++;
        cout<<"len::"<<len<<endl;
        for(int i=0;i<len;i++)
        {
            if(f[str[i]])
            {
                HuffmanTree[num].weight = f[str[i]];
                HuffmanTree[num].lson = 0;
                HuffmanTree[num].rson = 0;
                f[str[i]] = 0;
                if(p[str[i]] == 0)
                    p[str[i]] = num;
                v[num] = str[i];
                ++num;
            }
        }
        cout<<"num::"<<num<<endl;
        return num;
    }
    
    void CodingTree(int num)
    {
        priority_queue<int, vector<int>, NodeCmp> q;
        for(int i=1;i<num;i++)
            q.push(i);
        int len = num;
        for(int i=0;i<num-2;i++)
        {
            int x = q.top(); q.pop();
            int y = q.top(); q.pop();
            HuffmanTree[len].weight = HuffmanTree[x].weight + HuffmanTree[y].weight;
            HuffmanTree[x].parent = HuffmanTree[y].parent = len;
            HuffmanTree[len].lson = y;
            HuffmanTree[len].rson = x;
            q.push(len++);
        }
    }
    
    void FindPath(int num)
    {
        char *t = new char[num];
        t[num-1] = '\0';
        for(int i=1;i<num;i++)
        {
            int son = i, father = HuffmanTree[i].parent;
            int start = num-1;
    
            while(father != 0)
            {
                --start;
                if(HuffmanTree[father].rson == son)
                    t[start] = '1';
                else
                    t[start] = '0';
                son = father;
                father = HuffmanTree[father].parent;
            }
            s[i] = new char[num - start];
            strcpy(s[i], &t[start]);
        }
    }
    
    void print(int num, long long len, char *str)
    {
        ofstream fout(filename, ios::out);
        fout<<num<<endl;
        for(int i=1;i<num;i++)
        {
            fout<<s[i]<<endl;
            fout<<v[i]<<endl;
        }
        long long pos = 0;
        char *ans = new char[MAX_SIZE];
    
        int now = 7;
        for(long long i=0;i<len;i++)
        {
            int k = 0;
            while(s[p[str[i]]][k] != '\0')
            {
                ans[pos] |= (s[p[str[i]]][k]-'0')<<now--;
                if(now < 0)
                {
                    now = 7;
                    pos++;
                }
                ++k;
            }
        }
    
        int zero = 0;
        if(now != 7) zero = now%7+1, pos++;
    
        fout<<zero<<" "<<pos<<endl;
        fout.write(ans, sizeof(char)*pos);
        fout.close();
    
        cout<<"zero::"<<zero<<endl;
    }
    
    int main(int argc, char **argv)
    {
        sprintf(filename, "%s.temp", argv[1]);
        ifstream fin(argv[1],ios::ate | ios::in);
        if(!fin)
        {
            cout<<"File open error!"<<endl;
            return 0;
        }
    
        long long size = fin.tellg();
        if(size > MAX_SIZE)
        {
            cout<<"Too long!"<<endl;
            return 0;
        }
        fin.seekg(0, ios::beg);
    
        char *str = new char[size+1];
        fin.read(str,size);
        fin.close();
    
    
        int num = CreatTree(str, size);
        CodingTree(num);
        FindPath(num);
        print(num, size, str);
    
        return 0;
    }

    解压程序源文件 compress.cpp

    #include <iostream>
    #include <locale>
    #include <cstdlib>
    #include <fstream>
    #include <vector>
    #include <queue>
    
    using namespace std;
    char filename[20];
    const long long MAX_SIZE = 10000000000;//
    const int MAX_TYPE = 300;
    struct Node
    {
        char v;
        int parent, lson, rson;
        Node(){};
    }HuffmanTree[MAX_TYPE<<1];
    
    char *str = new char[MAX_SIZE];
    char *ans = new char[MAX_SIZE];
    
    void CreatTree(char *t, char v, int &pos)
    {
        int root = 0;
        for(int i=0;t[i]!='\0';i++)
        {
            if(t[i] == '1')
            {
                if(HuffmanTree[root].rson == 0)
                    HuffmanTree[root].rson = pos++;
                root = HuffmanTree[root].rson;
            }
            else
            {
                if(HuffmanTree[root].lson == 0)
                    HuffmanTree[root].lson = pos++;
                root = HuffmanTree[root].lson;
            }
        }
        HuffmanTree[root].v = v;
    }
    
    void print(int zero, int len, char *str)
    {
        long long start = 0;
        int root = 0;
        int end = 0;
        for(int i=0;i<len;i++)
        {
            char t = str[i];
            if(i == len-1)
                end = zero;
            for(int j=7;j>=end;j--)
            {
                if((1<<j) & t)
                    root = HuffmanTree[root].rson;
                else
                    root = HuffmanTree[root].lson;
                if(HuffmanTree[root].lson == 0 && HuffmanTree[root].rson == 0)
                {
                    ans[start++] = HuffmanTree[root].v;
                    root = 0;
                }
            }
        }
        cout<<"len::"<<start<<endl;
        ofstream out(filename, ios::out);
        out.write(ans, sizeof(char)*(start));
        out.close();
    }
    
    int main(int argc, char **argv)
    {
        strcpy(filename, argv[1]);
        filename[strlen(filename)-4] = 'o';
        filename[strlen(filename)-3] = 'u';
        filename[strlen(filename)-2] = 't';
        filename[strlen(filename)-1] = '\0';
    
        ifstream fin(argv[1], ios::in);
        if(!fin)
        {
            cout<<"File open error!"<<endl;
            return 0;
        }
        int num;
        char *t = new char[num];
        char *v = new char[3];
        fin>>num;
        fin.getline(t,num);
        cout<<"size::"<<num<<endl;
        int pos = 1;
        for(int i=1;i<num;i++)
        {
            fin.getline(t,num);
            fin.getline(v,num);
            if(v[0] == '\0')
            {
                fin.getline(v,num);
                v[0] = '\n';    
            }
            CreatTree(t, v[0], pos);
            v[0]=0;
        }
    
        int zero;
        long long size;
        fin>>zero; fin>>size;
        fin.getline(t,num);
        fin.read(str,sizeof(char)*size);
        print(zero, size, str);
    
        cout<<"zero::"<<zero<<endl;
    
        return 0;
    }

    代码读写操作用文件流实现,所以在时间效率方面还有很多可优化的地方,待日后闲了再说,毕竟考试在即。。。如果哪里有错误,欢迎砸砖,便于在下提升修正。

    展开全文
  • 数据压缩算法 - 数据压缩比

    千次阅读 2020-11-02 17:58:48
    压缩比(压缩率的倒数) 压缩/解压缩需要资源(内存) 压缩/解压缩需要时间。 常用:https://www.cnblogs.com/tommyli/p/4350672.html 压缩:有损,无损,(可逆,非可逆) 压缩解压:对称,非对称 ...

    数据压缩算法,考虑点:

    压缩比(压缩率的倒数)

    压缩/解压缩需要资源(内存)

    压缩/解压缩需要时间。

     

    常用:https://www.cnblogs.com/tommyli/p/4350672.html

     

    压缩:有损,无损,(可逆,非可逆)

    压缩解压:对称,非对称

     

    常见的图片格式,都是使用了特定压缩算法的应用。

    一般来说,JPEG格式的文件是非可逆压缩,因此还原后有部分图像信息比较模糊。GIF 是可逆压缩

    mpeg

    几种压缩算法的速度比较:https://blog.csdn.net/leilonghao/article/details/73200859

     

    常用的压缩算法:

    LZO一个开源的无损压缩C语言库,其优点压缩和解压缩比较迅速占用内存小等特点(网络传输希望的压缩和解压缩速度比较快,压缩率不用很高)。压缩率(0.5%~50%)

     

    说明:

    同一个压缩算法,(例如LZO),对于不同类型文件,压缩比范围很大(压缩比差异很大)。

    展开全文
  • PySpark的存储不同格式文件

    千次阅读 2018-07-29 17:41:12
    PySpark的存储不同格式文件,如:存储为csv格式、json格式、parquet格式、compression格式、table from __future__ import print_function, division from pyspark import SparkConf, SparkContext from pyspark....

    PySpark的存储不同格式文件,如:存储为csv格式、json格式、parquet格式、compression格式、table

    from __future__ import print_function, division
    from pyspark import SparkConf, SparkContext
    from pyspark.sql import SparkSession

    ## 启动 Spark (如果你已经启动就不需要)
    spark = SparkSession.builder.master("local[2]").appName("test").enableHiveSupport().getOrCreate()
    sc = spark.sparkContext

    ## 存储为csv格式
    df_csv = spark.read.csv("../data/ratings.csv", header=True)
    df_csv.show()
    df_csv.write.csv('../output/rating.csv', header = True, mode = 'error') #保存数据

    ## 将文档保存在一个文件夹中
    !ls -lh ../output/rating.csv   #根据数量保存多个文件
    !head ../output/rating.csv/part-00001-aece805c-20a7-4225-b152-40316bc8fc5e-c000.csv   
    df_csv.coalesce(1).write.csv('../output/rating2.csv', header = True)
    !ls -lh ../output/rating.csv  

    ## 存储为json格式
    df_csv.write.json('../output/rating.json',mode = 'overwrite')
    !ls -lh ../output/rating.json   #根据数量保存多个文件
    ##注意:其中json的内存要比csv大(存储空间)

    ## 存储为parquet格式
    df_csv.write.parquet('../output/rating.parquet',mode = 'overwrite')
    !ls -lh ../output/rating.parquet  #根据数量保存多个文件

    ## 存储为compression格式---压缩
    df_csv.write.csv('../output/rating_gzip.csv', header = True, compression = 'gzip')
    !ls -lh ../output/rating_gzip.csv  #根据数量保存多个文件

    ## 存储为table
    spark.sql('show tables').show()
    df_csv.write.saveAsTable('rating_csv')
    spark.sql("select * from ratings_csv").show()

    展开全文
  • C语言

    万次阅读 多人点赞 2019-12-18 23:01:50
    46.用c语言编写程序,可以编写出任何类型的程序 47.C语言允许有空函数 48.C程序书写格式,允许一行内可以写几个语句 49.C程序的语句无行号 50.C语言的每个语句的最后必须有一个分号 51.C语言本身没有输入...

    公共考点
    1.算法的空间复杂度是指算法在执行过程中所需要的内存空间。
    2.算法的时间复杂度是指算法所需要的计算工作量。
    3.数据的逻辑结构与储存结构不是一一对应的。
    4.队列的修改是以先进先出的原则进行的。–与队列结构有关联的是先到先服务的作业调度。
    5.循环队列中的元素个数随队头指针和队尾指针变化而动态变化。
    6.C语言中的result只是一个自己定义的量
    7.对空和队满时,头尾指针均相等。
    8.冒泡法是在扫描过程中逐次比较相邻两个元素的大小。例:9+8+7+6+5+4+3+2+1=45.
    9.对象间的信息传递靠消息。
    10.多态性是指同一个操作可以是不同对象的行为。操作—对象。

    C语言
    1.源程序的扩展名为.c,目标程序的扩展名为.obj,可执行程序的扩展名为.exe(每个后缀为.c的C语言都可以单独进行编译)(C语言编译程序把.c编译成.obj的二进制文件)(链接形成.exe文件)
    2.循环结构、选择结构,顺序结构都是结构化程序的基本结构。
    3.N-S流程图是复杂算法的描述手段。
    4.长方形为处理框。椭圆形为连接点。
    5.一个c语言只能有一个主函数。
    6.函数的定义不可以嵌套,函数的调用可以嵌套。
    7.C语言总是以main函数开始执行。
    8.常量的类型:整型常量、实型常量、字符常量、字符串常量、符号常量。
    9.十进制整型常量:基本数字范围:0-9;(十进制小数两边必须有数字)
    八进制整型常量:以0开头,输出格式控制符为%o,基本数字范围0-7;
    十六进制整型常量:以0x开头,输出格式为%x,基本数字范围为0-15写为A-F或a-f;
    指数形式:e前必须有数字,e后必须为整数。
    10. 关键字属于标识符。(关键字不能做变量名也不能做函数名)
    11.数值型常量有整型常量、实型常量但均有正负值之分。
    12.语言的预编译处理可以可以用符号名代表一个常量定义是不必指定常量类型。
    13.实型常量又称实数或浮点数。在C语言中可以用单精度型和双精度型两种形式表示实型常量,分别用类型名float和double进行定义。实型常量在一般的微型集中占用4个字节,一般形式或者指数形式,数值范围都是-1038~1038,有效数字是7位。(不能是整形数据,如0)(常量的类型可以从字面上区分)(1为整型常量)(1.0为实型常量)(a为字符型常量)
    14.\0为八进制数,所以\09是错误的。
    15.字符常量在内存中占1个字节,字符常量可以进行关系运算。不能参与数值运算,可以参与任何整数运算。
    16.不能用字符串常量对字符数组名进行整体赋值操作。
    17.可以使用字符串常量来给一维数组进行复制。
    18.关于字节大小的问题

    16位编译器:char 1个字节  char* 2个字节 int 2个字节 float 4个字节 double 8个字节
    32位编译器:char 1个字节  char* 2个字节 int 4个字节 float 4个字节 double 8个字节
    64位编译器:char 1个字节  char* 2个字节 int 4个字节 float 4个字节 double 8个字节
    

    19.10进制转8进制,手算用 除8取余数法得
    20.十进制转十六进制为:除十六取余直到商为0,余数从后往前读。
    21.%f代表单精度浮点型数据(float),%lf代表双精度浮点型数(double)。
    单精度浮点数有效数字保证6位,部分7位,双精度浮点数有效数字保证15位,部分16位。
    22.sizeof可以看成是一个无符号整型表达式(sizeof为字节运算符)
    23.强制运算符:(类型名)(表达式) 逗号运算符:, 条件运算符::? :
    24. 赋值运算符左边必须是(一个)变量。
    25.a=bc,先运算bc,这个表达式的含义是,若b与c相等,那么得出的值为1,若不等则为0.
    26.“^” 按位异或 两数的二进制对应位相同,则为0,不同则为1.
    27.“|” 按位或 两个二进制中只要有一个为1,则结果为1。
    28.“~” 按位取反 二进制 0变1,1变0.
    29. “&”按位与 两个二进制都为1,则该位的结果为1,否则为零
    【 零的按位取反是 -1(0在数学界既不是正数也不是负数)
    所有正整数的按位取反是其本身+1的负数
    所有负整数的按位取反是其本身+1的绝对值 】
    30.位运算的对象只能是整形或字符型数据
    31.||逻辑或 前后条件只要有一个满足则为真。
    32.&&逻辑与 前后条件同时满足表达式为真。
    33.再用||的地方一般可以用|代替,但是用|的地方不能用||代替。
    34.“&”取地址运算
    35“”指针运算符
    36.p是指针变量,则&p是变量p的地址
    37.p是指针变量,则
    p是变量p所指向地址的值
    38.基类型不同的指针变量不可以相互混用
    39.函数的类型可以是指针类型
    40.函数的参数可以是整型、实型、字符型、指针类型。
    41.在这里插入图片描述

    42.C语言是一种计算机高级语言。
    43.C语言允许直接访问物理地址,能进行位操作。
    44.C语言是结构化程序设计语言
    45.c程序要通过编译,连接才能得到可执行的目标程序
    46.用c语言编写程序,可以编写出任何类型的程序
    47.C语言允许有空函数
    48.C程序书写格式,允许一行内可以写几个语句
    49.C程序的语句无行号(C语言中给源程序加行号;行号是用来定位代码的,指文件在几行)
    50.C语言的每个语句的最后必须有一个分号
    51.C语言本身没有输入输出语句(没有特定的输入输出语句)
    52.C语言可用来编写应用软件,也可用来编写系软件
    53.TurboC是在微机上广泛使用的编译程序
    54.C语言的数据结构是以数据类型形式出现的(不是常量和变量)
    55.空类型是C语言的一种数据类型
    56.C语言中数据有常量和变量之分
    57.利用指针和结构体类型可以构成表、树等复杂的数据结构
    58.在C程序中对所用到的所有数据都必须指定其数据类型
    59.c程序运行过程中,其值不能被改变的量称为常量
    60.在程序运行过程中,其值可以改变的量称为变量
    61.C语言可以用一个标识符代表一个常量,称为符号常量
    62.C语言规定标识符只能由字母、数字和下划线三种字符组成
    63.C语言整型常量可用十进制整数、八进整数和十六进制整数三种形式表示
    64.在现微机上使用的C编译系统,每一个整型变量在内存中占2个字节
    65.整型变量的基本类型符为int
    66.在微机上,一个长整型变量在内存中占4个字节(float型变量在内存中占4个字节)
    67.一个int型变量的最大允许值为32767
    68.在一个整常量后面加一个字母“L”或“1”.则认为该常量是longint 型常量
    69.C语言实型常量可用二进制小数和指数二种形式表示
    70.C语言实型变量分为:float型、double型、long double型三类
    71.C语言doule型一个变量的数值有效数字是16位
    72.C语言的字符常量是用单引号括起来的一个字符
    73.C语言的转义字符是以一个“\”开头的一种特殊形式的字符常量
    74.C语言中换行符使用’\n’,这是一个转义字符
    75.转文字符\r的含义是回车。
    76.C语言的字符型变量只能存放一个字符
    77.C语言允许字符数据与整数直接进行算术运算
    78.C语言允许在定义变量的同时使变量初始化
    79.C语言允许整型、实型、字符型数据间可以混合运算
    80.C语言规定两个整数相除的结果为整数
    81.用求余运算符“%”作运算,运算符两侧均应为整型数据
    82.用算术运算符和括号将运算对象按C语法规则组成的式子,称为C算术表达式
    83.算术运算符的结合方向为“自左至右”
    84.强制类型转换时,原来变量的类型未发生变化
    85.自增、自减运算符的结合方向为“自右至左”
    86.自增运算符只能用于变量,不能用于常量或表达式
    87指针.自增(减)运算符也可以用于指针变量,使指向下一个地址
    88.运算符“=”的作用是将一个数据赋给一个变量
    89.运算符“”的作用是将两侧数据是否相等
    90.赋运算符的结合方向是“自右向左”
    91.凡是二目运算符,都可以与赋值运算符一起组合成复合赋值运算符
    92.运算符“
    ”的作用是将一个数据赋给一个变量
    93.C语言不允许将实型数据赋给整型变量
    94.一个逗号表达式又可以与另一个表达式组成一个新的逗号表达式
    95.一个C程序可以由若干个源程序文件组成
    96.一个源文件可以由若千个函数和预处理命令以及全局变量声明部分组成
    97.空语句是C语言的一种语句
    98.复合语句中最后一个语句中最后的分号不能省略不写
    99.putchar函数的作用是向终端输出一个字符
    100.getchar函数的作用是从终端输入一个字符
    101.格式输出函数(print)一次可以输出多个数据
    102.printf函数的%ld格式参数,用来输入出长整型数据
    103.printf函数的%o格式参数,用来以8进制数形式输出整数
    104.printf函数的%f格式参数,用来以小数形式输出实数
    105.printf函数的%x格式参数,可以输出指定参数的16进制形式
    106.printf函数的%s格式参数,用来输出一个字符串
    107.C语言不是面向对象的程序设计语言
    108.printf函数的%e格式参数,以指数形式输出实数
    109.C语言单精度数的有效数一般为7位
    110.printf函数的%g格式参数
    111.%g是C语言printf()函数的一个输出格式类型,它表示以%f%e中较短的输出宽度输出单、双精度实数,在指数小于-4或者大于等于精度时使用%e格式
    112.p++是指下一个地址。
    (p)++是指将p所指的数据的值加一。
    C编译器认为
    和++是同优先级操作符,且都是从右至左结合的,所以p++中的++只作用在p上,和(p++)意思一样;在(p)++中,由于()的优先级比和++都高,所以++作用在()内的表达式*p上。比如有:
    int x,y,a[]={1,2,3,4,5},*p=a,*q=a;
    x=*p++;//执行这一句后x=a[0]=1,p=a+1
    y=(*q)++;//执行这一句后,y=a[0]+1=2,q仍然=a
    113. printf函数的附加格式说明字符“m”的含义是指输出数据的最小宽度
    114.scanf函数中的“格式控制”后面应当是变量地址(不是变量符)
    115.逻辑运算符>算术运算符>关系运算符>条件运算符>赋值运算符(罗算管调幅)
    116.条件运算符的结合方向是“自右向左"
    117.if语中又包含文可以转在电百度网点电 平句的嵌套
    118.条件运算符要求有3个操作对象,称为三目运算符
    119.条件表达式中三个表达式的类型可以不同
    120.switch语句是多分支选择语句
    121.switch语句中每一个case的常量表达式的值必须互不相同
    122.switch语句执行完一个case后面的语句后,流程控制转移到下一个case继续执行
    123.switch语句中多个case可以共用组执行语句
    124.goto语句为无条件转向语句
    125.C语句的循环语句中循环体如果包含一个以上的语句,必须以复合语句形式出现bre
    126.for循环语句中的3个表达式都可以省略
    127.C语句的一个循环体内允许又包含另一个完整的循环结构
    128.break语句不能用于循环语句和switch语句之外的任何其它语句中
    129.continue语句的作用是结束本次循环(而不是终止整个循环)
    130.C数组中的每一个元素都必须属于同一个数据类型
    131.C数组必须先定义,然后使用
    132.C语言规定只能逐个引用数组元素而不能一次引用整个数组
    133.在定义一维数组时可以只给一部分元素赋初值
    134.对二维数组初始化,可以分行给数组赋初值
    135.可以对二维数组的部分元素赋初值
    136.字符数组中的一个元素只存放一个字符
    137.如果一个字符数组中包含一个以上结束符’\0”,则遇第一个’\0’时输出就结束
    138.puts函数的作用是将一个字符串输出终端
    139.gets丽数的作用是从终端输入一个字符串到字符数组
    140.strlen 函数是测试字符串长度的函数
    141
    strcat函数是“字符串复制函数”。X
    strcpy函数是“字符串连接函数”。X
    strcmp函数是“字符串复制函数”。X
    strlwr函数是测试字符串长度的函数。X
    strupr函数是测试字符串长度的函数。X
    142.C程序一个函数可以被一个或多个函数调用多次
    143.一个C程序可由一个主函数和若干个其它函数构成
    144.C程序以源程序为单位进行编译(而不是函数)
    145.C程序由一个或多个源程序文件组成
    146.C语言在定义函数时是互相独立的,不能嵌套定义
    147.在调用有参函数时,主调函数和被调用函数之间有数据传递关系
    148.在调用一个函数的过程中又出现直接或间接地调用该函数本身称为函数的递归调用
    149.在一个函数内部定义的变量是内部变量,称为局部变量
    150.在函数之外定义的变量称为外部变量,是全局变量
    151.从变量的作用域角度来分,可以分为全局变量和局部变量(而不是静态和动态变量)
    152.静态存储方式是指在程序运行期间分配固定的存储空间的方式
    153.存储方法分为两大类:静态存储类和动态存储类
    154.C语言允许将局部变量的值放在CPU中的寄存器中,这种变量称为“寄存器变量”
    155.局部静态变量不能定义为寄存器变量
    156.如果一个函数只能被本文件中其它函数所调用,称为内部函数
    157.C源程序中的预处理命令,它不是C语言本身的组成部分
    158.宏定义不是C语句,在行末不加分号
    159.宏定又是用宏名代替一个字符串,只作简单的置换,不作正确性检查
    160.在进行宏定义时,可以引用已定义的宏名
    161.宏替换不占程序运行时间,只占编译时间
    162.文件包含处理是指个源文件可以将另一个的全部内容含进来源文件包
    163.一个include命令只能指定一个被包含文件
    164.存放变量地址的变量是指针变量
    165.C语言中变量的指针就是变量的地址
    166.函数的参数也可以是指针变量
    167.指针变量可以指向变量,也可以指向数组和数组元素
    168.引用数组元素可以用下标法,也可以用指针法
    169.用指针变量可以指向一维数组,也可以指向多维数组,用指针变量也可以指向一个函数
    170.一个函数可以带回一个整型值、字符值或实型值,也可以带回指针型的数据
    171.指针数组中的每一个元素都相当于一个指针变量
    172.指针数组中的每一个元素都相当于一个整型变量
    173.指针变量可以有空值,即该指针变量不指向任何变量
    174.若两个指针指向同一个数组的元素。则两指针变量可以进行比较
    175.用户自己定义一个结构教型后们其中并无具体数据
    176.在程序中使用的可和百网时 定义结构体类型的变量
    177.结构体类型的成员也可以是一个结构体变量
    178.结构体成员名可以与程序中的变量名相同
    179.不能将一个结构体变量作为一个整体进行输入和输出
    180.对结构体变量的成员可以像普通变量一样进行各种运算
    181.可以引用结构体变量的地址
    182.可以引用结构体变量成员的地址
    183.结构体数组的每个元素都是一个个结构体类型的数据
    184.对结构体数组可以初始化,即赋初值
    185.可以定义一个指针变量,用来指向一个结构体变量
    186.指针可以用结构体变量作链表中的结点
    187.malloc函数的返回值是一个指向分配域起始地址的指针
    188.建立动态链表是指在程序执行过程中从无到有地建立起一个链表
    189.使几个不同的变量共占同一段内存的结构,称为共用体类型的结构
    190.共用体变量所占的内存长度等于最长的成员长度
    191.定义了共用体变量,只能引用共用体变量中的成员(不能引用公用体变量)
    192.共用体变量的地址和它的各成员的地址都是同一地址
    193.共用体类型可以出现在结构体类型定义中
    194.结构体类型可以出在共用体类型定义中
    195.在C编译中,对枚举元素按常量处理
    196.一个整数不能直接赋给一个枚举变量
    枚举类型在C#或C++,java,VB等一些计算机编程语言中是一种基本数据类型而不是构造数据类型,而在C语言等计算机编程语言中是一种构造数据类型 。它用于声明一组命名的常数,当一个变量有几种可能的取值时,可以将它定义为枚举类型。
    枚举可以根据Integer、Long、Short或Byte中的任意一种数据类型来创建一种新型变量。这种变量能设置为已经定义的一组之中的一个,有效地防止用户提供无效值。该变量可使代码更加清晰,因为它可以描述特定的值。
    197.可以用typedef声明新的类型名来代替已有的类型名
    198.位运算的运算量只能是整型或字符型的数据
    200.位运算符与赋值运算符可以组成复合赋值运算符
    在 C 语言中, 一种方法是用叫做位段的构造类型来定义一个压缩信息的结构。
    201.已有定义int (*p)( );指针p可以指向函数的入口地址
    202.C语言中运算对象必须是整型的是%=
    203.int *p 表达的是p是指向int型数据的指针。
    204函数rewind的功能是将文件指针重新指向一个流的开头(即使文件指针重新返回文件的开始位置),int rewind(FILE *stream);并且无返值。
    205.如果函数值的类型与返回值类型不一致,以函数值类型为准
    206.c语言中形参和实参类型不一致时以形参的类型为准
    207.形参应该是函数声明的时候就已经定义好
    208.若有定义int t[3][2],能正确表达t数组元素地址的是–t[2]+1
    209.int[]={1,2};
    210.C语言中的循环语句有for,while,do-while和goto,,***不是if、switch、break
    211.不正确的赋值语句是—ch‘a+b’,正确的是ch=‘\0’ ch=‘7’+‘9’ ch=7+9
    212.正确的赋值语句x3=12;
    213.C语言逻辑运算时,0为假,非0为真
    214.字符串常量是以双引号扩起来的字符序列“a”(其他C语言常量‘\n’ 012)(e-2不是C语言常量----实数的指数形式中,e后面必须有一个整数)

    301.一个位段必须存储在同一存储单元中
    302.位段的长度不能大于存储单元的长度
    303.一个c程序由若干个函数构成,其中有且仅有一个主函数
    304.指针变量中存放的是它所指对象的地址
    305.在C语言中,分号是语句的必然组成部分
    306.结构体变量所占空间是各成员所占空间之和
    307.数据文件可顺序读取,也可借助文件的定位操作实现随机读取
    308.从用户的角度上讲,类型的含义是规定了该类型变量的取值范围和运算范围
    309.c语言中,变量和函数均具有类型和存贮类别两个属性
    340.顺序结构>选择结构>循环结构
    341.函数返回值的类型是由函数定义时指定的类型
    342.*与s[]相等
    343.当从键盘输入数据时,对于整型变量可以输入整型数值和字符,对于实型变量可以输入实型数和整型数值等。
    344. getchar函数没有参数
    345.静态储存方式是在程序运行期间分配固定的储存方式的方式
    356.局部静态变量不能定义为寄存器变量
    357.不能把共用体变量作为函数的参数
    358.一个整数不能直接赋给一个枚举变量
    359.int *p=a 是对指针变量p的正确定义和初始化。
    360.Char s[]=”china”;
    Char p;
    P=s;
    p与s[]相等
    有int [],*p=a
    则p+5表示元素a[]的地址
    361.C语言中,退格符是\b
    362.C语言中,变量的隐含储存类别是auto
    363.实际参数和形式参数可以同名
    364.函数调用可以作为一个函数的形参
    365.结构化程序设计的3中结构是-顺序结构、选择结构、循环结构
    366.当从键盘输入数据时整型变量可以输出整型值和字符,对于实型变量可以输入实型数和整型数值
    367.C语言中逗号运算符的优先级最低,指针最优,单目运算优于双目运算。如正负号。
    先算术运算,后移位运算,最后位运算。请特别注意:1 << 3 + 2 & 7等价于 (1 << (3 + 2))&7.
    逻辑运算最后结合。
    368.C语言区分定义变量名的大小写
    369.设有如下定义:
    struck sk
    { int a;
    float b;
    } data;
    int *p;
    若要使P指向data中的a域,正确的赋值语句是(C)A、 p=&a; B、 p=data.a; C、 p=&data.a; D、 *p=data.a;
    370.double)a是将a转换成double类型;(int)(x+y)是将x+y的值转换成整型。
    371.设有以下说明语句:
    struct stu
    {
    int a;
    float b;
    }
    stutype;
    则下面叙述不正确的是( )。
    A) struct是结构体类型的关键字
    B) structstu是用户定义的结构体类型
    C) stutype是用户定义的结构体类型名
    D) a和b都是结构体成员名
    答案解析
    定义一个结构的一般形式为:
    struct结构体名
    {
    成员列表
    }变量名列表;
    本题中的stutype是在声明结构体类型structstu的同时定义的该结构体变量,而不是用户定义的结构体类型名。类型与变量是不同的概念; 2)对结构体中的成员,可以单独使用,它的作用与地位相当于普通变量;3)成员也可以是一个结构体变量; 4)成员名可以与程序中的变量名相同,二者不代表同一对象。
    372.C语言中的数据类型是指-函数返回值的数据类型
    373.C程序设计语言的基本成分是数据成分、运算成分、控制成分、传输成分。
    374.while(t=1)循环控制表达式的值为1。
    375.printf(++x);表示地址所连接的数值加1.
    376.int[3][4]; 表示a为3行
    4列的数组,它可用的最大行下标为2,列下标最大为3;
    若是引用a[0][4],则超过了数组的范围
    377.若有如下说明和定义
    struct test
    {
    int ml; char m2; float m3;
    union uu
    {
    char ul[5]; int u2[2];
    }
    ua;
    } myaa;
    则sizeof(struct test)
    的值是A.12 B.16 C.14 D.9
    正确答案:A
    在本题中,首先定义了一个结构体。在该结构体中,定义了一个整型变量成员、一个字符型变量成员和一个浮点型变量成员,并在结构体中定义了一个联合体变量成员,联合体变量成员中又包含两个联合体成员数组。题目最后要求计算该结构体变量所占的存储空间。
    在C语言中,联合体变量中的所有成员共享存储空间,联合变量的长度等于各成员中最长的长度,因此,本题的联合体部分所占的长度为5,但是结构体与联合体不一样的是,结构体不能共享空间,一个结构体变量的总长度是各成员长度之和,因此,该结构体所需的存储空间为5+1+2+4=12。本题的正确答案选A。
    378.静态储存类别的关键词是static
    379.C语言中提供了存储说明符auto,register,extern,static说明的四种存储类别。四种存储类别说明符有两种存储期:自动存储期和静态存储期。其中auto和register对应自动存储期。具有自动存储期的变量在进入声明该变量的程序块是被建立,它在该程序块活动时存在,退出该程序块时撤销。
    380.fseek(文件指针,位移量,起始点)
    “起始点”用0,1或2代替,0代表“文件开始”,1为“当前位置”,2为“文件末尾”。“位移量”指以“起始点”为基点,向前移动的字节数。ANSIC和大多数C版本要求位移量是long型数据。这样当文件的长度大于 64k时不致出现问题。ANSI C标准规定在数字的末尾加一个字母L,就表示long型。
    381.若有定义:int (*p)[4];则标识符p ,是一个指针指向一个含有四个整形元素的一维数组。
    382.基本数据类型:整型、实型、字符型
    383.EOF是指向文本文件的结束标志,NULL是打开文件错误时的返回值。feof(fp)用来判断文件是否在文件末尾,文本文件和二进制文件均可以使用此函数,如果遇到文件结束就返回1,否则返回0。
    384.C语言的函数可以嵌套调用
    385.标准库函数fgets(s,n,f)的功能是什么–从文件f中读取长度不超过n-1的字符串存入指针s所指的内存。
    从流中读一行或指定个字符,
    原型是char *fgets(char *s, int n, FILE *stream);
    从流中读取n-1个字符,除非读完一行,参数s是来接收字符串,如果成功则返回s的指针,否则返回NULL。
    形参注释:*string结果数据的首地址;n-1:一次读入数据块的长度,其默认值为1k,即1024;stream文件指针
    说得简单一点就是从f这个文件输入流中读取n-1个字符,存到s中。
    如果一行的字符数小于n-1,那么就是一行的字符数,所以应该理解为不超过n-1,如果一行的长度大于n-1,就是n-1个字符
    386.
    1、数据计算类型不同。基本数据类型分为三类:整数型(定点型)、实数型(浮点型)和字符型。除了基本数据类型,还有构造类型(数组、结构体、共用体、枚举类型)、指针类型、空类型void。
    2、各种数据类型的关键词不同。short、long、int、float、double、char六个关键词表示C语言里六种基本数据类型。
    3、不同数据类型占用内存的大小不同。short占2byte,int占4byte,long占4byte,float占2byte,double占8byte,char占1byte(不同的平台可能占用内存大小不一样,具体的可以用sizeof 测试下)。
    387.一个可以没有变量定义和执行部分,例如空函数

    展开全文
  • MySQL 面试题

    万次阅读 多人点赞 2019-09-02 16:03:33
    1、varchar 与 char 的区别,char 是一种固定长度的类型,varchar 则是一种可变长度的类型。 2、varchar(50) 中 50 的涵义最多存放 50 个字符。varchar(50) 和 (200) 存储 hello 所占空间一样, 但后者在排序时会...
  • 基于Huffman树的文件压缩(详细)

    千次阅读 多人点赞 2018-08-16 16:44:42
    文件压缩 开发平台:Visual Studio 2008 开发技术:哈夫曼树,堆排序 项目流程: (1)统计要压缩的文件中各字符出现的次数,利用数据结构中的小堆来构建Huffman树,每次在堆顶选出两个出现次数较小的字符先进行...
  • 2021年前端面试题及答案

    万次阅读 多人点赞 2020-02-11 19:29:34
    文件类型检查:强烈推荐白名单方式,结合MIME Type、后缀检查等方式;此外对于图片的处理可以使用压缩函数或resize函数,处理图片的同时破坏其包含的HTML代码; 3. 使用随机数改写文件名和文件路径,使得用户不能...
  • ubuntu使用教程

    万次阅读 多人点赞 2020-01-15 17:53:05
    文件系统类型: 默认为 ext4, 文件系统分很多种,ext2、ext3、ext4、fat、ntfs等等  什么是文件系统: 文件系统是操作系统用于明确磁盘或分区上的文件的方法和数据结构; 即在磁盘上组织文件的方法。  两种文件...
  • Linux 命令面试题

    万次阅读 多人点赞 2019-07-24 09:40:04
    Linux面试题: 1.Linux常用系统安全命令 ...chmod // 用来变更文件或目录的权限 setfacl // 设置文件访问控制列表 2.Linux常用进程管理命令 w // 用于显示已经登陆系统的用户列表,并显示用户正在执行的指令。 top ...
  • 基于哈夫曼编码的文件压缩解压

    千次阅读 多人点赞 2016-05-31 14:51:40
    这个程序是研一上学期的课程大作业。当时,跨专业的我只有一点 C 语言和数据结构基础,为此,我查阅了不少资料,再加上自己的思考和分析,实现后不断调试、测试和完善,耗时一...名称:基于哈夫曼编码的文件压缩解压
  • 前端性能优化 压缩静态文件gzip

    千次阅读 2018-10-16 10:41:09
    前端压缩的方式很多,依赖java的有ant工具,前端自己打包压缩的有grunt,gulp,webpack,这些压缩也很重要,基本上能压缩50%以上,下面我们对压缩文件来个对比。 如图所示,这是未压缩的         ...
  • 可以根据图片边长或大小来压缩 import com.dongxu.insurance.service.BASE64DecodedMultipartFile; import net.coobird.thumbnailator.Thumbnails; import org.slf4j.Logger; import org.slf4j.LoggerFactory; ...
  • Linux上压缩文件的 5 种方法

    千次阅读 2020-07-03 14:05:53
    在这篇文章中,我们将比较这些压缩命令并指出显著的不同。 tar  tar 命令不是专门的压缩命令。它通常用于将多个文件拉入一个单个的文件中,以便容易地传输到另一个系统,或者将文件作为一个相关的组进行备份。它也...
  • C#基础教程-c#实例教程,适合初学者

    万次阅读 多人点赞 2016-08-22 11:13:24
    在C#语言中,同一个类中的函数,如果函数名相同,而参数类型或个数不同,认为是不同的函数,这叫函数重载。仅返回值不同,不能看作不同的函数。这样,可以在类定义中,定义多个构造函数,名字相同,参数类型或个数...
  • Huffman的应用之文件压缩与解压缩

    千次阅读 2016-10-30 12:02:28
    文件压缩与解压缩>  最近这段时间一直在学习树的这种数据结构,也接触到了Huffman树以及了解了什仫是Huffman编码,而我们常用的zip压缩也是利用的Huffman编码的特性,那仫是不是可以自己实现一个文件压缩呢?当然可以...
  • 用python进行批量文件的解压缩/压缩批量文件7z的命令行参数7z压缩文件的命令行参数7z解压文件的命令行参数 7z的命令行参数 python可以通过subprocess模块的相关函数运行外部程序,完成一些操作。如本文要介绍的...
  • 第五章-Linux实操篇

    千次阅读 多人点赞 2019-10-24 18:45:20
    分屏查看文件内容,功能与more相似,但more强大。 less在显示文件内容时,并部署一次将整个文件加载之后再显示,而是根据显示需要加载内容,对于 显示大型文件具有较高的效率 。 操作 功能说明 ...
  • hive优化-文件存储格式和压缩方法

    千次阅读 2019-06-29 15:45:42
    需要结合实际的业务,数据的类型,分布,质量状况等来实际的考虑如何进行系统性的优化,hive底层是mapreduce,所以hadoop调优也是hive调优的一个基础,hvie调优可以分为几个模块进行考虑,数据的压缩与存储,sql的...
  • Linux文件压缩和打包

    万次阅读 2018-05-27 13:47:04
    Linux文件压缩和打包一、压缩打包介绍常见压缩文件​ ~Windows .rar .7z .zip ​ ~Linux .zip .gz .bz2 .xz .tar.gz .tar.bz2 .tar.xz文件压缩的作用:1、节省空间​ ...
  • 最近整理资料,发现很多 pdf 文档,占用了不少的存储空间,考虑使用 7-zip 进行压缩存储,由于文件比较多,且分散在不同目录下,一个个文件压缩比较繁琐。为了提高效率且,方便后面取用,所有打算捣鼓个批处理文件,...
  • 基于哈夫曼编码对文件进行压缩和解压缩(详细讲解) 本文对应c++代码实现链接 一、背景 利用特定的算法来压缩数据的工具,压缩后生成的文件称为压缩包。如果想使用其中的数据,就得用压缩软件对数据进行解压。利用...
  • linux文件系统类型

    万次阅读 2018-01-09 20:27:38
     Linux 支持多种文件系统,包括ext2、ext3、vfat、ntfs、iso9660、jffs、romfs和nfs等,为了对各类文件系统进行统一管理,Linux引入了虚拟文件系统VFS(Virtual File System),为各类文件系统提供一个统一的操作界面...
  • Centos7 压缩文件

    千次阅读 2018-04-17 13:19:03
    压缩文件命令:tar選項與參數: -c :建立打包檔案,可搭配 -v 來察看過程中被打包的檔名(filename) -t :察看打包檔案的內容含有哪些檔名,重點在察看『檔名』就是了; -x :解打包或解壓縮的功能,可以搭配 -C (大...
  • 生成tar包后,就可以用其它的程序来进行压缩了,tar命令本身不进行数据压缩,但可以在打包或解包的同时调用其它的压缩程序,比如调用gzip、bzip2 选项: -c 创建.tar格式包文件 -x 解开.tar格式包文件 -v显示详细...
  • http协议文件压缩

    千次阅读 2015-02-28 14:47:38
    服务端根据客户端发送的请求头中某些字段自动发送最合适的版本。可以用于这个机制的请求头字段分为两种:...告知服务器采用何种压缩方式 Content-Encoding 比如客户端发送的请求头: Accep
  • web性能优化--用gzip压缩资源文件

    万次阅读 多人点赞 2019-07-31 19:14:09
    一、gzip压缩技术 gzip(GNU- ZIP)是一种压缩技术。...浏览器那里不需要我们担心,因为目前的大多数浏览器都支持解析gzip压缩过的资源文件。在实际的应用中我们发现压缩的比率往往在3到10倍,也...
  • hive中文件三种压缩方式

    千次阅读 2016-08-26 17:34:40
    hive 压缩方式
  • C#压缩或解压(rar和zip文件)

    万次阅读 2019-04-02 17:07:20
    为了便于文件在网络中的传输和保存,通常将文件进行压缩操作,常用的压缩格式有rar、zip和7z,本文将介绍在C#中如何对这几种类型文件进行压缩和解压,并提供一些在C#中解压缩文件的开源库。 在C#.NET中压缩解压...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 182,825
精华内容 73,130
关键字:

不同类型文件的压缩比不同