精华内容
下载资源
问答
  • R语言读取压缩文件

    千次阅读 2020-04-18 21:18:45
    R语言读取压缩文件 常规来说,读取网页中的压缩文件分为两步,以GENCODE数据库的人基因组注释文件为例,首先需要下载: download.file(‘ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_24/...

    R语言读取压缩文件

    常规来说,读取网页中的压缩文件分为两步,以GENCODE数据库的人基因组注释文件为例,首先需要下载:

    download.file(‘ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_24/gencode.v24.chr_patch_hapl_scaff.annotation.gtf.gz’, destfile = ‘gencode.v24.chr_patch_hapl_scaff.annotation.gtf.gz’)
    然后要解压文件。除了手动解压,其实也可以直接在R中使用gunzip解压.gz格式的压缩文件:

    library(R.utils)

    gzfile =
    ‘gencode.v24.chr_patch_hapl_scaff.annotation.gtf.gz’

    gunzip(gzfile, remove = F)
    #不删除源文件

    对生成的 .gtf 文件再使用 read.table 等函数进行读取(注意根据不同的数据内容选择相应的读取函数和参数设置)即可!

    而这种操作方式,一来解压后文件比较占存储(此例中,文件解压前41.7M,解压后1.35G),二来如果能直接读取压缩文件,免去解压步骤不是更方便吗?

    可以借助 gzfile 函数:

    Functions to create, open and close connections, i.e., “generalized files”, such as possibly compressed files, URLs, pipes, etc.

    gf = gzfile(gzfile,
    ‘rt’
    )

    data = read.table(gf, header = F, sep = ‘\t’, quote = ‘’, comment.char = ‘#’)

    也可以直接读取网页上的.gz文件:

    webfile = ‘ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_24/gencode.v24.chr_patch_hapl_scaff.annotation.gtf.gz’

    z = gzcon(url(webfile))

    raw = textConnection(readLines(z))

    close(z)

    data = read.table(raw, header = F, sep = ‘\t’, quote = ‘’, comment.char = ‘#’)

    close(raw)

    head(data)

    展开全文
  • R语言压缩文件

    2013-10-28 08:50:46
    R语言包,它擅长做统计分析类,有很多开源的jar包,方便快捷
  • 主要使用的是下边这个语句进行手动解压缩,但是由前提条件 ZipFile.extract(member, path=None, pwd=None) # 下边是官方介绍, 主要是那个ZipInfo对象 不是这个对象不能完成解压缩 从归档中提取出一个成员放入当前...

    提取*.zip文件

    主要使用的是下边这个语句进行手动解压缩,但是由前提条件

    ZipFile.extract(member, path=None, pwd=None)	# 下边是官方介绍, 主要是那个ZipInfo对象 不是这个对象不能完成解压缩
    

    从归档中提取出一个成员放入当前工作目录;member 必须为成员的完整名称或 ZipInfo 对象。 成员的文件信息会尽可能精确地被提取。 path 指定一个要提取到的不同目录。 member 可以是一个文件名或 ZipInfo 对象。 pwd 是用于解密文件的密码。

    from zipfile import ZipFile
    # class zipfile.ZipFile(file, mode='r', compression=ZIP_STORED, allowZip64=True, compresslevel=None, *, strict_timestamps=True)
    
    
    # 可以使用with方式打开
    with ZipFile('xxx', 'r') as myzip:
    
    

    这个用来打开一个*.zip文件, 但是打开的文件不能直接用来解压缩。

    必须使用下面的语句获得ZipInfo文件才能进行解压缩。

    zipfile_item = ZipFile.getinfo(name)
    # or
    myfile.infolist()
    getinfo.getinfo(name)
    

    返回一个 ZipInfo 对象,其中包含有关归档成员 name 的信息。 针对一个目前并不包含于归档中的名称调用 getinfo() 将会引发 KeyError。

    如果想改变解压出来的文件名称或者是解压出来的文件带有不想要的路径可以直接在解压的时候修改
    对于上面ZipFile打开的myzipfile, 获得了zipfile对象之后修改zipinfo的filename属性就可以改变解压后文件的名称或者去掉自带的路径。

    zipfile_item = ZipFile.getinfo(name)
    zipfile_item.filename = 'xxx'
    
    展开全文
  • Ra压缩文件r密码破解

    2013-04-19 01:15:28
    Rar压缩密码破解,忘记rar压缩文件后的必备工具
  • R 语言批量转移文件压缩 ...手动操作就会很麻烦,以下R语言代码就能解决这个问题。 ## 需要现在目录下创建一个“00001”的文件夹,确保位于目录的第一个文件,压缩包将全部转移到这里 setwd("") file1<-li

    R 语言批量转移文件并压缩

    想象一下,你从一个数据库中下载了一份需要处理的数据,而这个数据首先是一个压缩包,当你将这个压缩包解压以后,惊奇的发现,压缩包里是一百多个文件夹,而每个文件夹里是一个压缩包,而每个压缩包里面都有一个.txt文件,每个文件中有一列基因名和一列样本,那么我们如何将这些样本数据组合起来了?手动操作就会很麻烦,以下R语言代码就能解决这个问题。

    ##  需要现在目录下创建一个“00001”的文件夹,确保位于目录的第一个文件,压缩包将全部转移到这里
    setwd("")
    file1<-list.files(list.files(getwd()),full.name=T)
    file2<-list.files(getwd())
    for (i in 1:length(file1)) file.copy(from=file1[i],to=file2[1])
    ## 至此,所有压缩包就都拷贝到了00001这个文件夹了,接下来需要做的就是将该文件夹内的所有压缩包进行解压,很多解压缩软件都能做到这点
    
    setwd(paste(getwd(),"\\00001",sep=""))
    
    file3<-list.files(getwd(),full.name=T)
    file3<-file3[grep(".txt$",file3)]   ## 筛选出.txt文件
    data<-read.table(file=file3[1])
    n<-length(file3) 
    for (i in 2:n) {
    newdata<-read.table(file=file3[i])
    data<-cbind(data,newdata[,2])
    }
    write.table(data,paste(getwd(),"\\data.txt",sep=""))
    
    展开全文
  • 用python进行批量文件的解压缩/压缩批量文件7z的...如本文要介绍的python脚本通过7z程序来实现批量解压缩文件或批量压缩文件。首先介绍7z的相关命令行参数。 其中7z的命令行参数参考自:https://blog.csdn.net/oi...

    7z的命令行参数

    python可以通过subprocess模块的相关函数运行外部程序,完成一些操作。如本文要介绍的python脚本通过7z程序来实现批量解压缩文件或批量压缩文件。首先介绍7z的相关命令行参数。
    其中7z的命令行参数参考自:https://blog.csdn.net/oilcode/article/details/50063425

    7z压缩文件的命令行参数

    用命令行来执行7z的极限压缩,就是如下的命令:
    H:\Program Files\7-Zip\7z.exe a -t7z newPack.7z “H:\testDoc*” -r -mx=9 -m0=LZMA2 -ms=10m -mf=on -mhc=on -mmt=on
    其中,
    1,H:\Program Files\7-Zip\7z.exe
    这个是7z可执行文件的完整路径。
    注意:这里必须是7z.exe的完整路径,在我的win10环境下测试,如果不是完整路径,即使在环境变量里注册了该程序,也是不行的。
    2,a
    表示add命令,即新建一个压缩文件,该压缩文件存放在当前目录下
    3,
    -t7z

    这个表示使用的压缩类型是7z。类似的还有 -tzip 等等。
    4,newPack.7z
    加粗样式新建的压缩文件的名字。
    5,"H:\testDoc*"
    表示把该目录下的所有的文件都执行压缩操作,添加到压缩文件中。
    6,-r
    表示遍历所有的子目录,每个文件都执行压缩操作,添加到压缩文件中。
    7,-mx=9
    表示压缩等级,9级是最高等级。默认等级是5。
    8,-m0=LZMA2
    表示优先使用 LZMA2 算法。类似的,还可以设置第二优先 -m1=LZMA ,第三优先 -m2=BZip2 。
    9,-ms=10m
    表示开启固实模式,这种模式是把压缩包中的所有文件都当成一个连续数据流来看待。通常情况下,固实压缩可增加压缩比,特别是在添加大量小文件的时候。
    这里除了开启固实模式,还设置了以10兆作为一个数据块。
    10,-mf=on
    表示开启可执行文件压缩过滤器。
    11,-mhc=on
    表示对压缩包的文件头也进行压缩。
    12,-mmt=on
    表示开启多线程,提高压缩速度。

    7z解压文件的命令行参数

    解压缩的命令如下:
    H:\Program Files\7-Zip\7z.exe x newPack.zip -oH:\Doc -aoa
    其中,
    1,** H:\Program Files\7-Zip\7z.exe**
    这个是7z可执行文件的完整路径
    注意:这里必须是7z.exe的完整路径,在我的win10环境下测试,如果不是完整路径,即使在环境变量里注册了该程序,也是不行的。
    2,x
    表示解压缩,并且使得压缩包内的文件所在的目录结构保持不变。如果你希望解压缩后所有的文件都存放在同一个目录下,则使用 e 这个命令。
    3,newPack.zip
    表示压缩包的文件名。该压缩包是存放在当前目录下的。
    4,
    -oH:\Doc

    表示把压缩包内的文件解压缩到 c:\Doc 目录下。-o 这个参数用于指定输出目录。
    5,-aoa
    表示直接覆盖现有文件,而没有任何提示。类似的参数还有:
    -aos 跳过现有文件,其不会被覆盖。
    -aou 如果相同文件名的文件以存在,将自动重命名被释放的文件。举个例子,文件 file.txt 将被自动重命名为 file_1.txt。
    -aot 如果相同文件名的文件以存在,将自动重命名现有的文件。举个例子,文件 file.txt 将被自动重命名为 file_1.txt。

    程序实例

    下面的程序演示了批量解压某个文件夹下的[.rar,.zip,.7z]等类型的压缩文件。

    import subprocess
    
    #===========================================================================
    def IsHaveSubString(SubStrList,Str):
        """
        #判断字符串Str是否包含序列SubStrList中的一个子字符串
        #>>>SubStrList=['zip','rar','7z']
        #>>>Str='F06925EMS91.zip'
        #>>>IsSubString(SubStrList,Str)#return True (or False)
        """
        flag=False
        for subStr in SubStrList:
            if subStr in Str:
                flag=True
                break
        return flag
    #===========================================================================
    def GetFileListByType(dirPath,fileFlag=[]):
        '''
        在dirPath目录下,获取fileFlag指定类型的所有文件,只检查dirPath,不递归检查其子目录
        :param dirPath: 目录路径
        :param fileFlag: 文件类型列表,指文件的后缀名,例如:[".c",".cpp"]
        :return: fileList
        '''
        import os
        fileList=[]
        fileNames=os.listdir(dirPath)
        if (len(fileNames)>0):
           for fn in fileNames:
               if (len(fileFlag)>0):
                   #返回指定类型的文件名
                   if (IsHaveSubString(fileFlag,fn)):
                       #fullfilename=os.path.join(FindPath,fn)
                       fileList.append(fn)
               else:
                   #默认直接返回所有文件名
                   #fullfilename=os.path.join(FindPath,fn)
                   fileList.append(fn)
    
        #对文件名排序
        if (len(fileList)>0):
            fileList.sort()
        return fileList
    
    #=========================================================================== 
    def UnzipFiles(program7zPath, filePath, fileFlag=[".7z",".rar",".zip"]):
        '''
        解压filePath路径下的指定类型的所有压缩文件,解压文件保存在bakUnzip子文件夹内
        :param program7zPath: 解压缩程序的完整路径,不能依赖于环境变量(在win10下测试是无效的)
        :param filePath: 压缩文件路径
        :param fileFlag: 压缩文件类型,
        :return: False---没有解压任何文件,True---解压了文件
        '''
        #------获取文件类型为fileFlag中的所有文件-------
        orgFileList=cf.GetFileListByType(filePath, fileFlag)  # 依次获取所有后缀名的文件
        #print(len(orgFileList))
    
        #------如果没有任何文件,则直接返回---------
        if len(orgFileList)==0:
            print("没有发现任何指定的压缩文件!")
            return False
    
        #-------创建保存解压缩文件的子文件夹--------
        isOk=cf.mkOneDir(filePath, "bakUnzip")
        if not isOk:
            print("创建bakUnzip文件夹失败")
            return False
    
        targetFilePath=filePath+"\\bakUnzip"
    
        # ----创建两个文件--------
        successFile = open(targetFilePath + "\\UnzipSuccess.txt", "w")
        failFile = open(targetFilePath + "\\UnzipFail.txt", "w")
    
        #--------批量解压文件-----------
        for f in orgFileList:
            #这里必须是7z.exe的完成路径
            #cmdStr="H:\\Program Files\\7-Zip\\7z.exe x "+filePath+"\\"+f+" -o"+targetFilePath #这里-o后面不能有空格
            index=f.rfind(".")
            fstr=f[:index]
            cmdStr = program7zPath+" x " + filePath + "\\" + f + " -o" + targetFilePath+"\\"+fstr  # 这里-o后面不能有空格
    
            recode = 0  # 默认返回值为0,表示编译通过
            try:
                recode = subprocess.check_output(cmdStr)
                ricode = int.from_bytes(recode, byteorder='big', signed=False)
                if ricode < 0:
                    print("Compile Fail: ", f)
                    failFile.write(f+"\n")
                else:
                    print("Compile success:", f)
                    successFile.write(f+"\n")
            except subprocess.CalledProcessError:
                print("Compile Fail: ", f)
                failFile.write(f+"\n")
    
        # ----关闭两个文件--------
        successFile.close()
        failFile.close()
        return True
    #===========================================================================
    if __name__=="__main__":
        filePath="H:\\2019HW"
        program7zPath="H:\\Program Files\\7-Zip\\7z.exe"
        isOk=UnzipFiles(program7zPath, filePath)
        print(isOk)
    

    测试结果是可行的。

    展开全文
  • gunzip 是一个使用广泛的解压缩命令,它用于解压被 gzip 压缩过的文件(扩展名为 .gz)。 对于解压被 gzip 压缩过的文件,还可以使用 gzip 自己,即gzip -d 压缩包。 gunzip 命令的基本格式为: [root@...
  • 利用python下载数据,下载下来的数据为zip格式,因为有上千个这样的文件,因此便直接在爬虫程序里加入了解压缩zip文件的内容,并且因为数据量较大,为了节省空间,便在解压缩后立即删除该zip文件。 先来介绍解压缩...
  • python直接通过内置压缩模块可以直接进行压缩文件的创建; 内置模块 zipfile/rarfile 完成压缩文件的操作。 二、 zipfile模块基础使用 2.1 对一个文件进行zip压缩 # 把当前目录的test.txt文件压缩到a.zip压缩包中 ...
  • 最近尝试用 R 对一些文件进行批量的解压与压缩...若要压缩文件,就直接在 zip() 函数的第一个参数里面输入压缩后的文件名,第二个参数输入压缩前的文件名。 而解压文件就更简单了,直接利用 unzip() 里面加上需要...
  • 暴力破解加密压缩文件

    千次阅读 2020-05-10 23:47:01
    应用Python程序设计语言的相关知识,对加密的压缩文件进行破解。 实验所用仪器(或实验环境) Python3.8 实验基本原理及步骤(或方案设计及理论计算) 任务1:定义一个函数,函数带有一个参数L(类型为整数),...
  • 在 Go 语言标准库中提供了 archive/zip 包用来进行文件压缩和解压缩,正好最近工作中用到了这个库,在这里向大家介绍 zip 库的使用方法,希望对你有帮助。 1. 主要方法介绍 FileHeader 对象描述了 zip 文件中的一...
  • 压缩与解压缩6—WinRAR 的基本使用 一个 SFX (SelF-eXtracting)自解压文件是压缩文件的一种,它结合了可执行文件模块,一种用以运行从压缩文件解压文件的模块。这样的压缩文件不需要外部程序来解压自解压文件的...
  • 7-Zip 是一款号称有着现今最高压缩比的压缩软件,它不仅支持独有的 7z 文件格式,而且还支持各种其它压缩文件格式,其中包括 ZIP, RAR, CAB, GZIP, BZIP2和 TAR 等等。此软件压缩的压缩比要比普通 ZIP 文件高 30-50%...
  • 目录一、Matlab语言1、压缩1)压缩成xxx.zip格式2、解压1)解压xxx.zip文件 一、Matlab语言 1、压缩 1)压缩成xxx.zip格式 /* myfiles.zip表示压缩后的文件名称 03.29_2表示想要压缩的文件夹名称 zippedfiles表示返回值...
  • 这篇文章的两个主要目的是演示使用Groovy解压缩7-Zip文件和方便的7-Zip-JBinding ,并说明并演示Groovy作为脚本语言的一些关键特性。 7-Zip页面将7-Zip描述为“具有高压缩率的文件存档器”。 该页面还添加了“ 7-...
  • 如何在linux下解压缩rar格式的文件压缩包 下载rarlinux-5.1.1.tar.gz http://linux.softpedia.com/get/System/Archiving/RAR-2380.shtml 安装 tar xvf rarlinux-5.1.1.tar.gz -C /usr/local cd /usr/local/rar/...
  • 这篇文章的两个主要目的是演示用Groovy解压缩7-Zip文件和方便的7-Zip-JBinding ,并说明并演示Groovy作为脚本语言的一些关键特性。 7-Zip页面将7-Zip描述为“具有高压缩率的文件存档器”。 该页面还添加了“ 7-...
  • Huffman 压缩解压缩java实现

    千次阅读 2014-06-14 16:14:16
    本文介绍了利用Huffman编码对文件进行压缩和解压缩的过程。其中使用了java做为编程语言。...本文只实现了对文本文件进行压缩和解压缩,对二进制文件压缩解压缩留待大家研究。完整工程留待以后上传。
  • 1 shell脚本编程之 条件选择if 条件判断case 2 文件查找 find locate 以及压缩和解压缩工具过程式编程语言:顺序执行选择执行循环执行条件选择之 if语句选择执行: 注意:if语句可嵌套 单分支 if 判断条件:then ...
  • 一款精致而实用的文件管理App,提供了丰富的文件操作。如果您不经常鼓捣文件,那没关系,把它作为一款...便捷功能:图片浏览器、小说阅读器、音乐播放器、视频播放器、文件压缩器、文件解压器、系统剩余空间提
  • 实验的知识点铺垫请见:python暴力破解加密的压缩文件(一) 文章目录一、实验目的...应用Python程序设计语言的相关知识,对加密的压缩文件进行破解。 二、实验内容 任务1:定义一个函数,函数带有一个参数L(类型...
  • 如何利用python制作一个解压缩软件python实现解压缩的重要模块就是——zipfile,其次是os安装zipfile模块首先得安装zipfile模块,打开cmd输入一下命令即可安装pip install zipfileos是python自带的库,所以无需另外...
  • Linux学习2-帮助与解压缩命令1 Linux的帮助命令1.1 获得指定命令的帮助man1.2 man命令的帮助级别1.3 其他帮助命令- -help1.4 shell内部帮助命令1.5 info命令2 Linux的解压缩命令2.1 常用的压缩格式2.2 .zip压缩与...
  • 1、先下载 WinRAR 压缩软件 ,给 cmd 命令调动 2、把 WinRAR加入环境变量(方便 cmd 命令使用 unrar ) 3、测试一下 是否可以调用 cmd := exec.Command("unrar", "e","-p"+pass,rarpath,"D:/test") //
  • python暴力破解含密码的zip压缩文件

    千次阅读 2014-04-12 12:25:16
    python有zip的类库,解压缩zip文件很方面,代码中,我没有使用多线程,如果追求速度的话,可以使用多线程 思路: 1.先自己生成一份txt的密码字典 2.然后读取出来,一个个的尝试,当密码错误是,程序会报错中断,...
  • (1)R获取数据的三种途径 - 利用键盘来输入数据; - 通过读取存储在外部文件上的数据; - 通过访问数据库系统来获取数据。 例如有以下数据: (2)键盘输入数据: 此外,还可以通过edit来输入数据: data2 <- ...
  • Python解压缩ZIP格式

    千次阅读 2012-12-08 00:06:12
    Python解压缩ZIP格式 很多人在Google上不停的找合适自己的压缩,殊不知Py的压缩很不错。可以试试。当然C#,Java的压缩也有第三方的类。Py有很多美名:数学理论强大,数据结构高级等等,关于压缩算法当然用Py更加...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 28,835
精华内容 11,534
关键字:

r语言解压缩文件