精华内容
下载资源
问答
  • bat文件生成 ...用途:提取子目录名与文件名到txt文件 复制粘贴以下内容 dir/a/s/b>LIST.TXT pause 其中:/b是去掉多余信息,其中把/a改/ad 表示只要文件夹,如果改成/a-d则是只要文件。 ...

    **使用场景:**获取文件夹中所有文件的名称以及子文件夹中的名称
    **用途:**提取子目录名与文件名到txt文件中

    复制粘贴以下内容到bat文件中

    dir/a/s/b>LIST.TXT 
    
    pause
    

    其中:/b是去掉多余信息,其中把/a改/ad 表示只要文件夹,如果改成/a-d则是只要文件。

    bat文件生成
    新建txt文件,输入内容,另存为.bat,编码格式选择ANSI格式,双击文件即可运行
    在这里插入图片描述

    展开全文
  • 批量提取文件夹文件名称

    千次阅读 2019-06-02 10:33:50
    1.在需要提取名称的文件夹右键新建一个“文本文档” 2.打开文本文档,输入以下命令并保存 @ECHO OFF tree /F > 文件树.txt 3.更改这个文本文档的扩展名为 .bat 4.双击运行这个文件,就会出现一个名为“文件树....

    1.在需要提取名称的文件夹中右键新建一个“文本文档”

    2.打开文本文档,输入以下命令并保存

    @ECHO OFF
    tree /F > 文件树.txt

    3.更改这个文本文档的扩展名为 .bat

    在这里插入图片描述

    4.双击运行这个文件,就会出现一个名为“文件树.txt”的文件,打开就是该文件夹下的全部文件名,而且会以目录的形式存在,很清晰。在这里插入图片描述

    5.今后想得到任何文件夹下的全部文件名,可以直接把刚才的.bat文件复制到目标文件夹下,双击运行即可。

    展开全文
  • WORD:提取word文档中的目录

    千次阅读 2014-04-25 14:44:17
    //将目录提取到新文档中 object P_str_path = txtSavePath.Text;//设置保存的文件名称 //保存Word文件 P_document.SaveAs( ref P_str_path, ref G_missing, ref G_missing, ref G_missing, ref G_missing, ref...
    using System;
    using System.Collections.Generic;
    using System.Linq;
    using System.Web;
    using System.Web.UI;
    using System.Web.UI.WebControls;
    using Word = Microsoft.Office.Interop.Word;
    using System.Threading;
    using office = Microsoft.Office.Core;
    using System.Reflection;
    using System.IO;
    
    public partial class _Default : System.Web.UI.Page
    {
        private Word.Application G_wa;//定义Word应用程序字段
        private object G_missing = System.Reflection.Missing.Value;//定义G_missing字段并添加引用
    
        protected void Page_Load(object sender, EventArgs e)
        {
            txtOpenPath.Text = Server.MapPath("~/File/word.doc");//打开Word文档位置
            txtSavePath.Text = string.Format(@"{0}\{1}", Server.MapPath("~/File"), DateTime.Now.ToString("yyyy年M月d日h时m分s秒fff毫秒") + ".doc");
        }
    
        protected void btnNew_Click(object sender, EventArgs e)
        {
            G_wa = new Microsoft.Office.Interop.Word.Application();//创建应用程序对象
            G_wa.Visible = false;
            object G_FilePath = txtOpenPath.Text;
            //打开Word文档
            Word.Document P_wd = G_wa.Documents.Open(
               ref G_FilePath, ref G_missing, ref G_missing, ref G_missing, ref G_missing,
               ref G_missing, ref G_missing, ref G_missing, ref G_missing, ref G_missing,
               ref G_missing, ref G_missing, ref G_missing, ref G_missing, ref G_missing,
               ref G_missing);
            Word.Document P_document = G_wa.Documents.Add(ref G_missing, ref G_missing, ref G_missing, ref G_missing);//添加新的Word文档
            object P_start = 0;//定义范围的开始位置
            object p_end = 0;//定义范围的结束位置
            Word.Range rg = P_wd.Range(ref P_start, ref p_end);//得到文档的范围
            WordToWord(P_wd, P_document, rg);//将目录提取到新文档中
            object P_str_path = txtSavePath.Text;//设置保存的文件名称
            //保存Word文件
            P_document.SaveAs(
                ref P_str_path,
                ref G_missing, ref G_missing, ref G_missing, ref G_missing,
                ref G_missing, ref G_missing, ref G_missing, ref G_missing,
                ref G_missing, ref G_missing, ref G_missing, ref G_missing,
                ref G_missing, ref G_missing, ref G_missing);
            object P_Save = false;//设置参数为不保存
            ((Word._Application)G_wa.Application).Quit(ref P_Save, ref G_missing, ref G_missing);//退出应用程序
            Response.Write("<script>alert('目录已经提取完成!');</script>");
        }
    
        /// <summary>
        /// 将目录提取到新文档中
        /// </summary>
        /// <param name="P_wd">将要提取目录的文档</param>
        /// <param name="P_document">新建文档</param>
        /// <param name="rg">文档范围</param>
        private void WordToWord(Word.Document P_wd, Word.Document P_document, Word.Range rg)
        {
            object P_start = System.Reflection.Missing.Value;
            object p_end = System.Reflection.Missing.Value;
            object P_UseHeadingStyles = true;//是否使用内置样式创建目录
            object P_UpperHeadingLevel = 1;//目录起始的标题级别
            object P_LowerHeadingLevel = 9;//目录结束的标题级别
            object P_UseFields = false;//是否使用TC(目录项)创建目录
            object P_TableID = 1;//单字母标识符,用于根据TC域创建目录
            object P_RightAlignPageNumbers = false;//目录是否右边距对齐
            object P_IncludePageNumbers = false;//目录中是否包含页码
            object P_AddedStyles = null;//目录其它样式的字符串名称
            object P_UseHyperlinks = false;//是否将文档发布到WEB
            object P_HidePageNumbersInWeb = false;//目录中的页码是否被隐藏
            P_wd.TablesOfContents.Add(rg, ref P_UseHeadingStyles,//将提取的目录插入到文档的开始位置
                ref P_UpperHeadingLevel, ref P_LowerHeadingLevel,
                ref P_UseFields, ref P_TableID, ref P_RightAlignPageNumbers,
                ref P_IncludePageNumbers, ref P_AddedStyles, ref P_UseHyperlinks,
                ref P_HidePageNumbersInWeb, ref G_missing);
            if (P_wd.Fields.Count >= 1)
            {
                P_wd.Paragraphs[1].Range.Cut();//剪切文档开始位置的目录信息
                P_document.Range(ref P_start, ref p_end).Paste();//将目录信息粘贴到新文档
            }
        }
    
    
    }
    

    展开全文
  • 批量提取word doc文档中的表格

    千次阅读 2020-02-22 10:35:58
    doc文档无法通过docx包读取,需转换为docx。 docx格式的文件本质上是一个ZIP文件。 如果将后缀改为zip就能看清内部结构。 docx提取word的表格非常方便。 这段代码还可以提取docx的图片。 import os, ...

    doc文档无法通过docx包读取,需转换为docx。

    docx格式的文件本质上是一个ZIP文件。

    如果将后缀改为zip就能看清内部结构。

    docx提取word中的表格非常方便。

    这段代码还可以提取docx中的图片。

    import os, shutil, xlwt, re
    from docx import Document
    from win32com import client as wc
    path=r'C:\Users\Administrator\Desktop\0221\正常发布的'
    excelpath=os.path.join(path, "..\\")
    target = os.path.join(path, "..\\docx")
    imgPath = r'C:\Users\Administrator\Desktop\0221\pic'
    word = wc.Dispatch("Word.Application")
    imgabspath = ''
    if not os.path.exists(target):
        os.mkdir(target)
    if not os.path.exists(imgPath):
        os.mkdir(imgPath)
    
    for root, dirs, files in os.walk(path):
        #print(root,files)
        for name in files:
            if name.endswith('.doc'):
                doc = word.Documents.Open(os.path.join(root, name))
                docxabs = os.path.join(target, os.path.basename(name)+'x') 
                doc.SaveAs(docxabs, 12)
                doc.Close()
            elif name.endswith('.docx'):
                docxabs = os.path.join(target, os.path.basename(name))
                shutil.copyfile(os.path.join(root, name),docxabs)
    word.Quit()
                                       
    workbook = xlwt.Workbook(encoding = 'GBK')
    worksheet = workbook.add_sheet('公司列表')
    worksheet.write(0,0,'单位名称')
    worksheet.write(0,1,'营业执照(副本)注册号') 
    worksheet.write(0,2,'单位性质')
    worksheet.write(0,3,'单位地址')
    worksheet.write(0,4,'联系人') 
    worksheet.write(0,5,'联系电话') 
    worksheet.write(0,6,'单位简介')
    worksheet.write(0,7,'招聘信息')
    worksheet.write(0,8,'营业执照')
    for root, dirs, files in os.walk(target):
        c_row = 1
        for name in files:
            print(name)
            d = Document(os.path.join(root, name))
            t = d.tables
            company=t[0].cell(0,1).text.replace('\n', '').replace(' ', '')
            worksheet.write(c_row,0,company)
            worksheet.write(c_row,1,t[0].cell(0,3).text)
            worksheet.write(c_row,2,t[0].cell(1,1).text)
            worksheet.write(c_row,3,t[0].cell(2,1).text)
            worksheet.write(c_row,4,re.findall(r'[\u4E00-\u9FA5]+',t[0].cell(2,3).text))
            worksheet.write(c_row,5,re.findall("[0-9]{11}",t[0].cell(2,3).text))
            if t[0].cell(3,0).text == '单位简介':
                worksheet.write(c_row,6,t[0].cell(3,1).text)
                worksheet.write(c_row,7,t[0].cell(4,1).text)
            elif t[0].cell(4,0).text == '单位简介':
                worksheet.write(c_row,6,t[0].cell(4,1).text)
                worksheet.write(c_row,7,t[0].cell(5,1).text)
            
            if ".docx" not in name:
                continue
            #subImgPath = os.path.join(imgPath, company)
            #if not os.path.exists(subImgPath):
            #    os.makedirs(subImgPath)
            imgabspath = ''
            for rel in d.part._rels:
                rel = d.part._rels[rel]              #获得资源
                if "image" not in rel.target_ref:
                    continue
                imgName = re.findall("/(.*)",rel.target_ref)[0]
                extension = os.path.splitext(imgName)[1]
                imgabspath = imgPath + "/" + company + extension
                with open(imgabspath,"wb") as f:
                    f.write(rel.target_part.blob)
            if os.path.isfile(imgabspath):#os.listdir(subImgPath):
                worksheet.write(c_row,8,imgabspath)
            os.rename(os.path.join(root, name), os.path.join(root, company+'.docx'))
            
            c_row += 1
    workbook.save(os.path.join(excelpath, '公司招聘列表.xls'))

     

    展开全文
  • 搜索并从Google docs文档中提取。 这是一个命令行工具,可以按以下方式使用: python3 SearchAndExtractFromGDoc.py --id <DocumentID> --token <TokenFile> --regex <RegEx> --outfile DocumentID是DocumentID...
  • Hive 正则提取英文名称和中文名称

    千次阅读 2018-11-12 16:51:30
    Hive 正则提取英文名称和中文名称 提取英文名称 select regexp_extract(&quot;Aptamil 爱他美(德国)&quot;,'([A-Z][a-z]*(\\s|$))+', 1); select regexp_extract(&quot;Skin 伊思&quot;,'(\\w*(\\s...
  • 文本文档的信息多是按照行的格式读写的,因此在读取时对提取到每行的文本信息进行关键字的对比找到指定行,然后利用正则表达式提取相应的信息即可。 文本信息示例 positions bitstream size 550216 B (12.5996 ...
  • 利用java从docx文档中提取文本内容

    千次阅读 2018-06-18 21:26:30
    利用java从docx文档中提取文本内容 使用Apache的第三方jar包,地址为https://poi.apache.org/ docx文档内容如图: 目录结构: 每个文件夹的名称为日期加上来源,例如:20180618医院,每个docx文档名称是被...
  • 一键提取多个文件名称,把文档放入一个文件夹,把插件放入文件夹双击。
  • 提取文件夹所有文件名称小程序,可以搜集到文件夹里所有文档名称信息。
  • 在接下来的例子,将演示如何使用PDFBox提供的API,从一个PDF文件中提取出文本信息。 3、在Eclipse配置 以下是在Eclipse创建工程,并建立解析PDF文件的工具类的过程。 (1)在Eclipse的workspace创建一个普通...
  • 本文的需求是提取docx文档里面的数据信息,包括文本和Excel表格信息。 经过一上午的搜索,目前找到了一些文字,整理成自己需要的的代码。 二、提取数据 安装模块: 我这里直接命令安装即可。 pip install python-...
  • 提取文件夹内所有文件的名称并生成TXT文档
  • JAVA_API1.6文档(中文)

    万次下载 热门讨论 2010-04-12 13:31:34
    javax.transaction 包含解组期间通过 ORB 机制抛的三个异常。 javax.transaction.xa 提供定义事务管理器和资源管理器之间的协定的 API,它允许事务管理器添加或删除 JTA 事务的资源对象(由资源管理器驱动程序...
  •       LabelImg是深度学习用来标注图片物体位置与名称的工具,...Python提取文档中的标记信息(坐标信息&文字信息): import xml.etree.ElementTree as ET import sys xml_...
  • 去污是用于从可能嵌套的大型XML文档中提取信息的工具。 它提供了一个简单的Ruby DSL,用于从Nokogiri对象选择值并将结果存储在类似JSON的Ruby哈希和数组。 安装 将此行添加到您的应用程序的Gemfile: gem '...
  • 你手有一篇图文混排的Word文档,想把其中的图片快速提取出来,只要按下面的方法操作就行了。  1、启动 Microsoft Word (Word2003、Word2007、Word2010都可以),打开需要提取图片的 Word 文档。  2、...
  • excelVBA提取文件夹名称的方法

    千次阅读 2016-08-09 15:15:54
    内容提要:文章介绍excel使用VBA代码来提取文件夹名称的具体操作步骤。对Excel感兴趣的朋友可加Excel学习交流群:284029260(www.itblw.com)  在网上看到有人用批处理命令提取文件夹名称。其实在excel使用VBA...
  • 批量提取子文件夹名称。...提取结果会自动生成一个TXT文档。每列存在一个文件名称。注意:这里提取的是文件夹的名称。如果不是文件夹,而是文件的的话不会提取。比如. .av .shp .doc等等.是不会提取来的。
  • 得到的文档只有全部图片的名字 1 先建一个.txt 文件 2 在文件写进代码 @echo off dir /b /on &gt;list.txt 保存,把后缀名.txt 改成 .bat 3 把这个bat文件放到那个文件夹下,双击 4 会多出来一个list.txt ...
  • 批量提取文件名到txt文档的方法

    千次阅读 2017-12-15 21:14:48
    在深度学习库需要建立数据集的每个文件名及其对应的标签,通常以txt文件保存,在matlab下用textread(datasetpath,format)的形式读取。那么怎样批量提取文件夹下的所有文件名呢?这涉及到Windows脚本-bat编程基础,...
  • 很多时候,软件开发的过程或者开发完之后,设计文档中的数据库表结构和数据库的表结构是不一致的。 为了对程序所使用到的表结构进行备份或传阅审核,或者为了补充设计文档中的表结构设计这块,又或者为了将设计...
  • 如何提取出ppt的文字?

    万次阅读 2013-09-16 12:15:30
    最近在看一位老师的教学视频,视频里大部分的知识都记录在ppt里,于是很想将ppt的文字提取出来,如果我一页一页地粘贴复制的话,效率低到吓人,因为一章的ppt有130多页,于是在网上搜索了一下方法,与大家分享一下...
  • 把 Visual Studio .NET 源代码文件C# XML注释提取成工程文档 PRE { background:#EEEEEE; margin-top:1em; margin-bottom:1em; margin-left:0px; padding:5pt; font-size:90%; font-family:courier new,courier,...
  • 工作有时需要将文档中的所有图片提取出来进行处理,虽然可以一张一张的保存,但是工作量太大。有没有什么办法能准确无误提取出所有图片呢?下面,小编就来演示如何快速提取出WPS文字的图片,此方法在Word也...
  • Auto.js文档 综述 Auto.js使用JavaScript作为脚本语言,目前使用Rhino 1.7.7.2作为脚本引擎,支持ES5与部分ES6特性。 因为Auto.js是基于JavaScript的,学习Auto.js的API之前建议先学习JavaScript的基本语法和内置...
  • 想对某个文件夹做个内容列表,把文件名字一个个复制,再粘贴到文本文档——太麻烦了!怎么办? 技巧:首先调出MS-DOS窗:win+R ->cmd ->回车。 方法一:tree命令 命令提示符下:tree (要获得...
  • php解析word,获得文档中的图片

    千次阅读 2018-07-09 15:14:14
    大体思路是先将word格式为doc的文档转化为docx,用预处理程序将文档中的公式转化为swf图片格式,将word转化为xml格式,在获得xml的内容转化为json格式。   预备知识 1. 理解xml基础 xml是一种可扩展标记...
  • 时间浪费在打字上可不好。今天我就搜索了下如何将PDF文档

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 103,229
精华内容 41,291
关键字:

如何提取出文档中的名称