精华内容
下载资源
问答
  • 在电脑中查找重复的数据,字符等,支持word、excel、txt等常规文件,只要在软件中输入要查找的字符,指定搜索路径,就会自动为你找出那些文件含有你需要的字符,非常方便、实用!!!
  • row+4+i,1,reason_list_collect[i]) 结果,如下,可以从一堆数据中,筛选出共有多少条不重复的数据,并去除非关键的部分(时间戳之类的字符) ‘’’ ws.sheet_properties.tabColor = “1072BA” 根据列的数字返回...

    从一堆数据中,筛选出共有多少条不重复的数据,并去除非关键的部分(时间戳之类的字符)
    在这里插入图片描述

    import json
    import requests
    import openpyxl
    import os
    import ssl
    import sys
    import time
    
    import json
    import requests
    import openpyxl
    import os
    import ssl
    import sys
    import time
    from openpyxl.styles import Font, colors, Alignment,PatternFill
    
    class ExcelOp(object):
        def __init__(self, file):
            self.file = file
            self.wb = openpyxl.load_workbook(self.file)
            sheets = self.wb.sheetnames
            self.sheet = sheets[0]
            self.ws = self.wb[self.sheet]
    
        def set_sheets(self,num):
            sheets = self.wb.sheetnames
            if(num < len(sheets)):
                self.sheet = sheets[num]
                self.ws = self.wb[self.sheet]
            else:
                print("the sheet num is out range ,MAX:%d"%(len(sheets)))
        def get_sheet_name(self):
            return self.ws.title
            
        # 获取表格的总行数和总列数
        def get_row_clo_num(self):
            rows = self.ws.max_row
            columns = self.ws.max_column
            return rows, columns
    
        # 获取某个单元格的值
        def get_cell_value(self, row, column):
            cell_value = self.ws.cell(row=row, column=column).value
            return cell_value
    
        # 获取某列的所有值
        def get_col_value(self, column):
            rows = self.ws.max_row
            column_data = []
            for i in range(1, rows + 1):
                cell_value = self.ws.cell(row=i, column=column).value
                column_data.append(cell_value)
            return column_data
    
        # 获取某行所有值
        def get_row_value(self, row):
            columns = self.ws.max_column
            row_data = []
            for i in range(1, columns + 1):
                cell_value = self.ws.cell(row=row, column=i).value
                row_data.append(cell_value)
            return row_data
    
        # 设置某个单元格的值
        def set_cell_value(self, row, colunm, cellvalue):
            bold_itatic_24_font = Font(color=colors.RED)
            self.ws.cell(row, colunm).font = bold_itatic_24_font
            fill = PatternFill("solid", fgColor=colors.GREEN)
            self.ws.cell(row, colunm).fill = fill
            try:
                self.ws.cell(row=row, column=colunm).value = cellvalue
                self.wb.save(self.file)
            except:
                self.ws.cell(row=row, column=colunm).value = "writefail"
                self.wb.save(self.file)
    
    
        '''
        function :cut_str_3parts
        [itput]
        str_ori        : ori string
        sellect_word   : key words
        part_want      : 0 , return befor keywords
                         1 , return keywords
                         2 , return after keywords
        [putput]
        return[0](int) : 0 ,the keywords don't exist in str_ori
                         1 ,the keywords exist in str_ori
        return[1](str) : the  string of part_want ,! if cant find keywords ,will retuen "None"   
        '''
        def cut_str_3parts(self,str_ori,sellect_word,part_want):
            exist_orNot = 0
            str_return = "None"
            if(str_ori.find(sellect_word) > 0):
                exist_orNot = 1
                str_map = str_ori.partition(sellect_word)
                str_return = str_map[part_want]
            return exist_orNot,str_return
                
    reason_list_collect = []
    
    
    flag_exist = 0
    if __name__ == "__main__":
        excel_ori= ExcelOp(file="ori_check.xlsx")
        max_row,max_column = excel_ori.get_row_clo_num()
    
        
        
        for j in range(max_row):
            str_reason = str(excel_ori.get_cell_value( j+1, 1))
    
            flag_exist,str_temp = excel_ori.cut_str_3parts(str_reason," Th[",0)
            if flag_exist:
                if str_temp not in reason_list_collect:
                    reason_list_collect.append(str_temp)  
           
        print("reason_list_collect:",reason_list_collect)
    
        for i in range(len(reason_list_collect)):
            excel_ori.set_cell_value(max_row+4+i,1,reason_list_collect[i])
    
    

    ‘’’
    ws.sheet_properties.tabColor = “1072BA”

    根据列的数字返回字母

    print(get_column_letter(2)) # B

    根据字母返回列的数字

    print(column_index_from_string(‘D’)) # 4

    from openpyxl.styles import Font, colors, Alignment

    bold_itatic_24_font = Font(name=‘等线’, size=24, italic=False, color=colors.RED, bold=True)

    sheet[‘A1’].font = bold_itatic_24_font

    sheet[‘B1’].alignment = Alignment(horizontal=‘center’, vertical=‘center’)

    第2行行高

    sheet.row_dimensions[2].height = 40

    C列列宽

    sheet.column_dimensions[‘C’].width = 30

    合并单元格, 往左上角写入数据即可

    sheet.merge_cells(‘B1:G1’) # 合并一行中的几个单元格
    sheet.merge_cells(‘A1:C3’) # 合并一个矩形区域中的单元格

    sheet.unmerge_cells(‘A1:C3’)

    TIME = datetime.datetime.now().strftime("%H:%M:%S")
    TITLE = str(time())

    '''
    
    展开全文
  • 二、对合并后的Excel表格进行删除重复值操作  1)我们要进行处理的原表格如下图,组名行有三行重复两行,有以为同学的信息重复:    2) 通过Excel表格开始栏中的 条件格式 选中重复值:  步骤(1)...

    一、前言

           首先,今天我们分享的文章还是采用office工具来完成,本人对office又特殊的癖好,主要是在我看来office比wps更好用、更适用,或许这只是个人喜欢;其次,通过对上篇博客的分享学习,想必大家对合并多张Excel表格早已得心应手,那么今天我们就一起来学习学习对合并好的excel表格进行简单的排版。

     

    上次分享的合并多张Excel表格连接https://blog.csdn.net/jiangzubing520/article/details/80278321

     

    二、对合并后的Excel表格进行删除重复值操作

       1)我们要进行处理的原表格如下图,组名行有三行重复两行,有以为同学的信息重复:

        

      2)通过Excel表格开始栏中的条件格式选中重复值:

     步骤(1):Ctrl+A全选表格

     

     步骤(2):文本标记出重复值

     

    步骤(3):此处可以根据表格内容多少来选择下一步操作;其一,如果表格内容较少可以直接选取删除;其二、如果内容较多则选择下一步的操作。重复执行步骤(1)、步骤(2),然后将色阶改为自定义即可将文本恢复为白色:

    3)在数据栏下的筛选进行合并Excel表格中的重复值,后手动将其删除

      步骤(1):

    步骤(2):

    步骤(3):手动将其删除,再进行简单合并


     三、对Excel表格的行宽、列宽进行排版

      1)在我们从word中将表格复制到Excel的时候,会出现行宽、列宽不一的表格:

    2)通过开始栏下的格式进行宽、列宽进行调整:

    3)给行宽、列宽一个值就能将其设置为标准的表格了:

    4)合并完成:

     

     

     

     

          

    展开全文
  • 大家可以看到在下图的A、B两列中,有部分行两个单元格中的数据相同,即为重复值,图中用红色标识,现在的需求就是从两列中提取唯一值到其他区域,多次出现的重复值只提取一次,下面以Excel 2013和下图两列数据为例向...

    在Excel表格中有两列数据如何提取不重复值,即从两列中提取不重复(唯一)值,本文指将两列中所有相同行的两个单元格数据连接后去掉重复项。大家可以看到在下图的A、B两列中,有部分行两个单元格中的数据相同,即为重复值,图中用红色标识,现在的需求就是从两列中提取唯一值到其他区域,多次出现的重复值只提取一次,下面以Excel 2013和下图两列数据为例向大家介绍使用四种不同的方法从两列数据中提取不重复值,感兴趣的朋友可以参考下。

    在Excel表格的两列数据中提取不重复值的四种方法

    在Excel中,通常可用“删除重复项”功能、高级筛选、数组公式和数据透视表等方法来提取这样的重复值。下面以Excel 2013和上图两列数据为例,介绍如下:

    方法一:用“删除重复项”功能

    将上述A、B两列中的数据复制粘贴到其他区域,例如D2:E19区域,选择D2:E19,在“数据”选项卡的“数据工具组”中单击“删除重复项”,在弹出的对话框中点“确定”。

    在Excel表格的两列数据中提取不重复值的四种方法

    Excel即可自动将重复值删除,得到两列中的唯一值。

    在Excel表格的两列数据中提取不重复值的四种方法

    该方法较为快捷,适用于Excel 2007以上版本,但如果两列中的数据发生更改后还需重新操作。

    方法二:用高级筛选

    选择两列中的某个单元格,在“数据”选项卡的“排序和筛选”组中点“高级”。如果出现“Microsoft Excel 无法确定当前列表或选定区域的哪一行包含列标签,……”对话框,单击“确定”,弹出“高级筛选”对话框,将“列表区域“设置为A、B两列,选择“将筛选结果复制到其他位置”,将“复制到”设置为D2单元格,“条件区域”保留为空,同时勾选“选择不重复的记录”,单击“确定”。

    在Excel表格的两列数据中提取不重复值的四种方法

    Excel会将A、B两列中的唯一值提取到D、E两列。

    在Excel表格的两列数据中提取不重复值的四种方法

    如果以后继续在A、B两列添加数据,再次进行高级筛选时Excel会保存上次的区域设置,还是比较方便的。

    方法三:用数组公式

    这种方法适合于数据量不大的情况。选择D2:E2区域,在编辑栏中输入数组公式:

    =INDEX(A:B,SMALL(IF(MATCH(A$2:A$19&B$2:B$19,A$2:A$19&B$2:B$19,)=ROW($1:$18),ROW($2:$19),4^8),ROW(A1)),{1,2})&""

    按Ctrl+Shift+Enter结束输入,然后选择D2:E2,拖动填充柄向下填充公式,直到出现空白为止。

    说明:公式用SMALL、IF和MATCH函数得到同行数据相连接后第一次出现的行号,再用INDEX函数同时返回A、B两列的唯一值数据。

    方法四:使用数据透视表

    1、如果A、B两列的数据需要更改或添加,可先将这两列数据转换为表格。方法是选择两列数据中的某个单元格,在“插入”选项卡的“数据”组中单击“表格”,弹出“插入表”对话框,单击确定。

    在Excel表格的两列数据中提取不重复值的四种方法

    2、再次选择两列数据中的某个单元格,在“数据”组中单击“数据透视表”,弹出“创建数据透视表”对话框,选择放置数据透视表的位置,本例为同一工作表中的D2单元格,单击“确定”。

    3、在“数据透视表字段列表”中勾选“货号”和“尺码”两个字段,将其添加到数据透视表。

    在Excel表格的两列数据中提取不重复值的四种方法

    4、修改数据透视表的外观和布局。

    ①在“数据透视表工具--设计”选项卡中,分别单击“报表布局→以表格形式显示”和“报表布局→重复所有项目标签”。

    ②在“数据透视表工具--设计”选项卡中,单击“分类汇总→不显示分类汇总”。

    ③在“数据透视表工具--分析”选项卡的“显示”组中,单击取消选择“+-按钮”。

    这样就得到了A、B两列中的不重复值。以后在A、B两列数据后的空单元格中添加数据后,Excel会自动扩展表格,刷新数据透视表即可得到新的唯一值数据。http://pdftoword.55.la/pdf-split/

    展开全文
  • 这个写的很简单,比之前上传的那个vba的简单,逻辑如下,给定目录,遍历所有doc转换成docx,然后循环读取所有docx里的第一个表格,进行重复值筛选,然后写入到excel里,用到了几个模块,需要提前导入
  • 高级筛选是针对复杂条件的筛选。例如:在图7-9所示的员工薪水表中,只显示薪水超过6000元(含6000元)的销售部的...以下各行为相应的条件。注意:数据清单与条件区域之间至少要空出一行或一列。几个条件在同一行上是"...

    bbbbecb0cf43a79fa98eda6d6238d4da.png

    高级筛选是针对复杂条件的筛选。

    例如:在图7-9所示的员工薪水表中,只显示薪水超过6000元(含6000元)的销售部的员工和薪水低于4000元的培训部的员工的记录。

    操作步骤:

    1)在数据清单以外的区域输入筛选条件。该条件区域至少为两行,第一行为设置筛选条件的字段名,该字段名必须与数据清单中的字段名完全匹配。以下各行为相应的条件值。

    注意:数据清单与条件区域之间至少要空出一行或一列。几个条件在同一行上是"与"的关系;在不同行上是"或"的关系。图7-14中所示的"销售部"和">=6000"两个条件即为"与"的关系;"培训部"和"<400。"两个条件也为"与"的关系;而薪水大于等于6000的销售部员工和薪水少于4000的培训部员工这两个条件为"或"的关系。

    (2)单击数据清单内的任何一个单元格。

    (3)选取"数据"菜单中的"筛选"命令下的子命令"高级筛选",出现"高级筛选"对话框。

    (4)在"方式"框中选择结果的输出位置。

    (5)确定筛选的列表区域。因为在步骤2)中已经将整个数据

    清单作为筛选区,因此在"列表区域"输入框中已经显示了列表区域。可以重新输入或用鼠标选定要筛选的单元格区域。

    (6)在"条件区域"输入框中输入筛选条件所在的单元格区域,本例中为$H$3:$I$5。

    (7)如果要筛选掉重复的记录,可选中对话框中的"选择不重复的记录"复选框。

    (8)单击"确定"按钮。

    2010年职称计算机考试:高级筛选

    高级筛选是针对复杂条件的筛选。

    例如:在图7-9所示的员工薪水表中,只显示薪水超过6000元(含6000元)的销售部的员工和薪水低于4000元的培训部的员工的记录。

    操作步骤:

    1)在数据清单以外的区域输入筛选条件。该条件区域至少为两行,第一行为设置筛选条件的字段名,该字段名必须与数据清单中的字段名完全匹配。以下各行为相应的条件值。

    注意:数据清单与条件区域之间至少要空出一行或一列。几个条件在同一行上是"与"的关系;在不同行上是"或"的关系。图7-14中所示的"销售部"和">=6000"两个条件即为"与"的关系;"培训部"和"<400。"两个条件也为"与"的关系;而薪水大于等于6000的销售部员工和薪水少于4000的培训部员工这两个条件为"或"的关系。

    (2)单击数据清单内的任何一个单元格。

    (3)选取"数据"菜单中的"筛选"命令下的子命令"高级筛选",出现"高级筛选"对话框。

    (4)在"方式"框中选择结果的输出位置。

    (5)确定筛选的列表区域。因为在步骤2)中已经将整个数据

    清单作为筛选区,因此在"列表区域"输入框中已经显示了列表区域。可以重新输入或用鼠标选定要筛选的单元格区域。

    (6)在"条件区域"输入框中输入筛选条件所在的单元格区域,本例中为$H$3:$I$5。

    (7)如果要筛选掉重复的记录,可选中对话框中的"选择不重复的记录"复选框。

    (8)单击"确定"按钮。

    2829f2ca24f0d0090cbba57f30759f23.png

    职称计算机考试:excel高级筛选.doc

    下载Word文档到电脑,方便收藏和打印[全文共1164字]

    编辑推荐:

    8b95f2eb3d3f7ce4dc3bf1178c74941e.png

    8b95f2eb3d3f7ce4dc3bf1178c74941e.png

    8b95f2eb3d3f7ce4dc3bf1178c74941e.png

    8b95f2eb3d3f7ce4dc3bf1178c74941e.png

    8b95f2eb3d3f7ce4dc3bf1178c74941e.png

    下载Word文档

    展开全文
  • WORD经典实用!

    千次阅读 2016-07-21 17:30:31
    WORD经典实用!较全面!
  • 简单好用的Word技巧一秒对齐文字在Word中如何对齐文字,我想十个人中有九个都会像三顿这样手打空格。只有短短几行倒还好说,如果是几十行甚至几百行,一定会打空格打到吐吧。标尺一秒对齐!只需要选中文字,在标尺处...
  • 推荐 Word、EXCEL必备工具箱

    千次阅读 2019-09-20 09:41:36
    26、处理工具→处理→唯一值、重复值筛选功能改进,在数据量特别大时,只能筛选出1行数据,现在予以改进,不限制数量。 Excel必备工具箱15.70版更新内容 新增功能: 1、财税工具→更多→新增“融资租赁成本计算”...
  • WORD三件套笔记

    万次阅读 多人点赞 2019-11-07 14:51:07
    考试形式 一套PPT 一套EXCEL 一套WORD综合 +PPT AND WORD 单项 随机抽取题库题目 考试安排在第十八周 也就是还有三周 PPT 比较简单 还差60%可以完成所有笔记 争取下礼拜完成所有笔记记录 EXCEL 综合 还有三套、...
  • 本文从从老祖级别的 word2vec 开始,从头到尾梳理了 GPT 的 「家谱」 和 word2vec 领衔的庞大的 NLP「家族集团」。 GPT 不是凭空而出,它是经过了很多人的努力,以及很长一段时间的演化得来的。因此,梳理一下 GPT...
  • 保存Word文件

    2019-05-08 17:15:07
    上传考题比较特殊,因为它并不像表格数据那样精简,而且格式不一,所以需要用word文件进行上传。上传,通过一些特殊的处理将文件以html的样式显示到页面上再进行保存。上传过程复杂,而保存过程同样复杂,下面我将对...
  • 选中列 ---查找和筛选 ------定位条件 --------空值 输入: =第一个重复值坐标 按:ctrl+enter 键自动全部填充 ...
  • python–半自动爬取Leetcode上面的所有题目并转成word打印 写在前面 最近想做下算法题目,补补基础,在手机上面或者电脑上面做的不是那么的爽,就想着打印下来,然后在每道题目下面写下草稿,后面再用电脑写代码...
  • Magicodes.IE是一个导入导出通用库,支持Dto导入导出以及动态导出,支持Excel、Word、Pdf、Csv和Html。在本篇教程,笔者将讲述如何使用Magicodes.IE的导入导出筛选器。在开始之前,我们需要先了解Magicodes.IE目前...
  • 暑期 tensorflow+word2vec 笔记

    千次阅读 2017-08-20 10:25:32
    暑期 tf+word2vec 学习笔记一、需要提前装的库#``` bs4 将爬下来的数据去掉无关的特殊字符``` #``` nltk NLP中重要的处理库``` #``` gensim 构建模型的需要```from bs4 import BeautifulSoup #``` sklearn 机器学习...
  • word编辑技巧

    千次阅读 2010-05-10 18:04:00
    1.2 编辑排版技巧(1)1.2.1 页面设置快速进行调整要对Word进行页面调整,通常大家采用的方法是选择“文件→页面设置”选项的方法进行,请问有没有更快速方便的方法呢?答:有,如果要进行“页面设置”,只需用鼠标...
  • Excel中的筛选 subtotal

    千次阅读 2013-01-16 15:49:55
    但不知道是有意还是疏忽,Excel没有直接提供在筛选后的一些统计功能,例如求和、平均等。而由于筛选的主要功能之一就是可以方便快捷的进行变换,所普通的以直接在数据最下面一行进行求和无法实现,计算也是不...
  • 编写一个小程序,从标准输入一系列string对象, 寻找连续重复出现的单词,程序应该找出以下条件的输入位置:该单词的后面紧跟着再次出现自己本身, 跟踪重复次数最多的单词及其重复次数,输出重复次数的最大,若...
  • List<String> words = Arrays.asList("a", "b", "c", "d", "a", "d"); Set<String> repeated = new HashSet<>(); ... results = new ArrayList<...for (String word : words) { ... results.add(word.
  • 最近接收了一个 消息中心 模块的需求,此模块为消息起到消息中转、筛选,以及对消息按照一定规则进行重新组织(删减订阅方不需要的信息,以减小消息量,迎合订阅方需求重新组织需求)。 综上,根本问题在于解析消息...
  • Word操作技巧大全

    2017-02-21 10:20:00
    Word中的“选中”方法知多少? 一、常见的“选中”方法: ü 全选(快捷键Ctrl+A):就是全部选中文档内的所有内容。这所有内容包括:文字、表格、图形、图像等可见的和不可见的标记。 ü 按住Shift+Page Down从...
  • office 2007 去除重复数据方法 选择你要排序的列头,然后执行以下操作: 第一步:指定列扩展排序 开始 ->... 重复值 -> “重复”值,设置为“浅红填充色深红色文本” -> 确定 第...
  • Word Embeddings 学习笔记

    2019-08-13 09:52:53
    通过随机将一些归零,dropout掉一些Attention权值; 预测目标序列中的未来单词。辅助任务匹配的主要预测是通过在输入序列(input sequence)上运行固定的主要decoder和集束搜索(beam search)产生的最佳预测...
  • 【计算机基础】03-Word知识

    万次阅读 2020-05-09 13:41:13
    第3章 文字处理软件 Word 2010 3.1 初始Office 2010 Office 2010组件包括Word(文字处理软件)、Excel(电子表格软件)、PowerPoint(幻灯片制作软件)、Outlook(个人信息管理软件)、Access(关联式数据库管理...
  • 1、即时取消Word的后台打印:当我们刚刚编辑完一篇文档按了打印命令后,后来又不想打印当前的文档了,那么怎样才能即时取消后台打印任务呢?一般来说,大家在发出打印任务后,程序会自动将打印任务设置为后台打印,...
  • Python筛选Excel文件中超过一定年龄的人员信息 Python批量导入图片到Word文件 把Python程序的输出和异常信息自动写入文件 Python操作Excel文件:插入一列数据 Python使用pandas合并多个Excel文件 Python处理文本文件...
  • 理解Word2Vec

    2017-08-24 14:13:51
    这里需要注意的就是V通常是一个很大的数比如几百万,计算起来相当费时间,除了“爱”那个位置的元素肯定要算在loss里面,word2vec就用基于huffman编码的Hierarchicalsoftmax筛选掉了一部分不可能的词,然后又用...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 7,260
精华内容 2,904
关键字:

word重复值筛选