精华内容
下载资源
问答
  • Excel 标记重复多余

    2020-05-25 12:01:13
    这里有一列数据,需要将重复项筛选出来。 在开始菜单的条件格式中,选择重复值

    这里有一列数据,需要将重复多余项标记筛选出来。
    在这里插入图片描述

    在开始菜单的条件格式中,选择重复值。
    在这里插入图片描述

    在这里插入图片描述

    标红部分为重复的订单号。
    在这里插入图片描述

    要将重复的数据标记出来,还需使用Countif。
    在这里插入图片描述

    公式【=COUNTIF(A2:A2,A2)】指的是,在A2到A2的区域内对A2单元格中的数据进行计数统计。
    需要进行锁定。

    在这里插入图片描述

    锁定公式为【=COUNTIF($A$2:A2,A2)】,将A2锁定为计数区间起始值,结束值为该数据所在行(大白话就是:从A2开始数,数到我这一行,看我出现了几次)。

    在这里插入图片描述

    仔细观察上图可发现,重复数据的计数都为2及以上。
    所以在外层嵌套if函数:【=IF(COUNTIF($A$2:A2,A2)>1,“重复数据”,"")】
    在这里插入图片描述

    这样就可以有效筛选出重复项了。

    展开全文
  • 标记Excel数据重复值.rar,在输入数据时,很可能会重复输入每内容,条件格式可以帮助用户在输入后立即检查刚才的数据是否为重复值,如果是,则标记出来以供进一步核对。
  • Excel查看多列重复项

    2021-02-01 15:41:01
    1.将要查询的列用“&”符号合并成新的一列 2.数据——重复项——高亮显示重复项 3.开始——筛选——颜色筛选——选择上一步标记的重复的颜色

    1.将要查询的列用“&”符号合并成新的一列

    2.数据——重复项——高亮显示重复项

    在这里插入图片描述

    3.开始——筛选——颜色筛选——选择上一步标记的重复的颜色在这里插入图片描述

    展开全文
  • pandas通常在读取excel数据之后,如果需要进行去重,有两种...(1)使用drop_duplicates(subset=None, keep=‘first’, inplace=False)删除重复项 参数解释: Parameters ---------- subset : column label or se...

    pandas通常在读取excel数据之后,如果需要进行去重,有两种方式,一种是进行标记,另一种是在pandas中直接去重
    如下图所示,excel数据:
    在这里插入图片描述
    (1)使用drop_duplicates(subset=None, keep=‘first’, inplace=False)删除重复项
    参数解释:
    Parameters
    ----------
    subset : column label or sequence of labels, optional
    Only consider certain columns for identifying duplicates, by
    default use all of the columns(指定列标记,默认当每一条行记录完全
    相同时,才会认定为重复行)
    keep : {‘first’, ‘last’, False}, default ‘first’
    - first : Drop duplicates except for the first occurrence.
    - last : Drop duplicates except for the last occurrence.
    - False : Drop all duplicates.
    (删除重复行时,保留first还是last还是全部删除)
    inplace : boolean, default False
    Whether to drop duplicates in place or to return a copy
    (直接替换还是保留副本)

    >>> import pandas as pd
    >>> df = pd.read_excel(r'C:\Users\liuchao\Desktop\Students.xlsx', 'Sheet1')
    >>> df
       ID         Name  Test_1  Test_2  Test_3
    0   0  Student_001      41      31      54
    1   1  Student_002      86      22      59
    2   2  Student_003      54      25      68
    3   3  Student_004      82      36      92
    4   4  Student_001      41      31      93
    # 如上图所示,df中其实是没有重复的,因此在做删除时,是不会删除任一行的
    >>> df.drop_duplicates()
       ID         Name  Test_1  Test_2  Test_3
    0   0  Student_001      41      31      54
    1   1  Student_002      86      22      59
    2   2  Student_003      54      25      68
    3   3  Student_004      82      36      92
    4   4  Student_001      41      31      93
    # 删除Name中的相同数据,并保留最后重复中的最后一行记录
    >>> df1 = df.drop_duplicates(['Name'], keep='last')
    >>> df1
       ID         Name  Test_1  Test_2  Test_3
    1   1  Student_002      86      22      59
    2   2  Student_003      54      25      68
    3   3  Student_004      82      36      92
    4   4  Student_001      41      31      93
    # 只有当Name, Test_1中两列重复时,才删除重复行
    >>> df2 = df.drop_duplicates(['Name', 'Test_1'], keep='first')
    >>> df2
       ID         Name  Test_1  Test_2  Test_3
    0   0  Student_001      41      31      54
    1   1  Student_002      86      22      59
    2   2  Student_003      54      25      68
    3   3  Student_004      82      36      92
    # 由于此时inreplace默认为false,因此df并不会发生变化
    >>> df
       ID         Name  Test_1  Test_2  Test_3
    0   0  Student_001      41      31      54
    1   1  Student_002      86      22      59
    2   2  Student_003      54      25      68
    3   3  Student_004      82      36      92
    4   4  Student_001      41      31      93
    
    

    (2)使用df.duplicated(subset=None, keep=‘first’)对重复行进行标记

    >>> df['res'] = df.duplicated(['Name'], keep='last')
    >>> df
       ID         Name  Test_1  Test_2  Test_3    res
    0   0  Student_001      41      31      54   True
    1   1  Student_002      86      22      59  False
    2   2  Student_003      54      25      68  False
    3   3  Student_004      82      36      92  False
    4   4  Student_001      41      31      93  False
    # 这样便对原数据进行了标记,可以将结果输入到excel中,做进一步处理
    >>> df.to_excel(r'C:\Users\liuchao\Desktop\Students.xlsx', 'Sheet2', index=None)
    
    

    在这里插入图片描述
    哈哈,以上就是对pandas如何处理重复数据的学习,如果您有兴趣,欢迎关注我的公众号:python小工具。一起让办公变得更方便吧
    在这里插入图片描述

    展开全文
  • 是这样,通常情况下标出重复项和去重复项这种比较简单的工作交给excel就可以了,但是excel有时候会出现无法处理的情况,比如说一串数字太长,会自动用科学计数法来表示,这个时候如果标出重复项就会出现乱标记的情况...

    是这样,通常情况下标出重复项和去重复项这种比较简单的工作交给excel就可以了,但是excel有时候会出现无法处理的情况,比如说一串数字太长,会自动用科学计数法来表示,这个时候如果标出重复项就会出现乱标记的情况,如果将多位的数字转换成字符串也会时好时坏,百度搜了许久,无果。

    我默默的问候了一下excel的开发者的母亲,然后决定自己搞一个,于是就又多了一个小工具:

    <!DOCTYPE html>
    <html>
    <head>
    	<title>标出重复项</title>
    	<meta charset="utf-8" />
    	<style type="text/css">
    		.shower{
    			width:400px;
    			height:400px;
    			margin:10px auto;
    			padding:0;
    			font-size:10px;
    			font-family:宋体;
    		}
    		button{
    			margin:10px;
    		}
    	</style>
    </head>
    <body style="width:100%;height:100%;margin:0;">
    <div style="line-height:50px;text-align:center;width:100%;height:50px;color:white;background-color:deepskyblue;font-weight:bold;">标出重复项</div>
    <table style="border-collapse:collapse;width:100%;height:100%;text-align:center;">
    	<tr>
    		<td colspan="2">请将excel内容复制粘贴到左边再点击相关功能</td>
    	</tr>
    	<tr>
    		<td><textarea id="in" class="shower"></textarea><br></td>
    		<td><div id="out" class="shower" contenteditable="true" style="overflow:auto;border:1px solid gray;background-color:#d7edf8"></div></td>
    	</tr>
    	<tr>
    		<td><button onclick="layout()">标出</button><button onclick="deleteduplicates()">去重</button></td>
    		<td><button onclick="copy()">复制结果到剪贴板</button></td>
    	</tr>
    	<tr>
    		<td colspan="2" id="say"></td>
    	</tr>
    </table>
    
    </body>
    <script type="text/javascript">
    
    
    function copy() {
        var div = id('out');
        if (document.body.createTextRange) {
            var range = document.body.createTextRange();
            range.moveToElementText(div);
            range.select();
        } else if (window.getSelection) {
            var selection = window.getSelection();
            var range = document.createRange();
            range.selectNodeContents(div);
            selection.removeAllRanges();
            selection.addRange(range);
            /*if(selection.setBaseAndExtent){
                selection.setBaseAndExtent(text, 0, text, 1);
            }*/
        } else {
            console.warn("none");
        }
        document.execCommand("Copy"); // 执行浏览器复制命令
        var d = new Date();
        id("say").innerHTML = d.getHours() + ':' + d.getMinutes() + ':' + d.getSeconds() + ' 已复制到剪贴板';
    }
    
    function id(x){
    	return document.getElementById(x);
    }
    
    var _2darr = [];
    var hash = {};
    
    function store(){
    	_2darr = [];
    	hash = {};
    	var invalue = '';
    	if(window.navigator.userAgent.indexOf("MSIE")>=1){
    		invalue = (id("in").value+'\r').split('\n');
    	}
    	else{
    		invalue = (id("in").value).split('\n');
    	}
    	for(var i=0;i<invalue.length;i++){
    		_2darr[i] = [];
    		var ti = invalue[i].split('\t');
    		for(var j=0;j<ti.length;j++){
    			_2darr[i].push(ti[j]);
    		}
    	}
    }
    
    function layout(){
    	store();
    	for(var i=0;i<_2darr.length;i++){
    		var mark = '';
    		for(var j=0;j<_2darr[i].length;j++){
    			mark += _2darr[i][j];
    		}
    		if(mark in hash){
    			hash[mark]+=1;
    		}
    		else{
    			hash[mark]=1;
    		}
    	}
    	var len = _2darr[0].length;
    
    	var tmp = '<table style="border-collapse:collapse;font-family:宋体;font-size:10px;">'
    	for(var i=0;i<_2darr.length;i++){
    		tmp += '<tr>';
    		var mark = '';
    		for(var k=0;k<_2darr[i].length;k++){
    			mark += _2darr[i][k];
    		}
    		for(var j=0;j<len;j++){
    			tmp += '<td style="height:12px;padding:0;border:1px solid;background-color:'+ (hash[mark]>1?'orange':'') +'"><span>'+ (_2darr[i][j]==undefined?'':_2darr[i][j]) +'</span></td>';
    		}
    		tmp += '</tr>';
    	}
    
    	tmp += '</table>';
    	id("out").innerHTML = tmp;
    	id("say").innerHTML = '总条目数:'+_2darr.length;
    }
    
    function deleteduplicates(){
    	store();
    	for(var i=0;i<_2darr.length;i++){
    		var mark = '';
    		for(var j=0;j<_2darr[i].length;j++){
    			mark += _2darr[i][j];
    		}
    		if(mark in hash){
    			hash[mark]+=1;
    		}
    		else{
    			hash[mark]=1;
    		}
    	}
    	
    	var len = _2darr[0].length;
    
    	var hash2 = {};
    	var tmp = '<table style="border-collapse:collapse;font-family:宋体;font-size:10px;">'
    	var sum = 0;
    	for(var i=0;i<_2darr.length;i++){
    		var mark = '';
    		for(var k=0;k<_2darr[i].length;k++){
    			mark += _2darr[i][k];
    		}
    		if(mark in hash2){
    			hash2[mark]+=1;
    		}
    		else{
    			hash2[mark]=1;
    		}
    		
    		if(hash2[mark]&&hash2[mark]==1){
    			sum+=1;
    			tmp += '<tr>'
    			for(var j=0;j<len;j++){		
    				tmp += '<td style="height:12px;padding:0;border:1px solid;"><span>'+ (_2darr[i][j]==undefined?'':_2darr[i][j]) +'</span></td>';
    			}
    			tmp += '</tr>';
    		}	
    	}
    
    	tmp += '</table>';
    	id("out").innerHTML = tmp;
    	id("say").innerHTML = '去重后总条目数:'+sum;
    }
    
    </script>
    </html>

    展开全文
  • 在数据清洗过程中使用excel重复数据进行处理 方法一: 开始 - 条件格式 - 突出显示单元格规则 - 重复值 注:此法可以用特殊颜色标记重复值或唯一值 方法二: 使用countif函数,进行两种重复标记 第一种:...
  • 需求是 找出两列数据(单列有重复)中的相互重复项----也就是说本身的列重复的数据不算,比如有AB两列,找出A与B的重复项,也就是B中包含了A的话就标记出来。我们在上一篇已经讲了 EXCEL----数据处理(一)----找出...
  • 简述 先说一下背景,之所以封装handsontable插件,是因为公司要实现在线编辑导入...2、每一列标记重复项,错误项 3、定位功能,当数据过多出现滚动条时,点击上一条/下一条按钮,定位到当前标记项。 4、表头标注...
  • 设备工程师最常见的一项工作就是备件清单梳理,每次当供应商提供一份元器件清单给我我们后,我们会先进行初步筛选...或者你把初版备件清单复制到库房台账的Excel里,标记重复项? 当然,这是其中的两种方法,可是你有没
  • EXCEL函数公式集

    热门讨论 2010-03-16 03:26:38
    在几百几千个数据中发现重复项 统计互不相同的数据个数 多个工作表的单元格合并计算 单个单元格中字符统计 数据区包含某一字符的项的总和,该用什么公式 函数如何实现分组编码 【数值取整及进位】 取整数函数 数值...
  • excle操作是我们每个人的必备的技能,今天小编就给大家介绍几个办公懒人必备的几个excel技巧,... 有时处理数据是难免会有出错的地方,标记重复项就可以帮助我们快速快速核对数据    三、快速隐藏行列   ...
  • excel的使用

    2012-11-25 17:06:01
    如果用得到,你还可以利用EXCEL来完成行列式、矩阵的各种计算,进行简单的积分运算,利用迭代求函数值(如x^2=x^7+4,可用迭代方法求x值),等等,凡是涉及计算方面的事,找EXCEL来帮忙,它一定会给你一个满意的答案...
  • Excel新增工具集

    2011-12-20 09:30:27
    删除与标注重复行、特殊数据行操作代码用字典法编写,比Excel公式与高级筛选提速几十倍。 1、重名查找与姓名美化:本软件不仅能查找同字重名,还能查找同音重名。执行此命令能够为某一列的重复数据(包含汉字同音)...
  • EXCEL集成工具箱V6.0

    2010-09-11 01:44:37
    清单的最后6也为子程序功能,能完成相关操作。且支持重新加载数据及重设定生效存储格范围。 财 务 工 具 【自动填充】 不同于EXCEL的CTRL+D功能,能对选中的某列数据不同存储格区域的空白处,取相邻的上一不为空...
  • 在几百几千个数据中发现重复项 统计互不相同的数据个数 多个工作表的单元格合并计算 单个单元格中字符统计 数据区包含某一字符的项的总和,该用什么公式 函数如何实现分组编码 【数值取整及进位】 取整数函数 数值...
  • 技巧65 利用动态名称创建不含重复项的下拉列表 第7章 导入外部数据 技巧66 导入文本数据 技巧67 导入Access数据库数据 技巧68 导入Internet网页数据 技巧69 根据网页内容更新工作表数据 技巧70 导入...
  • 11.4.3 使用“基本循环”布局显示重复的过程 269 11.4.4 使用“分离射线”图示显示公司与外部实体的关系 270 11.4.5 使用“表格列表”图示显示公司的部门 270 11.4.6 调整维恩图来显示关系 271 11.4.7 理解...
  • 11.4.3 使用“基本循环”布局显示重复的过程 269 11.4.4 使用“分离射线”图示显示公司与外部实体的关系 270 11.4.5 使用“表格列表”图示显示公司的部门 270 11.4.6 调整维恩图来显示关系 271 11.4.7 理解...
  • 11.4.3 使用“基本循环”布局显示重复的过程 269 11.4.4 使用“分离射线”图示显示公司与外部实体的关系 270 11.4.5 使用“表格列表”图示显示公司的部门 270 11.4.6 调整维恩图来显示关系 271 11.4.7 理解...
  • 11.4.3 使用“基本循环”布局显示重复的过程 269 11.4.4 使用“分离射线”图示显示公司与外部实体的关系 270 11.4.5 使用“表格列表”图示显示公司的部门 270 11.4.6 调整维恩图来显示关系 271 11.4.7 理解...
  • 11.4.3 使用“基本循环”布局显示重复的过程 269 11.4.4 使用“分离射线”图示显示公司与外部实体的关系 270 11.4.5 使用“表格列表”图示显示公司的部门 270 11.4.6 调整维恩图来显示关系 271 11.4.7 理解...
  • 11.4.3 使用“基本循环”布局显示重复的过程 269 11.4.4 使用“分离射线”图示显示公司与外部实体的关系 270 11.4.5 使用“表格列表”图示显示公司的部门 270 11.4.6 调整维恩图来显示关系 271 11.4.7 理解...
  • 11.4.3 使用“基本循环”布局显示重复的过程 269 11.4.4 使用“分离射线”图示显示公司与外部实体的关系 270 11.4.5 使用“表格列表”图示显示公司的部门 270 11.4.6 调整维恩图来显示关系 271 11.4.7 理解...
  • 11.4.3 使用“基本循环”布局显示重复的过程 269 11.4.4 使用“分离射线”图示显示公司与外部实体的关系 270 11.4.5 使用“表格列表”图示显示公司的部门 270 11.4.6 调整维恩图来显示关系 271 11.4.7 理解...
  • 中文版Excel.2007高级VBA编程宝典 1/2

    热门讨论 2012-04-06 16:00:16
     2.3.5 智能标记  2.3.6 任务窗格  2.4 自定义屏幕显示  2.5 数据录入  2.6 公式、函数和名称  2.7 选择对象  2.8 格式  2.8.1 数字格式  2.8.2 样式格式  2.9 保护选项  2.9.1 保护公式以防被重写  ...
  • 中文版Excel.2007高级VBA编程宝典 2/2

    热门讨论 2012-04-06 16:41:38
     2.3.5 智能标记  2.3.6 任务窗格  2.4 自定义屏幕显示  2.5 数据录入  2.6 公式、函数和名称  2.7 选择对象  2.8 格式  2.8.1 数字格式  2.8.2 样式格式  2.9 保护选项  2.9.1 保护公式以防被重写  ...
  • 清单的最后6也为子程序功能,能完成相关操作。且支持重新加载数据及重设定生效存储格范围。 财 务 工 具 【自动填充】 不同于EXCEL的CTRL+D功能,能对选中的某列数据不同存储格区域的空白处,取相邻的上一不为空...
  • │ │ 技巧97 标记重复值.xls │ │ 技巧98 标记含有公式的单元格.xls │ │ 技巧99 标记匹配目标数值的单元格.xls │ │ │ └─第9章-数据有效性绝技 │ 技巧102 在单元格中创建下拉列表.xls │ 技巧103 ...
  • 清单的最后6也为子程序功能,能完成相关操作。且支持重新加载数据及重设定生效存储格范围。 财 务 工 具 【自动填充】 不同于EXCEL的CTRL+D功能,能对选中的某列数据不同存储格区域的空白处,取相邻的上一不为空...
  • 清单的最后6也为子程序功能,能完成相关操作。且支持重新加载数据及重设定生效存储格范围。 财 务 工 具 【自动填充】 不同于EXCEL的CTRL+D功能,能对选中的某列数据不同存储格区域的空白处,取相邻的上一不为空...

空空如也

空空如也

1 2 3 4 5 6
收藏数 105
精华内容 42
关键字:

excel标记重复项