• excel重复数据编号 计算Excel中的重复编号集 (Count Duplicate Number Sets in Excel) Recently, someone asked me how to count duplicate number sets. There were hundreds of rows, with 6 numbers in each row....

excel重复数据编号

Recently, someone asked me how to count duplicate number sets. There were hundreds of rows, with 6 numbers in each row. Did any of the number sets appear in the list more than once? How would you solve this problem, and count duplicate number sets?
最近，有人问我如何计算重复的数字集。 有数百行，每行有6个数字。 是否有任何数字集多次出现在列表中？ 您将如何解决此问题，并计算重复的数字集？
计算重复编号集 (Count Duplicate Number Sets)
To find a solution, I set up a small table with random numbers. There are 11 rows of numbers, and 6 columns.  The 7th column, Dups, is where I tested my formulas.
为了找到解决方案，我建立了一个带有随机数的小表。 有11行数字和6列。 我在第七列Dups中测试了公式。

有多少个匹配项？ (How Many Matches?)
In each row, the goal is to find out how many times that set of 6 numbers appeared in the table.
在每一行中，目标是找出表中这组6个数字出现了多少次。
It doesn't matter if the numbers are in a different order. For example -- 1,2,3,4,5,6 is be a duplicate of 3,4,5,1,2,3 -- all 6 numbers are the same.
数字是否以不同顺序无关紧要。 例如-1,2,3,4,5,6是3,4,5,1,2,3的重复-所有6个数字都是相同的。
How would you calculate the number of matches?
您将如何计算比赛次数？
获取样本数据 (Get the Sample Data)
There are solutions below, but before you look at them, try to find your own solution.
下面有解决方案，但是在查看它们之前，请尝试找到自己的解决方案。
Download the sample file (#4) from the Excel Count Functions page on my Contextures site.
从Contextures网站上的Excel Count Functions页面下载示例文件(＃4)。
The sample data is in a table on the Challenge sheet.
示例数据在“挑战”表上的表格中。
解决方案1：很复杂 (Solution 1: It's Complicated)
I'll confess to doing a Google search when this question arrived in my email. There were suggestions for macros and User-Defined Functions, but I didn't try those.
Finally, I found an array-entered formula on StackOverflow, which pointed me in the right direction. Here's the formula, which was for a list with 4 columns and 1000 rows:
最后，我在StackOverflow上找到了一个输入数组的公式 ，该公式为我指明了正确的方向。 以下是公式，该公式适用于具有4列1000行的列表：
=IF(SUM(IF(MMULT({1,1,1,1}, TRANSPOSE(COUNTIF($A1:$D1, $A$1:$D$1000)))=4,1))>1, "duplicate", "unique")
= IF(SUM(IF(MMULT({1,1,1,1}，TRANSPOSE(COUNTIF($A1：$ D1，$A$ 1：$D$ 1000)))= 4,1))> 1，“重复“， “独特”)
That certainly looked complicated!
那看起来确实很复杂！
I needed to adjust the formula, so it would work with 6 columns, instead of 4.
我需要调整公式，因此它将适用于6列而不是4列。
MMULT({1,1,1,1,1,1} MMULT({1,1,1,1,1,1} COUNTIF(B2:G2 COUNTIF(B2：G2
My list has 11 rows, instead of 1000. (My data is in a named Excel table, so the range will adjust automatically if the table size changes.)
我的列表有11行，而不是1000行。(我的数据在一个命名的Excel表中，因此如果表大小更改，范围将自动调整。)
$B$2:$G$12 $B$ 2：$G$ 12
And I wanted the number of duplicates, not text, so the first IF was removed. Here's my revised formula (array entered, with Ctrl+Shift+Enter):
我想要重复的数量，而不是文本，因此删除了第一个IF。 这是我修改过的公式(使用Ctrl + Shift + Enter输入数组)：
=SUM(IF(MMULT({1,1,1,1,1,1},TRANSPOSE(COUNTIF(B2:G2,$B$2:$G$12)))=6,1))
= SUM(IF(MMULT({1,1,1,1,1,1}，TRANSPOSE(COUNTIF(B2：G2，$B$ 2：$G$ 12)))= 6,1)))
这个怎么运作 (How It Works)
Here's a brief explanation of how the works. There are more notes in the sample file, on the Solution01 sheet.
这是工作原理的简要说明。 示例文件的Solution01工作表中还有更多说明。
COUNTIF checks each table row, to see if each number has a match in the formula's row. The result is an array with 11 rows and 6 columns COUNTIF检查每个表行，以查看每个数字在公式行中是否匹配。 结果是一个包含11行 6列的数组
Array1 is {1,1,1,1,1,1} Array1为{1,1,1,1,1,1} For Array2, TRANSPOSE switches the rows and columns in the COUNTIF array, to create an array with 6 rows and 11 columns. 对于Array2， TRANSPOSE切换COUNTIF数组中的行和列，以创建具有6行11列的数组。 MMULT will return an array with the number of matches in each row. We need that array to have 1 row, and 11 columns (1 column for each set of numbers)  MMULT将返回一个数组，其中包含每行中匹配的数目。 我们需要该数组具有1行和11列 (每组数字1列)  IF returns a 1, if the number of matches is 6 (all others = FALSE) 如果匹配数为6，则IF返回1(所有其他值均为FALSE) SUM adds up all the 1s to give the number of duplicate sets SUM将所有1加起来，得出重复集的数量
工作表结果 (Worksheet Results)
The screen shot below shows what the COUNTIF calculations would look like for Row 4, with the rows and columns transposed.
下面的屏幕快照显示了第4行的COUNTIF计算结果，行和列进行了转置。
The MMULT result is 1 row, with 11 columns, and the final SUM is 2, because rows 4 and 6 have the same set of numbers.
MMULT结果为1行，包含11列，最终的SUM为2，因为第4行和第6行具有相同的数字集。

计算缓慢 (Slow Calculations)
This formula isn't too bad in a small set of numbers, but could take a long time in a larger dataset.
这个公式在少量数字中并不太坏，但是在较大的数据集中可能需要很长时间。
In the sample file, there's a sheet named LargeSet, which has 1500 number sets, if you want to test that.
在示例文件中，有一个名为LargeSet的工作表，如果要测试的话，它具有1500个数字集。
解决方案2：电源查询 (Solution 2: Power Query)
The second solution in the sample file is from Jonathan Cooper, who used Power Query (Get & Transform).
样本文件中的第二个解决方案来自Jonathan Cooper，他使用了Power Query(Get＆Transform)。

Full List has all the rows, an index column, and a column with sorted numbers “完整列表”具有所有行，一个索引列和一个具有排序编号的列 Unique List only has the Index column and sorted numbers, with duplicates removed 唯一列表仅具有“索引”列和排序编号，已删除重复项 Merge List combines the Full and Unique lists, and calculates the count for each unique number set 合并列表合并完整列表和唯一列表，并计算每个唯一编号集的计数
解决方案3：小和TEXTJOIN (Solution 3: SMALL and TEXTJOIN)
Jonathan's solution had a comma-separated list of sorted numbers in one step. That led me to a different Excel formula solution, using the SMALL and TEXTJOIN functions.
乔纳森(Jonathan)的解决方案只需一步就可以用逗号分隔列表。 这导致我使用SMALL和TEXTJOIN函数找到了一个不同的Excel公式解决方案。

To show how it works, the SMALL results are done in 6 separate columns. Here's the formula in cell I4:
为了显示其工作原理，将在6个单独的列中完成小结果。 这是单元格I4中的公式：
=SMALL($B4:$G4,I$3) =小($ B4：$G4，I$ 3)
TEXTJOIN combines the results. Here's the formula in cell O4:
TEXTJOIN合并结果。 这是单元格O4中的公式：
=TEXTJOIN("|",,I4:N4)
= TEXTJOIN(“ |” ,, I4：N4)
And COUNTIF returns the number of instances of the comma-separated list from column O:
COUNTIF返回O列中逗号分隔列表的实例数：
=COUNTIF([Sorted],[@Sorted])
= COUNTIF([已排序]，[@已排序])
多合一排序列表 (All-In-One Sorted List)
Instead of using helper columns for the SMALL function, you can use an array-entered formula to get the same results.
您可以使用输入数组的公式来获取相同的结果，而不是将辅助列用于SMALL函数。
Put this formula in cell O4 (array-entered):
将此公式放在单元格O4中(输入数组)：
=TEXTJOIN("|",, SMALL(B4:G4, ROW($1:$6)))
= TEXTJOIN(“ |” ,, SMALL(B4：G4，ROW($1：$ 6)))
Then, delete the columns with the SMALL formulas.
然后，删除带有SMALL公式的列。
计算重复编号集样本文件 (Count Duplicate Number Sets Sample File)
To find your own solution, and to see the other solutions, download the sample file (#4) from the Excel Count Functions page on my Contextures site.
要找到自己的解决方案，并查看其他解决方案，请从我的Contextures网站上的Excel Count Functions页面下载示例文件(＃4)。
The sample data is in a table on the Challenge sheet, and there is a larger dataset on the sheet name LargeSet.
样本数据位于“挑战”表上的表格中，并且表名称“ LargeSet”上有一个较大的数据集。
NOTE: The workbook does not contain macros, but you will see an alert about a data connection, because of the Power Query solution.
注意 ：该工作簿不包含宏，但是由于Power Query解决方案，您将看到有关数据连接的警报。

翻译自: https://contexturesblog.com/archives/2019/12/05/count-duplicate-number-sets/

excel重复数据编号

展开全文
• 要求就是1到100然后再1到100 一直重复下去。 一：以M列为示范，在M1中输入公式：=IF(MOD(ROW(),100)=0,100,MOD(ROW(),100)) 二：在左边选择数据范围M1:M500，蓝色区域代表已经选择这M列500行了 三：按住CTRL键不...
要求就是1到100然后再1到100 一直重复下去。
一：以M列为示范，在M1中输入公式：=IF(MOD(ROW(),100)=0,100,MOD(ROW(),100))
二：在左边选择数据范围M1:M500，蓝色区域代表已经选择这M列500行了
三：按住CTRL键不放,再按下ENTER键回车，鼠标移到上方公式处。

展开全文
• 当我们录入或者处理大量数据时，难免会...可以看到重复项都被标注成了红色，接下来就可以处理这些重复数据。利用数据透视表找出重复项打开数据表，选中所有数据，在“插入”菜单中找到“数据透视表”，点击即可建...

当我们录入或者处理大量数据时，难免会遇到一些数据重复的问题，下面就教大家几种方法如何快速地找出数据中的重复项。
条件格式
重复项填色工具
打开数据表，选中需要进行筛选的目标数据列，在开始菜单栏中找到“条件格式 → 突出显示单元格规则 → 重复项”。

可以看到重复项都被标注成了红色，接下来就可以处理这些重复数据。
利用数据透视表找出重复项
打开数据表，选中所有数据，在“插入”菜单中找到“数据透视表”，点击即可建立数据透视。

需要添加数据透视表中行列的数值，这里我们将“分类名称”选中拖至行中，将“分类编号”拖至值中，并将“分类编号”的值字段设置调整为“计数”

在生成的数据透视表中，我们对第2列数据做降序筛选，就能清晰地看到有重复项的数据了。
高级筛选
Excel自带的高级筛选功能，可以快速将数据列中的重复数据删除，并筛选保留不重复的数据项，十分的便利实用。
步骤：选中需要进行筛选的目标数据列，点击【数据】菜单栏，点击【高级筛选】，选中【在原有区域显示筛选结果】，勾选【选择不重复的记录】，单击【确定】即可。

重复数据筛选就这么简单，可以根据数据的特性，及纠错的需求，选择合适的方法处理重复项。
大家还有更好的筛选方法的话也欢迎评论区告诉我!

展开全文
• Excel重复记录自动加编号.rar,在一些情况下，用户希望将重复记录按出现的先后顺序进行编号以作区别，不重复记录则保持不变。本例B2单元格输入介绍的公式，可以为重复记录加上数字编号
• DataTable dataTable = ExcelHelper.ExcelImport(filePath); RemoveEmpty(dataTable);//去除空格 //部门 DataT...

DataTable dataTable = ExcelHelper.ExcelImport(filePath);

RemoveEmpty(dataTable);//去除空格
//部门
DataTable DepartTable = userBLL.GetDataTable();
//公司
DataTable OrganizeTable = userBLL.GetOrganizeTable();
//DataTable distinctTable = null;

DataView view = new DataView(dataTable);
DataTable data = view.ToTable(true, new string[] { "账户", "姓名", "性别", "公司", "部门", "手机", "电话", "出生日期", "邮箱", "身份证号", "地址", "警号", "人员类型名称" });
//if (dataTable!=null&&dataTable.Rows.Count>0)
//{
//    string[] columnNames = GetTableColumnName(dataTable);
//    DataView dataView = new DataView(dataTable);
//    distinctTable = dataView.ToTable(true, columnNames);
//}
//return distinctTable;
//DataTable newTable= dataView.ToTable("姓名",)

//Excel不存在该列 添加列
//dataTable.Columns.Add("人员类型");

展开全文
• 1.共享数据，减少数据查询 业务需求： 导入房屋信息，房屋信息包括项目编号，楼栋编号，楼层号，房屋号 如果系统中已存在深圳大区，金色家园，1栋，102房屋，Excel中刚好有深圳大区，金色家园，1栋102房屋这条...
• frame = pd.DataFrame(pd.read_excel("F:/test/筛选不重复数据表.xlsx", "Sheet1")) print(frame) frame.drop_duplicates(subset=['编号'],keep='first',inplace=True) #drop_duplicates用法：subset=['A','B'] ...
• 在文档中出现上万条数据或者以上数据时，通过人的肉眼去查找出现重复数据时很困难的，因此我做了一个简单的工具，方便便于出现重复数据，有需要的人可以看看。
• //新建DataTable 储存 从excel中获取的e_id DataTable E_eid = new DataTable(); E_eid.Columns.Add("eid"); //循环E_ID添加进E_eid for (int t = 0; t < dtData.Rows.Count; t++) { DataRow dr = E_...
• 有两个 表格 sheet1 和 sheet2 ，AB 两列 ，sku和仓库 两个条件确定一条记录，现在是 sheet1 的数据比sheet2 数据多 ，如何查找出 存在与 sheet1 中，但是不在 sheet2 的数据 ？   附公式： Sub 数据...
• ## <Excel> 数据分析excel常用函数

万次阅读 多人点赞 2018-10-23 17:12:42
本文整理了用excel数据分析时的几种常用函数： 简单函数（包含加总、计数、平均、最值、排序、乘积、除余、取整） 逻辑函数（包含if、iferror、and、or) 文本函数（包含文本提取、文本查找、文本替换、文本转换及...
• 一、数据处理的内容 数据处理的内容主要有以下两项： ...1.重复数据的处理 第一步，找出重复数据。 方法1：函数法 COUNTIF(range,criteria)，对区域中满足单个指定条件的单元格进行计数。 range...
• 在日常工作学习中我们可能遇到下图这种情况，即在Excel工作表中对某列不连续的单元格数据进行连续编号，在下图中只有第三列的单元格数据是连续的，第二类数据不连续，我们希望针对第二列数据对结构体进行编号，常规...
• 重复值查看，去重方法 函数法： COUNTIF() http://wenku.cyjzzd.com/a/1300006612##wk-more 高级筛选法： ...把编号拖入行和值，就是按编号进行分组，分类，保留唯一的编号 ...重复数据删除： ...
• 一、该工具类主要完成的功能是：读取Excel、汇总Excel的功能。在读取时，可以设定开始和结束读取的位置、设定是否读取多个sheet、设定读取那个或者那些sheet等。在汇总时，如设定是否覆盖目标文件、设定是否比较检查...
• （2）选择“将筛选结果复制到其他位置”选项，在“列表区域”文本框中选择要筛选的单元格区域，在“复制到”文本框中选择一个单元区域，再勾选“选择不重复的记录”复选框，单击“确定”按钮，筛选效果如图。...
• ## excel数据处理

千次阅读 多人点赞 2019-01-12 21:08:25
excel大部分常用操作
• WHERE 编号> 50 " Set mySht = Worksheets( " F_Data01 " ) With myRst .Index = " PrimaryKey " '设置查找是以主键开始查找 myRst.Open Source: =myTblName, ActiveConnection:= myCon, _ ...
• 前段时间到一家制造型企业培训Excel，下课休息的时候，学员小Z向我咨询实际工作中的一个问题，以下是小Z的问题：表格有8000行数据（即8000个项目），其中一列的字段为合同编号，表格中部分项目有填写合同编号，部分...
• 其中A代表列的编号，2代表这个列的第几个单元格 上面的重复二字表示如果两个列出现重复了，第二个重复出现的地方，比如在B列就会显示重复二字 [b]第一步：[/b] 打开excle,把数据拷贝到某一个列中，如下图拷贝到...
• excel删除重复的行When you are working with spreadsheets in Microsoft Excel and accidentally copy rows, or if you are making a composite spreadsheet of several others, you will encounter duplicate rows...
• 两个Excel表格应该比较，公式不会被设置，而vba是一本天书。有简单的方法吗？有！有！有！！！Excel有一个不是所有人都常用的功能：合并计算。使用它，我们可以快速比较两个表之间的差异。示例：有两个表要进行比较...
• #处理重复数据： ##识别重复行的方法： COUNTIF()函数 COUNTIF函数用于统计满足某个条件的单元格的数量 COUNTIF函数语法：=COUNTIF(查找区域，查找条件/要统计的内容) IF()函数 IF(条件, 当判断为真的返回值...
• 为订阅者分配“订阅者编号”和“订阅范围” 回到服务器B，查看分配的“订阅者编号”、数据存储服务器信息、订阅范围 4、 如果有多个订阅者，与设置服务器B的操作类似，重复即可。详细说明1、 设置订阅范围 小结： ...
• 数据清洗技术——Excel数据清洗一、实验目的和要求二、实验环境三、实验内容和实验步骤 一、实验目的和要求 1、了解 Excel 的基本功能和用途 2、掌握 Excel 数据清洗的基本步骤 3、了解 Excel 数据清洗的方法 4、...
• Q：数据已经按顺序排好了，有一列订单号数据重复的，计算该订单号是第几次出现。=countif($a$1:a1,a1)然后下拉填充数据即可，但是在Excel中这样做的话计算量非常大，因为这个任务是每个月算一次，每月大概15W条...
• ## 利用Python处理Excel数据

万次阅读 多人点赞 2017-10-29 20:25:50
目录 读取数据 显示数据 ...删除重复值 对列表内的值进行替换 数据预处理 对数据进行排序 数据分组 数据分列 数据提取 按标签提取 按位置提取 按标签和位置提取 按条件提取 从合并的数值中提取出指
• Excel 导入：步骤：下载一个.xls的模板，下载后用户可以在模板上填写要导入的数据。填写完以后，用户通过上传填好的模板，向数据库导入数据。 一、下载 .xls模板 通过window.open() 方法，在新的窗口打开下载路径。...

...