精华内容
下载资源
问答
  • excel 去重复值

    2019-12-20 09:41:43
    有些Excel表格使用时间长了,就出现了一些重复项,有整行内容重复的,也有部分内容重复的,就像下图左边的表格,有三个“张三”和两个“王五”,怎样变成右边那个没有重复项的表格呢?如果只有一部分列的内容重复,...

    https://baijiahao.baidu.com/s?id=1591181761241938555&wfr=spider&for=pc

    有些Excel表格使用时间长了,就出现了一些重复项,有整行内容重复的,也有部分内容重复的,就像下图左边的表格,有三个“张三”和两个“王五”,怎样变成右边那个没有重复项的表格呢?如果只有一部分列的内容重复,其他列的内容不重复的又怎么处理呢?怎样统计每个不重复项的个数呢?
    图1-1
    使用“删除重复项”功能
    首先选中所有数据,接着点击“数据”菜单——“删除重复值”——“确定”,这时Excel会告知你原始表中有几个重复值,几个唯一值,所有的重复项都会被删除掉。
    图1-2
    图1-3
    使用高级筛选功能
    首先还是选中所有数据,点击“数据”菜单——“高级”——选中“选择不重复的记录”——“确定”。这个窗口中提供了两种方式去显示筛选后的数据,第一种会在原有区域显示筛选结果,第二种,需要先用鼠标点击“复制到”,接着点击一个空白单元格,确定之后就会以该单元格为第一个单元格,显示所有唯一值,也就会看到文章开头的表格啦。
    图1-4
    提取了唯一值之后
    上述两种方法都可以用来删除重复项,根据需要选取,如果提取了唯一值后,不需要任何操作,按就适合选择第一种方法,方便、快捷;如果提取了唯一值之后,还要计算这些唯一值出现的次数,那就适合第二种方法。如图,输入公式“=COUNTIF($A2:2:A$10,E2)”,然后向下填充复制公式,即可计算出每个不重复数据出现的次数(不了解COUNTIF公式用法的,请点击Excel中按条件统计之COUNTIF和SUMIF公式这篇文章)。
    图1-5
    只有一部分数据重复怎么办
    用上面的两个方法,如果操作前你选中的是很多列的数据,那只有一整行数据都相同的才能称之为重复项,只有这样的行才会被删除掉。如果只有一列或几列内容相同,其他列不相同或空白,那怎么办呢?
    首先建议先用上面的两种方法删除掉一些重复项;接着选中一个关键列(例如姓名),点击“开始”菜单——“条件格式”——“突出显示单元格规则”——“重复值”,给这一列中重复值用颜色标记出来;再选中数据,给它按照颜色和数值排序,将有颜色的放在前面;最后,由于排过序,表格有规律,就可以逐行查看,如果不需要就删除它,否则就保留。
    图1-6
    上一篇:Excel中如何快速隐藏一定条件的单元格
    来源:“解晴新生”,点击文章开头的“解晴新生”或“关注”可以查看更多相关文章哦。方便的话,请点赞支持下,谢谢!

    展开全文
  • 以ASIN为例,假设有3000行数据,且其中有些ASIN重复的,现在需要将重复的ASIN去除并保留一个即可。 使用下面方法即可去重: import pandas as pd df = pd.read_excel('666.xlsx') df.drop_duplicates(subset=...

    废话不多说,直接进入正题。

    比方说,现在有一份数据表,如下图:
    在这里插入图片描述
    以ASIN为例,假设有3000行数据,且其中有些ASIN值有重复的,现在需要将重复的ASIN值去除并保留一个即可。

    使用下面方法即可去重:

    import pandas as pd
    df = pd.read_excel('666.xlsx')
    df.drop_duplicates(subset=['ASIN'], keep='first',inplace=True)
    df
    

    显示的结果就可以将那些重复的ASIN信息去除,最后保留下一个不重复的ASIN值。

    需要注意的是
    df.drop_duplicates(subset=[‘ASIN’],keep=‘first’,inplace=True)这个是最关键的。
    首先subset参数是一个列表,这个列表是需要你填进行相同数据判断的条件。就比如我选的条件是ASIN(你也可以选择多个列,比如说‘价格和ASIN’,就写成subset=[‘价格’,‘ASIN’]),即‘价格’值和‘ASIN’值相同就可被判定为一样的数据。
    keep的取值有三个分别是 first、last、false
    keep=first时,保留相同数据的第一条;
    keep=last时,保存相同数据的最后一条;
    keep=false时,所有相同的数据都不保留。
    inplace=True时,会对原数据进行修改,就是将重复的数据去除之后保留一份新的数据。否则,只返回视图,不对原数据修改。

    如果本文对你有用,记得关注小编并点赞哦,也可私信我。

    展开全文
  • EXCEL数据文件中,如果按某几个列比较,都相等的几行称为重复行,那么怎么删除多余的重复行,只留下一行? 如果数据少,只有几十行数据,那么手工删除也是可以的。而如果数据量很大,手工处理就会是很麻烦的...

    在EXCEL数据文件中,如果按某几个列值比较,值都相等的几行称为重复行,那么怎么删除多余的重复行,只留下一行?

    如果数据少,只有几十行数据,那么手工删除也是可以的。而如果数据量很大,手工处理就会是很麻烦的事了,用 Excel 自带的 VBA 来处理也会经常卡死。

    自己编写程序来实现?也是可行的,不过首先要读取EXCEL文件内容读成数据集对象,再用两重循环逐行比较是否是重复行,删除重复行后再输出为新的EXCEL文件,编写代码的工作量可不少。而且因为EXCEL文件的格式不相同,要比较的字段不同,编写的程序并不能通用,下次还需重新编写程序。

    如果使用集算器SPL来去除重复行,那就很简单了,只需要3行代码。

    例如下面这个EXCEL文件:

    ..

    如果按Col1、Col2、Col3来去除重复行,编写SPL脚本如下:

      A
    1 =file("test.xlsx").xlsimport@t()
    2 =A1.group@1(Col1,Col2,Col3)
    3 =file("test1.xlsx").xlsexport@t(A2)

     

    SPL还可以很方便地处理以下EXCEL需求:

    1、  读取自由格式、交叉表、主子表等格式的EXCEL文件

    2、  将数据导出、追加到EXCEL文件,输出预设精美格式的EXCEL文件

    3、  读写超大数据量的EXCEL文件

    4、  合并及拆分EXCEL文件

    请参阅 SPL 解析及导出 Excel

    SPL 读入 EXCEL 文件后,就可以很容易地做排序、分组、汇总等操作,请参阅 SPL 分组

    集算器是进行文件数据源处理的专业工具,可以方便地进行 TXT、Excel、Xml、Json、CSV、ini 等各种文件数据的混合计算、入库以及导出等工作。桌面级计算工具,即装即用,配置简单,调试功能完善,可设置断点、单步执行,每步执行结果都可查看。语法简单,符合人的自然思维,比其他高级开发语言更简单。请参阅文件处理的应用场景

    SPL也能很方便地嵌入到JAVA应用,可参考Java 如何调用 SPL 脚本

    具体使用方法可参考 如何使用集算器

    展开全文
  • EXCEL函数公式集

    热门讨论 2010-03-16 03:26:38
    如何实现快速定位(筛选出不重复值) 如何请在N列中列出A1:L9中每列都存在的数值 自动为性别编号的问题 【文本与页面设置】 EXCEL中如何删除*号 将字符串中的星号“*”替换为其它字符 空格函数如何去掉字符和单元...
  • 第2节:excel单元格任意区域禁止输入重复值设置技巧 l? 第3节: 一键快速删除工作表重复数据 l? 第4节:追踪所引用的单元格,查找数据来源 l? 第5节: 自动查找工作表中的错误数据 l? 第6节:快速在单元格中创建下拉...
  • excel的使用

    2012-11-25 17:06:01
    存放数据格式为“x,y”的形式,首先在Excel中输入坐标值,将x坐标放入A列,y坐标放入到B列,然后利用“&”将A列和B列合并成C列,在C1中输入:=A1&","&B1;,此时C1中的数据形式就符合要求了,再用鼠标向下拖动...
  • 如何实现快速定位(筛选出不重复值) 如何请在N列中列出A1:L9中每列都存在的数值 自动为性别编号的问题 【文本与页面设置】 EXCEL中如何删除*号 将字符串中的星号“*”替换为其它字符 空格函数如何去掉字符和单元...
  • 这是一个关于.xlsx文件或者是.csv文件处理后,去掉索引,保存成.txt文件的方法。 我是做了一个留言文本处理,数据量500条,我是提取了“留言主题”这一列内容,下面先来看一下我们处理后的文件是...#去除重复值 com...

    这是一个关于.xlsx文件或者是.csv文件处理后,去掉索引,保存成.txt文件的方法。
    我是做了一个留言文本处理,数据量500条,我是提取了“留言主题”这一列内容,下面先来看一下我们处理后的文件是怎么样的:

    data = pd.read_excel('附件2.xlsx')		#读取文件
    comment_data = data.loc[:,['留言主题']]	#只提取评论数据
    #去除重复值
    comment_data = comment_data.drop_duplicates()
    #短句删除
    comments = comment_data.iloc[:,0]
    

    看一下comments数据是如何:
    在这里插入图片描述
    大家可以看,这边提取出来的这列,它是旁边有一个索引部分的,好,我们需要的内容找到了,现在保存为txt文件,执行一下以下代码看看结果如何:

    f = open("text.txt",'wb')	#打开一个txt文件,如果没有,会自动创建
    f.write(comments)			#保存内容
    f.close()
    

    在这里插入图片描述
    看到,我们保存内容的时候,就报错了,显示的是:需要一个类似于bytes的对象,而不是’Series’。
    现在我们尝试转换为bytes:

    strll = bytes(comments, encoding = "utf8") 
    

    在这里插入图片描述
    可以看见,不能直接转换。
    那么我们换一种方法,办法总比问题多嘛,我们先来看看comments是什么类型:
    在这里插入图片描述
    可以看见,这不是一个字符串类型,那么我们先把它转成字符串类型:

    list1 = comments.astype(str).tolist()
    strl = ' \n'.join(list1)	
    strl
    #因为每一行都要换行符,所以需要\n
    #如果没有\n,就会变成一片文章,长篇大论的,大家可以尝试一下看看结果
    

    在这里插入图片描述
    可以看见,我们把这个索引去掉了,接下来就是最后一步了,把str转换为bytes:

    strll = bytes(comments, encoding = "utf8") 
    

    就这样就搞定了,ok,我们再来保存一下文件:

    f = open("text.txt",'wb')
    f.write(strll)
    f.close()
    

    看看.txt文件在这里插入图片描述
    就顺利保存.txt文件。

    在写代码过程中呢,通常会遇到很问题,但是,能解决的问题都不是问题,写这篇博客目的:一方面是巩固记忆一些问题,一方面是给各位博友一个方便。

    展开全文
  • MAPGIS地质制图工具

    2013-05-06 16:15:30
    2、 执行菜单“1辅助工具\导入导出功能\MapGis<-> Excel\MapGis-> Excel”,然后鼠标框选输出数据区域即可,自动打开Excel并且点数据输出到Excel,线数据表现在单元格的合并上; 3、 执行菜单“1辅助工具\导入导出...
  • 更新说明:修改了student和class的Controller中重复出现级别列表添加的代码,放置到前置初始化操作调用中 更新说明:1.更新了管理员的信息修改功能,可以修改登录用户名,用户角色,用户密码,刚刚发现修改了好多遍...
  • 2019数据运营思维导图

    2019-03-29 21:34:09
    数据运营 作用&意义 知错能改,善莫大焉 —错在哪里,数据分析告诉你 运筹帷幄,决胜千里 —怎么做好“运筹”,数据分析告诉你 以往鉴来,未卜先知 —怎么发现历史的规律以预测未来,数据分析告诉你 工作思维 对业务...
  • 数据运营思维导图

    2018-04-26 14:24:22
    游戏内容重复,单调、游戏挫败感太强;新手无对应保护等 如果只是某个渠道存在这个问题,可能存在渠道作弊 [略]僵尸用户(回归、留存) 流失用户(日周月、自然流失、回归流失) 周流失用户 上周登录过游戏,...
  • ExtAspNet_v2.3.2_dll

    2010-09-29 14:37:08
    -增加示例-如何将Grid控件导出为Excel(data\grid_excel_run.aspx)(feedback:503684912)。 -如果TreeNode的属性Enabled="false",则此项变灰并且不会被选中(feedback:your568)。 -修正TreeNode的属性NavigateUrl不...
  • -增加示例-如何将Grid控件导出为Excel(data\grid_excel_run.aspx)(feedback:503684912)。 -如果TreeNode的属性Enabled="false",则此项变灰并且不会被选中(feedback:your568)。 -修正TreeNode的属性NavigateUrl不...
  • arcgis工具

    2012-10-22 22:37:31
    重复操作,直到选中目标要素为止 21. 编辑时一些常用的快捷键 一、公共快捷键(对所有编辑工具有效): 在编辑未完成时按快捷键E切换到选择的环境中 Z 放大 X 缩小 C 漫游 V显示节点 Ctrl+Z 撤销Ctrl+Y 重做 ...
  • vc++ 应用源码包_1

    热门讨论 2012-09-15 14:22:12
    Excel文件的导入和导出操作 主要的实现在CMyExcel类中。 expclass_src dll库的演示。 fge.1.1.alpha.sdk 精灵系统,一套MFC渲染引擎,含2D/3D等渲染,效果看源码,IFEngine是整个引擎接口,IFSystem是硬件查询系统,...
  • vc++ 应用源码包_2

    热门讨论 2012-09-15 14:27:40
    Excel文件的导入和导出操作 主要的实现在CMyExcel类中。 expclass_src dll库的演示。 fge.1.1.alpha.sdk 精灵系统,一套MFC渲染引擎,含2D/3D等渲染,效果看源码,IFEngine是整个引擎接口,IFSystem是硬件查询系统,...
  • vc++ 应用源码包_6

    热门讨论 2012-09-15 14:59:46
    Excel文件的导入和导出操作 主要的实现在CMyExcel类中。 expclass_src dll库的演示。 fge.1.1.alpha.sdk 精灵系统,一套MFC渲染引擎,含2D/3D等渲染,效果看源码,IFEngine是整个引擎接口,IFSystem是硬件查询系统,...
  • vc++ 应用源码包_5

    热门讨论 2012-09-15 14:45:16
    Excel文件的导入和导出操作 主要的实现在CMyExcel类中。 expclass_src dll库的演示。 fge.1.1.alpha.sdk 精灵系统,一套MFC渲染引擎,含2D/3D等渲染,效果看源码,IFEngine是整个引擎接口,IFSystem是硬件查询系统,...
  • vc++ 应用源码包_4

    热门讨论 2012-09-15 14:38:35
    Excel文件的导入和导出操作 主要的实现在CMyExcel类中。 expclass_src dll库的演示。 fge.1.1.alpha.sdk 精灵系统,一套MFC渲染引擎,含2D/3D等渲染,效果看源码,IFEngine是整个引擎接口,IFSystem是硬件查询系统,...
  • vc++ 应用源码包_3

    热门讨论 2012-09-15 14:33:15
    Excel文件的导入和导出操作 主要的实现在CMyExcel类中。 expclass_src dll库的演示。 fge.1.1.alpha.sdk 精灵系统,一套MFC渲染引擎,含2D/3D等渲染,效果看源码,IFEngine是整个引擎接口,IFSystem是硬件查询系统,...
  • 在太多的不同新闻群组上重复转贴同样的问题(cross-post)。 向既非熟人也没有义务解决你问题的人发送私人电邮。 黑客会剔除掉那些搞错场合的问题,以保护他们沟通的渠道不被无关的东西淹没。你不会想让这种事发生...
  • vc++ 开发实例源码包

    2014-12-16 11:25:17
    Excel文件的导入和导出操作 如题。主要的实现在CMyExcel类中。 expclass_src dll库的演示。 fge.1.1.alpha.sdk 精灵系统,一套MFC渲染引擎,含2D/3D等渲染,效果看源码,IFEngine是整个引擎接口,IFSystem是硬件...
  •  bootcfg /rebuild 重复全部 Windows 安装过程并允许用户选择要添加的内容。  注意:使用 bootcfg /rebuild 之前,应先通过 bootcfg /copy 命令备份 boot.ini 文件。  bootcfg /scan 扫描用于 Windows 安装的...

空空如也

空空如也

1 2
收藏数 30
精华内容 12
关键字:

excel怎么去重复值