精华内容
下载资源
问答
  • ①COUNTIF(A2:A17,A2:A17)出每个单元格里的值在整个范围里面有几个重复值 ②对所以的重复值取倒数 ③sumproduct(1/COUNTIF(A2:A17,A2:A17))让倒数相加,同一个值的结果都是1,返回值就是区域中不同值的个数了。 ...

    问题:找出一列中,不重复的值的个数
    方法一:可以在【数据】-【删除重复项】中直接删除重复的,剩下的就是不同值,看下个数就可以了。
    方法二:利用sumproduct函数
    在这里插入图片描述
    解释:
    ①COUNTIF(A2:A17,A2:A17)找出每个单元格里的值在整个范围里面有几个重复值
    ②对所以的重复值取倒数
    ③sumproduct(1/COUNTIF(A2:A17,A2:A17))让倒数相加,同一个值的结果都是1,返回值就是区域中不同值的个数了。
    举例:
    【银行理财】在区域中有3个重复值,取倒数以后再使用sumproduct把各倒数相加,那么结果就是,【银行理财】的计算结果是1;同理,【证券股票】计算结果也是1,【保险年金】结果也是1,…这样一直下去,有几个不同的字段就返回几个1,相加之后就是不同字段的个数了。
    在这里插入图片描述

    完毕。

    展开全文
  • 有个use_table 中一个用户对应有多个权限,密码是在excel中用rand随机取的,这就导致了一个用户在不同的权限中有不同的密码,为了便于记忆,现在需要出那些有多个权限的用户,并且把他们的密码改为同一个. ...

    问题:

    有个use_table 中一个用户对应有多个权限,密码是在excel中用rand随机取的,这就导致了一个用户在不同的权限中有不同的密码,为了便于记忆,现在需要找出那些有多个权限的用户,并且把他们的密码改为同一个.

    解决方案:

    1.找出有多个权限的用户 ,并且取其中每个组的最大或者最小值作为密码  

    select login_id ,min(password) as password from user_table  group by login_id having count(login_id)>=2

    2.将user_table 中存在多个权限的用户的密码改为上述步骤中对应的密码

    update   a set a.password=b.password from

    (select login_id ,min(password) as password from user_table  group by login_id having count(login_id)>=2
    ) b inner join user_table a on a.login_id=b.login_id
    展开全文
  • 今天,在使用LISTAGG()函数连接不同角色所有人员的完整名称时,发现LISTAGG()函数本身并不提供去重的功能(相同的人名,在结果中会重复显示)。问问度娘,没有找到好用的解决方法。然后使用Yahoo英文版(Google要是...
    今天,在使用LISTAGG()函数连接不同角色所有人员的完整名称时,发现LISTAGG()函数本身并不提供去重的功能(相同的人名,在结果中会重复显示)。
    问问度娘,没有找到好用的解决方法。然后使用Yahoo英文版(Google要是能用或许就没有Yahoo什么事了),搜索到了Stackoverflow上的一篇文章,受到启发,然后使用嵌套一层子查询的方法实现了去重后的连接。

    本来想贴上原文链接,结果找了半天没找到,算了,自己写一段sample吧。
    SELECT *
      FROM IKB
     WHERE TYPE = 'iCompany-I Skill set'

    执行结果:


    现要求将相同sub-type的值串联显示,而En列中存在重复值,如果直接使用listagg(),串联后的结果中也将包括重复值。
    SELECT DISTINCT
           TYPE,
           SUBTYPE,
           LISTAGG (EN, ' | ')
              WITHIN GROUP (ORDER BY EN)
              OVER (PARTITION BY TYPE, SUBTYPE) AS SKILLS
      FROM IKB
     WHERE SUBTYPE IN ('Technology_Database', 'test')

    执行结果:


    解决方法:先在子查询中完成去重操作,再在外层查询中使用LISTAGG()函数。
    修改后的query如下:
    SELECT DISTINCT
           TYPE,
           SUBTYPE,
           LISTAGG (EN, ' | ')
              WITHIN GROUP (ORDER BY EN)
              OVER (PARTITION BY TYPE, SUBTYPE)
              AS SKILLS
      FROM (SELECT DISTINCT TYPE, SUBTYPE, EN
              FROM IKB
             WHERE SUBTYPE IN ('Technology_Database', 'test'))

    执行结果:

    任务完成!cheers!

    展开全文
  • 用pd读excel文件--2个邮件列表去重后,不包含的数据 这次是要读取两个excel的文件,然后查看tiany表中的邮箱不在spam中的邮箱,然后将...合并两个dataframe,然后找不同。用merge 取不包含*的,再isin前面加 ~ ...
        

    用pd读excel文件--2个邮件列表去重后,不包含的数据

    这次是要读取两个excel的文件,然后查看tiany表中的邮箱不在spam中的邮箱,然后将结果另存为'email_result.xlsx'

    知识点

    • 读excel,没有列标题,命名标题
    • 合并两个dataframe,然后找不同。用merge
    • 取不包含*的值,再isin前面加 ~
    • 写入csv,要注意是否包含了前面的索引

    1、读excel

    读excel文件
    两个excel表都仅有邮箱一列,且无列名,所以在读取时要标明无列名,且要将列命名为'mail'.
    下面的代码时错误的:
    tianyan = pd.read_excel('C:/Users/*/Documents/tiany.xlsx',header=None)

    出来之后标题是0,用rename函数也改不过来

    然后在header= None后面加了 'names = 'mail' 还是不对,看不懂英文啊,吃大亏!!!

    无奈求助大神,names都不会用?你看文档了吗?看不懂英文,来我教你看文档 (习惯性被鄙视(●ˇ∀ˇ●)

    然后大神带着我看了一遍这个函数的英文解释才晓得,names后面应该是列表
    header : int, list of ints, default 0

    Row (0-indexed) to use for the column labels of the parsed DataFrame. If a list of integers is passed those row positions will be combined into a MultiIndex. Use None if there is no header.

    names : array-like, default None

    List of column names to use. If file contains no header row, then you should explicitly pass header=None

    正确的应该是这个样子的:
    tianyan = pd.read_excel('C:/Users/*/Documents/tiany.xlsx',header=None,names= ['mail'])
    spam = pd.read_excel('C:/Users/*/Documents/spam.xlsx',header =None,names=['mail'])

    两个表字段都命名为”mail",方便后期处理
    clipboard.png

    然后在每个dataframe后面加一列,用于区分
    tiany表在后面加了一列:tiany,
    spam表在后面加了一列:spam (字段名和值相同)

    tiany['tiany'] = 'tiany'
    spam['spam'] = 'spam'

    clipboard.png

    2、合并两个dataframe,找到tiany中没有包含spam的邮箱

    谷歌后用pd.merge函数,参照举例及文档,选择left

    pd.merge(tiany,spam, how= 'left', on = 'mail')

    clipboard.png

    最后的行数与tiany相同,要取最后一列为NaN的数据

    3、计算结果

    要保留最后一列为NaN的邮箱列
    如果用excel的话就很方便了,先筛选最后一列为'NaN'的值,然后筛选第一列的邮箱,复制到新表另存为即可。

    在python的话,要先选择最后一列为'NaN'的值。选spam的好选,如果是'NaN'的话就要报错了。

    clipboard.png

    上面这个图是看有多少是spam的值,下面这个图是把只选最后一列为“NaN”的值,记得在前面加一个
    ~表示反选。(网上太多人抄别人的文章了,就不能自己写吗  ̄へ ̄)

    • 感谢STACK OVERFLOW网站,最后找到了反选的方法

    clipboard.png

    这样还是没有完的,因为最后只保留第一列邮箱,其他的不要。所有上面的代码没问题,我就把值赋值给了email,然后再把最终结果保存到csv中

    clipboard.png

    4、保存结果

    先赋值给email_result
    (新手就老老实实把步骤写好,打好基础,坑踩两次就好了)

    email_result = email.mail
    email_result

    再保存

    email_result.to_csv('C:/Users/xiaom/Documents/email_result.csv')

    保存之后发现有索引,算了,就这样把,没啥影响。

    第一篇博客就到这,用了这么久时间写,希望自己能不要重复踩坑,拜拜。
    (写这么长,希望别被抄走了,转载、复制之类请发送站内信给我。虽然不一定会有人看到,但还是要说明一下)

    展开全文
  • 一个映射不能包含重复的键 每个键最多只能映射到一个 Map接口和Collection接口的不同 Map是双的,Collection是单列的 Map的键唯一,Collection的子体系Set是唯一的 Map集合的数据结构(TreeMap,hashMap)...
  • 当数据量大的时候,快速把重复值找出来,是很多人非常头疼的问题。 我用的版本是 Excel 2016,其他版本的界面可能略有不同。 需求: 单独一数据如何快速查重? 多数据组合条件快速查重,如何实现? ...
  • 关键词:group by……having :分组查询,我对这个关键词的理解是:不同的行之间相同的一项或者几项,几项都需要相同用逗号隔开。查询的几行中如果还需要条件过滤,那么需要用having来过滤。 sql语句...
  • 每行、每及每宫都包含九个格,九个格中填放1到9的不重复的数字。 二、自动计算原理(三步法): 1、基础法:出空格中唯一可填的数字。方法是,先假设某空格中可填入九个数字,然后去掉所在行、所在、所在宫中...
  • 查了下相关表的结构和数据,发现有一ID的是这种形式的193ded83-f22c-11e8-b606-02007b91000e,要想批量插入数据,就得先生成这个ID,而且要保证生成的不重复,不然可能会因为主键约束插入不成功。 上网看看大神...
  • Excel 表格核对方法

    2019-02-14 10:59:38
    2、相同数值不一定同行(单列无重复值) 【例2】下图中,要求出两列中相同的姓名(单列中姓名无重复) 核对方法:条件格式 - 突出显示单元格规则 - 重复值 3、相同数值不一定同行(单列有重复值) 【例3】...
  • mysql中索引的基数是什么意思?...索引的基数相对于数据表行数较高(也就是说,中包含很多不同重复很少)的时候,它的工作效果最好。 如果某数据含有很多不同的年龄,索引会很快地分辨...
  • Java新手:HashMap集合

    2018-11-15 00:12:27
    2、Map中的集合叫双集合,元素是成对出现的,每个元素有键和两部分组成,通过键可以对所对应的。 3、Map中的集合不能包含重复的键,可以重复,每个键只能对应一个。 Map的常用功能: 1、 V put...
  • Java Day15

    2020-07-24 12:51:50
    每个元素由键与两部分组成,通过键与两个部分组成,通过键可以所对应的。 Collection中的集合称为单列集合,Map中的集合称为双集合。 需要我们注意的是:Map中的集合不能包含重复的键,可以重复,每个...
  • java笔记--map

    2021-05-18 08:18:43
    每个元素由键与两部分组成,通过键可以对所对应的。 Collection中的集合称为单列集合,Map中的集合称为双集合。 需要注意的是,Map中的集合不能包含重复的键,可以重复;每个键只能对应一个
  • Java学习笔记 ——Map

    2020-07-31 19:02:40
    每个元素由键与两部分组成,通过键可以对所对应的。 Collection中的集合称为单列集合,Map中的集合称为双集合。 需要注意的是,Map中的集合不能包含重复的键,可以重复;每个键只能对应一个。 Map中常
  • Map

    2020-10-19 16:23:20
    每个元素由键与两部分组成,通过键可以对所对应的。 Collection中的集合称为单列集合,Map中的集合称为双集合。 需要注意的是,Map中的集合不能包含重复的键,可以重复;每个键只能对应一个。 二、
  • 第20天 集合

    2020-05-20 17:58:43
    每个元素由键与两部分组成,通过键可以对所对应的。 Collection中的集合称为单列集合,Map中的集合称为双集合。 需要注意的是,Map中的集合不能包含重复的键,可以重复;每个键只能对应一个
  • 每个元素由键与两部分组成,通过键可以对所对应的。 C:Collection中的集合称为单列集合,Map中的集合称为双集合。 需要注意的是,Map中的集合不能包含重复的键,可以重复;每个键只能对应一个。 如:实
  • 每个元素由键与两部分组成,通过键可以对所对应的。 Collection中的集合称为单列集合,Map中的集合称为双集合。 需要注意的是,Map中的集合不能包含重复的键,可以重复;每个键只能
  • 关键词:group by……having :分组查询,我对这个关键词的理解是:不同的行之间相同的一项或者几项,几项都需要相同用逗号隔开。查询的几行中如果还需要条件过滤,那么需要用having来过滤。 sql语句如下: ...
  • 每个元素由键与两部分组成,通过键可以对所对应的。 Collection中的集合称为单列集合,Map中的集合称为双集合。 需要注意的是,Map中的集合不能包含重复的键,可以重复;每个键只能对应一
  • 总结Map集合

    2020-10-21 23:50:03
    1.Collection集合中元素都是单个的,而Map集合中元素成对出现,且有映射关系(由键可找值)。 2.Collection集合叫单列集合,Map集合叫双集合。 3.Map集合中键不可以重复,而可以重复。 4.Map集合中键和值得类型...
  • mysql数据库操作

    2018-08-16 12:38:50
    c、在select后面的列名部分,可以使用as为列名起别名,这个别名显示在结果集中,但是再用别名找找不到该。 d、如果想查询多个,之间用逗号分隔 2、消除重复行 在select后面的前面使用distinct可以不显示...
  • 第一章Map接口 ...每个元素由键与两部分组成,通过键可以对所对应的。 Collection中的集合称为单列集合,Map中的集合称为双集合。 需要注意的是,Map中的集合不能包含重复的键,可以重..
  • java的Map集合

    2021-03-16 17:43:51
    1.Map集合是一个双集合,一个元素包含两个(一个key,一个value) 2.Map集合那个的元素,key和value可以相同也可以不同 3.Map集合中的元素,key是不允许重复的,value是可以重复的 4.Map集合中的元素,key和...
  • 数据库基础重要知识

    2018-09-14 14:38:11
    参考文章:数据库面试问题集锦一:数据库范式出关系模式中不合适的数据依赖,解决插入、删除、更新异常和数据冗余问题1、第一范式 无重复是在关系模型中,对域添加的一个规范要求,所有的域都应该是原子性的,...
  • 数据整理过程(耗时耗力,有三点要求-尽可能保证数据是对的、数据能用得上、数据的格式能够直接用于分析)(1)重复、空行、空数据删除(F5-定位)(2)缺失的填充和分析(3)数据间逻辑的排查—Excel中...
  • SQL常用语句最好用的

    2010-04-01 15:24:53
    --7、编写一个查询,出现有图书的各个类别(不能有重复值) select distinct type from dbo.titles --8、编写一个查询,显示各个作者的版权费(royaltyper)的总和 select sum(royaltyper) 版权费,au_id 编号 from ...
  • 清理内容:使用Python算法搜索空白单元格,并用其各自的最新标识填充该空白单元格,因为此数据集中的空白单元格仅仅是从同一家餐厅(但不同的墨西哥卷饼)重复的结果。 如果填满了没有地址或邻居的单一餐厅,则...

空空如也

空空如也

1 2 3 4 5 ... 11
收藏数 201
精华内容 80
关键字:

不同列找重复值