精华内容
下载资源
问答
  • 预期需求: 使用循环语句,将DataFrame中 A 不为...判断DataFrame中一项的是否为空的方法两种: 可以通过np.nan 来比较判断,语法格式:df['column_name'][i] is not np.na 可以通过pd.isnull()来判断,语...

    预期需求:
    使用循环语句,将DataFrame中 A列 不为空的各行值分别赋值到 B列 的对应行单元中。

    问题提出:
    需要逐项判断DataFrame中某一项的值是否为空。

    解决方案:
    判断DataFrame中某一项的值是否为空的方法有两种:

    1. 可以通过np.nan 来比较判断,语法格式df['column_name'][i] is not np.nan
    2. 可以通过pd.isnull()来判断,语法格式pd.isnull(df.at[i,'column_name'])或者pd.isnull(df.at[i,'column_name'])==True

    备注: 语法格式中的i表示指定的某一行的行号i

    展开全文
  • df.isnull().any() 用来判断某列是否缺失df.isnull().all() 用来判断某列是否全部为空值 转载于:https://www.cnblogs.com/shadow1/p/10898759.html

    df.isnull().any() 用来判断某列是否有缺失值 
    df.isnull().all() 用来判断某列是否全部为空值

     

     

    转载于:https://www.cnblogs.com/shadow1/p/10898759.html

    展开全文
  • python 基础-----list查找重复

    千次阅读 2018-07-20 17:37:40
    刚开始学python,在数据分析中遇到...需求2:假设有某列数据,需要判断该列数据是否包含重复项,包含的重复项是什么,重复了多少次。 一、需求1解决 1. 生成数据集 import numpy as np import pandas as pd df1...

    刚开始学python,在数据分析中遇到的基础需求,做一个记录。

    需求1:假设df1、df2两个数据集中分别有A、B列数据,需要判断A、B列的数据是否有差异,并显示差异的数据。

    需求2:假设有某列数据,需要判断该列数据是否包含重复项,包含的重复项是什么,重复了多少次。

    一、需求1解决

    1. 生成数据集

    import numpy as np
    import pandas as pd
    
    df1=pd.DataFrame(np.arange(20).reshape(10,2),columns=list('AN'))
    df1.iloc[6,0]=4
    
    df2=pd.DataFrame(np.arange(30).reshape(5,6),columns=list('ABCDEF'))
    
    >>>df1
        A   N
    0   0   1
    1   2   3
    2   4   5
    3   6   7
    4   8   9
    5  10  11
    6   4  13
    7  14  15
    8  16  17
    9  18  19
    >>>df2
        A   B   C   D   E   F
    0   0   1   2   3   4   5
    1   6   7   8   9  10  11
    2  12  13  14  15  16  17
    3  18  19  20  21  22  23
    4  24  25  26  27  28  29

    2. 提取需要匹配的列(假设df1中A列,df2中A列)

    df1_A=df1.iloc[:,0]  # 提取df1中的第1列,生成series df1_A
    df2_A=df2.iloc[:,0]  # 提取df2中的第1列,生成series df2_A
    
    >>> df1_A
    0     0
    1     2
    2     4
    3     6
    4     8
    5    10
    6     4
    7    14
    8    16
    9    18
    Name: A, dtype: int32
    >>> df2_A=df2.iloc[:,0]
    0     0
    1     6
    2    12
    3    18
    4    24
    Name: A, dtype: int32

    3. 判断是否重合

    AA = set(df1_A) #df1中被判断的列的集合
    BB = set(df2_A) #df2中被判断的列的集合
    >>> AA
    {0, 2, 4, 6, 8, 10, 14, 16, 18}
    >>> BB
    {0, 6, 12, 18, 24}
    
    AB=AA&BB    #df1和df2共有的数据
    >>> AB
    {0, 6, 18}
    
    >>> AA-BB  #df1有,df2没有的数据
    {2, 4, 8, 10, 14, 16}
    >>> BB-AA  #df1没有,df2有的数据
    {12, 24}
    >>> len(AB)==len(AA)
    False   #如果true,df2的A列数据包含df1的A列数据
    >>> len(AB)==len(BB)
    False   #如果true,df1的A列数据包含df2的A列数据

    二、需求2解决

    1. 数据样例

    """
    以df1的第1列数据为例进行该列的重复值查找
    """
    
    >>>df1_A
    0     0
    1     2
    2     4
    3     6
    4     8
    5    10
    6     4
    7    14
    8    16
    9    18
    Name: A, dtype: int32
    

    2. 样例编写

    from collections import Counter
    datac=Counter(df1_A)   #生成集合,key值是df1_A的各元素,value值是各元素在df1_A中出现的次数。若value不等于1,则是重复值
    
    """
    编写一个导出重复值的数据(list形式)的函数
    """
    repectlist=[] #重复元素
    repectdic={}  #重复元素的字典:key值是重复的元素,value是重复次数统计
    uniqlist=[]   #不重复的元素
    
    for key, val in datac.items():
        if val != 1:
            repectlist.append(key)
            repectdic.update({key : val})
        else:
            uniqlist.append(key)

    3. 结果输出验证

    如果:重复的元素列表的长度len()是0,则df1_A列没有重复元素

    >>> print(repectlist)
    [4]                            #重复的元素列表
    >>> print(uniqlist)
    [0, 2, 6, 8, 10, 14, 16, 18]   #不重复的元素列表
    >>> print(repectdic)
    {4: 2}                         #重复的元素及对应的出现次数
    
    >>> len(repectlist)
    1

     

    展开全文
  • pandas排序的方法很多,sort_values表示根据排序 pd.sort_values("xxx",inplace=True) 表示pd按照xxx这个字段排序,inplace默认为False,如果该为False,那么原来的pd顺序没变,只是返回的是排序的...
          pandas排序的方法有很多,sort_values表示根据某一列排序
    
           pd.sort_values("xxx",inplace=True)
    
        表示pd按照xxx这个字段排序,inplace默认为False,如果该值为False,那么原来的pd顺序没变,只是返回的是排序的
    

      

    python 判断一个数是否是NaN

    >>> import math
    >>> x = float('nan')
    >>> math.isnan(x)
    True
    

      

    pandas 基本操作: https://blog.csdn.net/zutsoft/article/details/51483710

    转载于:https://www.cnblogs.com/Allen-rg/p/9871959.html

    展开全文
  • python mysql 批量插入

    2019-07-12 16:21:34
    首先我们看看mysql的存入数据...UPDATE 表名称 SET 名称 = 新 WHERE 名称 = 某值 那我们如果需要代码自动判断该插入还是更新呢? 2种方法,但都一个条件,mysql表中设置唯一索引,多字段可设置多个。 RE...
  • Python常用的自省函数

    2018-05-23 11:03:17
    1、help()用来查看很多Python自带的帮助文档信息。...5、hasattr()和getattr()分别判断对象是否某个属性及获得某个属性。6、callable()判断对象是否可以被调用。7、isinstance()可以确认某个变量是否有某...
  • python对excel表格处理的一些小功能功能概览pandas库的一些应用标题文件读入计算表格中每一行的英文单词数简单用textblob进行自然语言情感分析判断一行中是不是两列都与其他行重复(可推广至多)对表格中的...
  • python知识点总结

    2019-11-27 15:45:09
    1、类方法,可以由类直接调用,不用初始化类对象,示例如下: 2、exec eval 将字符串变为可执行的脚本,区别是exec没有返回值,eval返回值 ...4、getattr hasattr 判断对象是否有某属性 5、r...
  • 尊敬的读者您好:笔者很高兴自己的文章能被阅读,但原创与编辑均不易,所以转载请必须注明本文出处并附上...1、判断某是否包含另一 #采用pandas进行处理 import pandas as pd data = {'姓名1':[...
  • python动态生成写文件变量

    千次阅读 2016-01-13 21:19:57
     因为不知道输入字段的那一列有多少种取值,因此需要动态创建变量,并写文件。  因为 字典的value可以重新赋值,因此可以首先判断文件中那一列的取值有多少个,然后将那一列的取值作为key存入字典中,后续使用...
  • 解数独算法(python

    2020-05-09 00:22:35
    一、数独的规则 横排、竖排以及3X3的格子里均为1-9,且相互不同。 二、具体思路 ...#首先写一个判断某某列能否为某个值得判断函数, def check(i, j, k, matrix):#其中i代表行,j代表列,k代表某个
  • # 只要一行缺失就把这一行删除 df.dropna() # 如果只想删除空白行 df.dropna(how=all) 1.3 缺失的填充 #括号内填要填充的 df.fillna() # 按照不同的填充 df.fillna({'列名1':'要填充的1','列名2':...
  • B) Python 中的每一条语句都一个缩进级别,并且缩进级别会使用栈的数据结构进行存 储  4/7  C) Python 中的缩进是语法含义的,它用来表示一个代码块 D) 一条比较长的语句也可以用...
  • 面试题20:顺时针打印矩阵:首先需要判断每一步开始是的坐标点是否满足小于行数的一半且小于数的一半,在最后一圈中,可能出现仅能向右走一行,仅能向右走一行向下走一,向右走一行向下走一向左走一行,能走...
  • ghtoc Github地址(pyhon) 见toc.py,(python2.7,使用方法·:python toc.py MDFile,会生成一个.bak备份文件)【推荐这个可以用,也不用装其他工具】 gh-md-toc Github地址 git团队协作项目操作说明.md 放在...
  • 2.5.2 公司申请到一个C类IP地址,但要连接6个的子公司,最大的一个子公司 26台计算机,每个子公司在一个网段中,则子网掩码应设为? 2.5.3 与10.110.12.29mask 255.255.255.224属于同一网段的主机IP地址是? ...

空空如也

空空如也

1 2
收藏数 37
精华内容 14
关键字:

python判断某列有值

python 订阅