精华内容
下载资源
问答
  • SQL 怎样替换字段中部分

    千次阅读 2018-10-12 22:52:04
    SQL 怎样替换字段中部分值 语法:UPDATE 表名 set 字段名 = REPLACE(字段名,‘要替换的内容’,‘替换成的内容’); 例子:把所有带‘马克思主义’的替换成‘社会主义’ update 学生表 t set t.学科=replace(学科,...

    SQL 怎样替换字段中部分值

    语法:UPDATE 表名 set 字段名 = REPLACE(字段名,‘要替换的内容’,‘替换成的内容’);

    例子:把所有带‘马克思主义’的替换成‘社会主义’

    update 学生表 t set t.学科=replace(学科,‘马克思主义’,‘社会主义’)
    where t.test_point like ‘%马克思主义%’ ;

    展开全文
  • 1、替换数据库特定字段中部分特定数据的SQL语句 SQL语句:update 表名 set 字段名= replace(字段名,‘原字符串’,需要替换成的字符串’) 以将表exam_major中的字段pos2019中的数据 50 替换成 100 为例: 在查询中...

    1、替换数据库特定字段中部分特定数据的SQL语句
    SQL语句:update 表名 set 字段名= replace(字段名,‘原字符串’,需要替换成的字符串’)

    以将表exam_major中的字段pos2019中的数据 50 替换成 100 为例:

    在查询中运行update exam_major set pos2019 = replace (pos2019, ‘50’, ‘100’)

    2、批量将数据库中特定字段中的NULL替换为0
    SQL语句:update 表名 set 表名.字段名=ifnull( 表名.字段名,0)

    以表exam_major中的字段first_discipline为例:

    在查询中运行update exam_major set exam_major.first_discipline=ifnull( exam_major.first_discipline,0)

    展开全文
  • 一个json object,并且可能包含一些空值或者空字符串,在页面显示的时候希望遇到空值显示“N/A”,但是有一部分值是允许空值的。因此希望通过筛选将空值设为“N/A”.例如希望学生的“age”和“score”如果为空显示...
  • A部分: 数据预处理(占80%工作量) class yuchuli ( ) : def __init__ ( self , * args ) : < blabla > # 引入函数需要的参数 def shanchu ( self ) : # 数据读取部分: try : ...
    • A部分: 数据预处理(占80%工作量)
    class yuchuli():
        def __init__(self, *args):
            <blabla> # 引入函数需要的参数
        
        def shanchu(self):     
            # 数据读取部分:
            try:
                df = pd.read_csv('path + sales_file.csv', 
                                 encoding='gb18030', low_memory=False)   # gb18030 比 gbk 涵盖的范围广
            except:
                df = pd.read_csv('path + sales_file.csv', 
                                 encoding='utf8', low_memory=False)
    
    """以行或列为对象的操作:"""
            # 列操作 —— 保留需要的字段
            tar_col = ['col1', 'col2']
            df1 = df.loc[:, tar_col]
    
            #  行操作 —— 去掉多余的行
            df2_1 = df1.dropna(subset=['col2_11', 'col2_12'])           # 删除含有空值的行
            df2_1 = df2_1.drop_duplicates()                             # 删除完全一致的行,保留第一个
            # 等价于
            # df.dropna(subset=['col1', 'col2'], inplace=True)    # 即添加 inplace=True
            # df2_1.drop_duplicates(inplace=True)   
    
            #  行操作 —— 多条件筛选                                                                                       
            df2_2 = df2_1[(df.col1 != 'value1') & (df2_1['col2'].isin['value2', 'value3'])]    # 筛选 等于某值的行
            # 等价于 (速度没有 isin 稍快, 尤其是条件值变多的时候。但是3者性能几乎一致。)
            # df2_2 = df2_1[(df.Col2_21 != 'value1') & ((df.Col2_22 == 'value2')| (df.Col2_22 == 'value3']))]
            # df2_2 = df2_1.loc[(df.Col2_21 != 'value1') & (df.Col2_22.isin['value2', 'value3'])]
    
    """以 行数据 为对象的操作:"""
            # 预处理之 —— 统一大小写和标点符号空格等
            df2_2['customer_name'] = df2_2['customer_name'].str.lower()     # 处理英文大小写问题
            df2_2.replace({'customer_name': [r'(', r')', r' ']},          # 统一标点符号和空格
                          {'customer_name': ['(', ')', '']}, 
                          regex=True, inplace=True)
            # 对整个df进行替换
            # df2_2.replace([r'(', r')', r' '],  
            #               ['(', ')', ''], 
            #               regex=True, inplace=True) 
    
            # 预处理之 —— 设计不同字段的值替换 & 生成新字段
            mask1= df2_2['col_1'] == 'value1'
            mask2 = df2_2['col_2'] == 'value2'
            df2_2['col_new'] = np.select([mask1, mask2], ['value1_new', 'value2_new'], default=0)
            # 等价于
            # df2_2.loc[(df2_2['col_1'] == 'value1'), 'col_new'] = 'value1_new'
            # df2_2.loc[(df2_2['col_2'] == 'value1'), 'col_new'] = 'value2_new'
            # df2_2.loc[(df2_2['col_new'] != 'value1_new') & (df2_2['col_new'] != 'value2_new'), 'col_new'] = 0
            
            # 预处理之 —— 涉及不同字段的值替换
            mask1= df2_2['col_1'] == 'value1'
            mask2 = df2_2['col_2'] == 'value2'
            df2_2['col_3'] = np.select([mask1 | mask2], ['value_new'],
                                       default=df2_2['col_3'])     # 多条件可以使用"and"("&")、"or"("| ")、“~mask”(非)
            # 等价于
            # df2_2.loc[(df2_2['col_1'] == 'value1'), 'col_3'] = 'value1_new'
            # df2_2.loc[(df2_2['col_2'] == 'value1'), 'col_3'] = 'value2_new'
            
            # 预处理之 —— 1个字段的值替换
            df2_2.replace({'col1': [r'.*key_word1.*', 'value1']}, 'value_new', inplace=True)
            
            # 预处理之 —— 字段重命名
            df2_2.rename(columns={'col1_name': 'col1_name_new',
                                  'col2_name': 'col2_name_new'}, inplace=True}
                      
            
            return df2_2
    
    • df.col等价于df['col'],不同在于df['col.a']可以指明df中名为col.a的列,前者不可以。
    • 更多关于str.replace()的信息, 可参考string.replace vs re.sub以及反向选择替换
    • df_hangye.drop_duplicates(inplace=True)
      – 假设表df1和表df2在公共字段中各有M、N个相同的值,使用df1.merge(df2, on='col')之后会有M*N重复记录

    • B部分: 数据透视
    from datetime import datetime, timedelta
    
    
    def toushibiao():
        try:
            df = pd.concat([df1, df2], axis=0, how='outer', )
            
            yesterday = datetime.today() - timedelta(1)             # 昨天的日期。datetime.date不可以用于和datetime类型的作比较
            target_day = yesterday.replace(year=yesterday.year-1)   # 去年昨天的日期       
            df['col_time'] = pd.to_datetime(df['col_time'])         # 转化为datetime类型
            df_new = df[df['col_time'] <= target_day]               # 获取指定日期之前的数据        
    
            pivot_table = pd_new.pivot_table(df_new,
                                             values= [col OR col_list],
                                             columns=[col OR col_list],
                                             index= [col OR col_list],
                                             aggfunc=np.sum)        # 做数据透视表
                                         
            piv_tab.columns = pivot_table.columns.droplevel(0)       # 表头扁平化,具体见下边附的链接。
            pivot_table = pivot_table_1.rename_axis(None, axis=1).reset_index()      # 表头扁平化,具体见下边负的链接。
            pivot_table_1.to_csv('文件路径+pivot_table_1.csv', encoding='gbk')        # 保存透视结果到本地计算机
        except:
            print('没有找到文件"path + sales_of_xiaohua.csv"。')        
    

    获取前一天的日期

    from datetime import date, timedelta
        yesterday = date.today() - timedelta(1)
        print(yesterday.strftime(%Y%m%d))
    

    注:更多关于表头扁平化的信息,可参考多维透视表 - 表头扁平化输出


    • C部分:合并多个透视表&保存
    try:
        # 合并多个表
        merged_table = pivot_table1.merge(pivot_table2, on=['col_mutual'], how='outer)
        
        # 把小数更改为百分比
        merged_table['new_column_float'] = merged_table['column_1'] / merged_table['column_1']
        merged_table['new_column_percent'] = pd.Series(['{:.2f}%'.format(val * 100) for val in merged_table['new_column_float']], 
                                                       index=merged_table.index)
        
        # 保存最终数据                                                 
        merged_table.to_csv('path+filename.csv', encoding='gb18030', index=False)
    
    except:
        print('没有合并生成XXX文件。')
    

    注:

    展开全文
  • #inplace这个参数在一般情况没多大用处,但是如果只替换部分区域时,inplace参数就有用了 df['金额'].replace(0, 0.22, inplace=True) ''' 在上面这个操作中,‘合计’这一列中的0,并没有被替换。 只有‘金额’这一...
    # -*- coding: utf-8 -*-
    
    import pandas as pd
    
    #创建数据集
    df = pd.DataFrame(
            {
                '名称':['产品1','产品2','产品3','产品4','产品5','产品6','产品7','产品8'],
                '数量':['A','0.7','0.8','0.4','0.7','B','0.76','0.28'],
                '金额':['0','0.48','0.33','C','0.74','0','0','0.22'],
                '合计':['D','0.37','0.28','E','0.57','F','0','0.06'],
            }
            )
    
    #搜索整个DataFrame, 并将所有符合条件的元素全部替换。操作之后,其实原DataFrame是并没有改变的。改变的只是一个复制品。
    df.replace('A', 0.1)
    
    #如果需要改变原数据,需要添加常用参数 inplace=True
    df.replace('A', 0.1, inplace=True)
    
    #inplace这个参数在一般情况没多大用处,但是如果只替换部分区域时,inplace参数就有用了
    df['金额'].replace(0, 0.22, inplace=True)
    '''
    在上面这个操作中,‘合计’这一列中的0,并没有被替换。
    只有‘金额’这一列的0被替换,而且,替换后的结果不需要我们再和原数据进行合并操作,直接体现在原数据中。
    '''
    
    #可以用字典形式替换多个值
    df.replace({'C':0.9999, 'F':0.7777})
    df.replace(['C', 'F'], [0.999, 0.777])
    df['合计'].replace({'D':0.11111, 'F':0.22222}, inplace=True)
    
    #如果替换的值都是一样的话
    df.replace(['C', 'F'], 0.33333)
    df['合计'].replace(['D', 'F'], 0.0111, inplace=True)
    
    #参数regex,可以使用正则表达式替换多个
    df.replace('[A-Z]', 0.99, regex=True)
    
    #只需要替换某个数据的部分内容
    df['名称'].str.replace('产品', 'product')
    
    #某些列满足特定条件,然后改变另外的某些列的值
    df.loc[df['数量'] == 'A', '合计'] = 'changed'  # 关键句,直接改变df的值
    df.loc[df['合计'].str.contains('change'), '数量'] = 'A' 	#使用countains可以用来正则匹配筛选
    
    展开全文
  • 如下所示: import pandas as pd content = ['T', 'F'] * 10 data = pd.DataFrame(content, columns=['Y']) print(data) Y 0 T 1 F 2 T 3 F 4 T 5 F 6 T 7 F 8 T 9 F 10 T 11 F 12 T 13 F 14 T ...5
  • pandas中replace函数替换数据部分内容

    千次阅读 2020-04-16 10:02:41
    #!/usr/bin/python # -*- coding: UTF-8 -*- """ @author:ZSW @file:test.py @time:2020/04/16 ...#pandas replace替换某个数据的部分内容 import pandas as pd df = pd.DataFrame( { '名称':['产品1','产品2...
  • JDK

    千次阅读 2019-09-17 16:51:38
    例如,StringBuffer 和 Vector 都是用 synchronized 修饰线程安全的,但大部分情况下,它们都只是在当前线程中用到,这样编译器就会优化移除掉这些锁操作。 锁消除的 JVM 参数如下: 开启锁消除:-XX:+...
  • 图像分割综述

    万次阅读 多人点赞 2019-07-09 22:03:48
    图像分割是计算机视觉研究中的一个经典难题,已经成为图像理解领域关注的一个热点,图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。所谓图像分割...
  • Redis面试题集

    千次阅读 多人点赞 2019-09-16 10:19:31
    RDB:RDB持久化是指在指定的时间间隔内将内存中的数据集快照写入磁盘,实际操作过程是fork一个子进程,先将数据集写入临时文件,写入成功后,再替换之前的文件,用二进制压缩存储。 AOF: AOF持久化以日志的形式...
  • Python机器学习实践

    千次阅读 2019-10-15 21:14:08
    分为两部分: 1、Python机器学习实践案例的算法总结。 见博文下方的算法总结表格。 2、案例和代码实现。 每个案例单独用一篇博文来讲解逻辑和Python代码实现。点击对应的链接到相应的博文中去阅读。 (1)...
  • C#基础教程-c#实例教程,适合初学者

    万次阅读 多人点赞 2016-08-22 11:13:24
     增加安全:C#语言不支持指针,一切对内存的访问都必须通过对象的引用变量来实现,允许访问内存中允许访问的部分,这就防止病毒程序使用非法指针访问私有成员。也避免指针的误操作产生的错误。CLR执行中间语言...
  • Tomcat面试题+http面试题+Nginx面试题+常见面试题

    千次阅读 多人点赞 2019-12-12 15:04:43
    由于nginx的的这个工作性质决定了每个请求大部分的生命都是在网络传输中,所以实际上花费在nginx 服务器上的时间并不多,这就是它几进程就能解决高并发的秘密所在。 3、已知nginx和php-fpm安装在同一台服务器上,...
  • WPF开发教程

    万次阅读 多人点赞 2019-07-02 23:13:20
    此系统在内存受限的系统上工作良好,因为当某些内容更改时,需要处理受影响的组件即可 – 不会有两个组件对一个像素的颜色更改起作用。 WPF 使用“绘画器的算法”绘制模型。这意味着并不是剪辑每个组件,而是...
  • 如下获取到集合中workflowId为传入的workflowId的数据集: public WorkflowUser getAgent(Long workflowId){ List<WorkflowTransfer> transferListNotNul = list .stream() .filter(e -> e....
  • 集成学习—随机森林原理(理解与论文研读)

    千次阅读 多人点赞 2019-08-21 17:44:40
    来评估,但是随机森林不需要在训练的时候做洗牌,而是在验证的时候洗牌,就是直接使用OOB的那部分数据上来替换掉需要测试重要性的特征的袋外误差,然后这样计算出每一个特征的重要性。总的说来随机森林的特征重要性...
  • 分布式服务框架

    千次阅读 2016-01-29 10:42:11
    但这样也会导致一个问题,一旦后端某台缓存服务器宕机,或者是由于集群压力过大,需要新增缓存服务器时,大部分的key 将会重新分布。对于高并发系统来说,这可能会演变成一场灾难,所有的请求将如洪水般疯狂地涌向...
  • 批量修改或替换文件名中的字符

    千次阅读 2020-07-14 17:25:01
    title 批量替换文件名中的部分字符串&color 3f echo Note: echo 本批处理可批量替换本文件所在文件夹下的所有文件名的相同字符 echo.&echo.&echo.&echo.&echo.&echo. echo.&set /p ...
  • hive之条件筛选

    千次阅读 2019-04-25 10:59:21
    常用的条件筛选函数为:if函数,coalesce函数,case when函数 1、if函数(处理单个列的查询结果) 语法:if(condition,value_if_true,value_if_false) 说明:当条件Condition为TRUE时,返回value_True;否则返回...
  • IntelliJ IDEA是一种商业化销售的Java集成开发环境(Integrated Development Environment,IDE)工具软件,由JetBrains...在做项目时,有时会在整个项目里或指定文件夹下进行全局搜索和替换,这是一个很方便功能。...
  • Linux实用教程(第三版)

    万次阅读 多人点赞 2019-08-27 22:55:59
    磁盘分区和挂载目录 Linux系统中的每一个分区都是构成支持一组文件和目录所必需的存储区的一部分。它是通过挂载来实现的,挂载是将分区关联到某一目录的过程,挂载分区使起始于这个指定目录(称为挂载目录)的存储...
  • ArcGIS 字段值替换

    千次阅读 2020-04-22 10:35:34
    gis小白开始摸着石头过河了。 比如:把某个字段xx中所有的null替换为0 ...把筛选条件输进去:xx IS NULL 点击下方的显示被选中记录 右击字段名 – 字段计算器 把要替换的值输进去 – 确定 ...
  • python—实战5筛选特定数据的长度、最多(字典、元组、列表、文件操作、替换
  • ArcGIS提取矢量图中指定部分

    万次阅读 2019-08-19 13:54:56
    1. 根据属性选择:提取矢量图中的指定部分,首先我们要选中我们要提取的部分(可以提取线状、面状、点状图形,这是根据矢量图层的属性来的) 点击菜单栏的选择,根据属性选择,点击打开。 点击确定,就可看见自己...
  • 将Bitmap中某个颜色替换成其他颜色

    千次阅读 2016-04-27 18:05:50
    使用ARGB(255,0,0,0)也就是黑色替换bitmap中的0x616161,容忍度为50范围的颜色private Bitmap handleCrossImageBack(Bitmap crossimage){ // start with a Bitmap bmp Bitmap newBmp = crossimage.copy(Bitmap....
  • 今天小编写一下Array数组操作(变异更新、替换) 来个v-for和key小补充,方便了解接下来的课程 循环指令v-for补充: 使用v-for更新已渲染的元素列表时,默认用就地复用策略;列表数据修改的时候,他会根据key值去判断...
  • #这里筛选出plot_no列,plot_no列中满足条件Data.iloc[i,1], 然后将对应的FL列修改为“T1” 2、所有代码如下 (1)包括在数据框中创建新的列 (2)满足指定条件,替换列的值 import pandas as pd import shutil ...
  • 今天在处理一个数据的过程中出现问题,python中的dataframe 剔除部分数据后,索引消失,遍历就出错, 报错形式如下 Traceback (most recent call last): File &amp;quot;D:/pycreate/tianchi_糖尿病/data_...
  • 帆软报表-控件范围筛选

    千次阅读 2020-01-15 14:51:02
    背景:了解报表的人都晓得报表的正文展示前一般都有一些筛选控件,以供筛选出想要的数据,但是往往有用户在使用的时候查询数据量很大,导致报表服务器出现内存不足等问题出现,为了规避这种情况出现,限制用户对报表...
  • ![图片说明](https://img-ask.csdn.net/upload/201811/18/1542510656_180291.png) 比如想把图片里的 333333和jj 批量替换成空白或者整行都删除 怎么批量操作?

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 47,866
精华内容 19,146
关键字:

如何只替换筛选部分