精华内容
下载资源
问答
  • EXCEL函数实现从列数据中提取不重复值

      A B C
    1 A   A
    2 B   B
    3 C   C
    4 A   D
    5 D   E
    6 A   F
    7 B   G
    8 E   H
    9 F   I
    10 F    
    11 G    
    12 H    
    13 A    
    14 H    
    15 I    
    16 B    


    如上图数据,在C2单元格输入公式:=INDEX(A:A,SMALL(IF(MATCH(A$2:A$16,A$2:A$16,0)=ROW($1:$15),ROW($2:$16),4^8),ROW(A1)))&""

    按键盘上的Ctrl+Alt+Enter键,形成数组公式,然后公式下拉至16行。

    其中公式里出现的16、15等数字,各位可以按照A列的实际行数变更,注意:=ROW($1:$15),这一段里的15是行数减1的。


    公式的具体说明:

    1、使用MATCH函数返回数组中每个元素第一次出现的位置;
    2、用ROW函数返回数组中每个元素在数组中所处的位置,与第1步返回的数组逐一比对,如果相同说明该元素是首次出现,标识相应的行号;如果不同说明是重复出现,标识一个很大的行号,这里用4^8,4的8次方结果是65536,正好是2003版的最大行号,此处属于习惯用法;
    3、使用IF函数生成一个由不重复元素所在的行号与65536组成的数组;
    4、使用SMALL函数在第3步返回的数组中依次提取第1个值、第2个值、......第N个值;
    5、最后使用INDEX函数提取相应位置上的数据,即列数据中的不重复值。



    转自:http://www.officezhushou.com/excelhansu/3434.html

    展开全文
  • Series格式和ndarray格式提取特定的一列数据读取数据Series中提取一列数据ndarray中提取一列数据数据集的图表展示 本文使用的数据集是鸢尾花,代码写在jupy notebook。 数据集内包含 3 类共 150 条记录,...

    本文使用的数据集是鸢尾花,代码写在jupy notebook中。
    数据集内包含 3 类共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度,可以通过这4个特征预测鸢尾花卉属于(iris-setosa, iris-versicolour, iris-virginica)中的哪一品种。

    读取数据

    人为的给数据集添加特征名,names = [‘sepal_len’, ‘sepal_wid’, ‘petal_len’, ‘petal_wid’, ‘class’]

    import numpy as np
    import pandas as pd
    
    df = pd.read_csv('iris.data', header = None, names = ['sepal_len', 'sepal_wid', 'petal_len', 'petal_wid', 'class']) 
    print(df.shape)
    df.head()
    

    运行结果:
    在这里插入图片描述

    Series中提取某一列数据

    将原始数据集划分为训练集和标签,划分后的X和Y是Series类型。用bool型数据做索引,提取标签为“Iris-setosa”的子块。

    X = df.iloc[:,0:4]
    Y = df.iloc[:,4]
    print(type(Y))
    X[Y=='Iris-setosa'].head() 
    

    运行结果:
    在这里插入图片描述
    提取特定的某一列的操作方式如下(标签为“Iris-setosa”,特征为“sepal_len”)

    X[Y=='Iris-setosa']['sepal_len'].head()   #取特定的列
    

    运行结果:
    在这里插入图片描述

    ndarray中提取某一列数据

    将原始数据集划分为X和Y,.values作用是将矩阵转为ndarray型,为了画图时传入参数矩阵

    X = df.iloc[:,0:4].values
    Y = df.iloc[:,4].values
    type(X)
    

    运行结果:
    在这里插入图片描述
    提取特定的某一列的操作方式如下(标签为“Iris-setosa”,特征为第一列,即“sepal_len”)

    #numpy中使用bool型数据做索引,画图时要用到
    X[Y=='Iris-setosa', 0]
    

    运行结果:
    在这里插入图片描述

    数据集的图表展示

    from matplotlib import pyplot as plt
    import math
    
    #用字典的格式定义图表的table
    label_dict = {1: 'Iris-Setosa',
                  2: 'Iris-Versicolor',
                  3: 'Iris-Virgnica'}
    feature_dict = {0: 'sepal length [cm]',
                    1: 'sepal width [cm]',
                    2: 'petal length [cm]',
                    3: 'petal width [cm]'}
                    
    plt.figure(figsize=(8, 6))   #设置画布大小
    for cnt in range(4):
        plt.subplot(2, 2, cnt+1)
        #在每一个子图中,画出三种类别的数据分布直方图
        for lab in ('Iris-setosa', 'Iris-versicolor', 'Iris-virginica'):  
            plt.hist(X[Y==lab, cnt], label=lab, bins=10, alpha=0.3)
        plt.xlabel(feature_dict[cnt])    #设置X轴的标签
        plt.legend(loc='upper right', fancybox=True, fontsize=8)   #在右上方展示类别标签,标签框大小为8
    
    plt.tight_layout()   #tight_layout会自动调整子图参数,使之填充整个图像区域
    plt.show()
    

    运行结果:
    在这里插入图片描述

    展开全文
  • 笔者最近在做个数据库项目,其中需要EXCEL中提取关键字段。提取内容如下图所示,需要将图加粗部分单独提出后进行去噪处理。如果通过word处理,文字量小的时候尚可实现,但几十万字的处理量很容易就造成假死。...

    笔者最近在做一个数据库项目,其中需要从EXCEL中提取关键字段。提取内容如下图所示,需要将图中加粗部分单独提出后进行去噪处理。如果通过word处理,文字量小的时候尚可实现,但几十万字的处理量很容易就造成假死。因此采用了EXCEL进行数据处理。
    在这里插入图片描述

    代码如下:功能是将B列中的数据筛选后存入C列

    Sub 提取内容()
    Dim searchtext
    Dim textlong
    Dim str_start
    Dim str_end
    
    For i = 1 To 2000
    searchtext = Worksheets("sheet1").Range("B" & i).Value
    textlong = Len(Worksheets("sheet1").Range("B" & i).Value)
    '————————————————————————————确定提取的字符区间
        If InStr(searchtext, "解决") <> 0 Then
        str_start = InStr(searchtext, "解决")
        str_end = InStr(searchtext, "问题")
     '————————————————————————————避免B列出现不含有所要提取内容时报错
    If str_start - str_end - 2 > 0 Then
    Worksheets("B60J7摘要").Range("c" & i).Value = Mid(searchtext, str_start + 2, str_start - str_end - 2)
    End If
     '————————————————————————————提取B列中的内容至C列
        ElseIf InStr(searchtext, "问题") <> 0 Then
        Worksheets("sheet1").Range("c" & i).Value = Right(searchtext, str_start + 2, str_start - str_end - 2)
        ElseIf searchtext = "" Then
        Worksheets("sheet1").Range("c" & i).Value = ""
        Else
        Worksheets("sheet1").Range("c" & i).Value = "不含有"
        End If
     Next
    End Sub
    

    注:由于要提取的内容中,必然以“解决”开头,以“问题”结尾,因此可采用上述代码处理。提取结果如图所示。

    展开全文
  • 【python】提取excel的某一列数据

    万次阅读 多人点赞 2019-03-11 15:09:44
    import xlrd def extract(inpath): data = xlrd.open_workbook(inpath, encoding_override='utf-8') table = data.sheets()[0]#选定表 nrows = table.nrows#获取行号 ncols = table.ncols#获取号 ...

     

    import xlrd
    
    def extract(inpath):
        
        data = xlrd.open_workbook(inpath, encoding_override='utf-8')
        table = data.sheets()[0]#选定表
        nrows = table.nrows#获取行号
        ncols = table.ncols#获取列号
        
        for i in range(1, nrows):#第0行为表头
            alldata = table.row_values(i)#循环输出excel表中每一行,即所有数据
            result = alldata[1]#取出表中第二列数据
            print(result)
    
    inpath = 'xxx.xls'#excel文件所在路径
    extract(inpath)

     

    展开全文
  • 通常在Excel从一列中提取包含指定内容的数据,可以用自动筛选的自定义筛选,并设置所包含的字符。如果要用公式来实现这种类似筛选的效果,可以在数组公式中用SEARCH函数来查找所包含的字符。假如在A2:A100区域...
  • 我想做一个ComboboxEdit的下拉列表能显示数据库的某一列内容,过程怎么弄 应该怎么提取数据库数据存放到哪里,求个详细过程
  • 如何提取matlab某一行一列数据

    千次阅读 2021-01-26 20:44:40
    比如,从一个6*6矩阵提取它的第行元素,形成个6维行向量。 A(i,:)行 A(:,i) 方法: A(i,:) 提取矩阵A的第 i行 A(:,i) 提取矩阵A的第 i 给你个例子: A=[1:6;2:7;3:8;4:9;5:10;6:11] A...
  • 2. 如果你想导出拆分后数据,你希望勾选那一列就导出那一列数据,勾选多列就导出多列数据; 3. 如果你想让某列按日期范围导出数据,就能按某列的日期范围导出数据; 4. 如果你想按某列的数值大小范围导出数据,就...
  • 在数据处理遇到一个问题:如何提取数据一列的类别,也就是汇总多少种类。 问题很简单,有以下两种方法,个人推荐第2种。 1.直接对数据表进行透视,然后取出类别的一列 df_pivot = df.pivot_table(index =...
  • 如何把多个excel的同一位置数据一次提取出来放在一个新的excel一列
  • 提取不同工作簿的同一列数据

    千次阅读 2018-02-02 10:16:06
    cr(n, j) = ar(i, j) '循环把所有工作簿的第个表的数据放入新的数组 Next Next End If Str = Dir Loop Application.DisplayAlerts = True Application.ScreenUpdating = True Range("a1").Resize(n, 2) =...
  • pandas 提取指定列数据

    2020-06-21 11:57:27
    ```timeframe.loc[:,['car']] ...我使用loc函数应该就能把这一列所有行给提取出来呀,为什么我弄出来就变成一列了? 我本身有94列。 整个数据是两列,我提取了表头为car的那列 ``` car 0 3946 ```
  • 例如: if ( df.select(列名).获取数据的类型 == String){ }
  • 该VBA脚本可以实现word文档的多个表中提取数据,每个表格的信息提取到行。 Sub word2els() Set wdApp = CreateObject(“kwps.application”) path_ = ThisWorkbook.Path wdApp.Documents.Open (path_ & “”...
  • 1.首先打开原文本文件(或者...3.把文件的所有数据按照格式对齐。能显示的字符要上下对齐。达到下面的这种形式。 4.最关键的一步。把键盘的输入光标(条竖的斜线提示的位置)定位(通过鼠标或者方向键)到
  • 本程序需要结合文件名提取脚本和多文件数据提取文件脚本操作。源代码如下:#!usr\bin\python # -*-coding:utf-8 -*- import csv import pandas as pd import numpy as np import winreg import os ''' 1.打开链表...
  • matlab如何实现循环提取EXCEL一列数据

    万次阅读 2015-07-13 11:57:06
    for i=1:256 eval(['Xnoise' num2str...通过以上代码先把EXCEL的256列数据赋值给矩阵A 如果需要调用其中一列,用以下语言即可实现 (eval(strcat('Xnoise',num2str(i)) 由于MATLAB读取EXCEL文件时间较
  • 数据文件,我想提取它的第到第四,以及第九 和第1到500行,以及501到1000行?
  • 还有另个同理,检测两个文本内同数据数据格式皆相同),写法如下: ``` from pandas import DataFrame import pandas as pd a=0 ....... L=[] M=[] afile=open('F:\FCD\one\odd.txt') bfile...
  • 想要根据某一列数据比如要在另外的一个数组,这时,就需要用到dataframe比较经典的函数了isin()函数。 函数会返回一个bool型的dataframe。而众所周知,这样一个bool型的dataframe可以 被[]这两个符号给囊括住...
  • 1.首先使用鼠标点击需要操作的任意格,选择 数据-筛选-高级筛选。2.列表区域,选择需要操作的整列(包括标题)3.条件区域,选择操作除了标题外的区域4.在-选择不重复的地方打勾5.按确定
  • 请问在labview中用数据库工具包,怎么数据库表中提取一行的数据(非一列),用 执行语句 的vi,怎么获取到这行数据
  • Camelot:pdf中提取表格数据

    万次阅读 2019-03-22 16:40:20
    Camelot:pdf中提取表格数据文章目录:、Camelot的介绍和安装1. Camelot介绍2. Camelot的安装3. 其他二、Camelot的使用1. 快速入门使用2. 详细说明3. camelot两种表格解析(提取)方法1、流解析(stream)2、格子...
  • <p>I have an R data frame with 6 columns, and I want to create a new dataframe that only has three of the columns. <p>Assuming my data frame is <code>df, and I want to extract columns <code>A, ...
  • A表有一数据列数据Aa B表有一列数据Ba 筛选条件是如果Aa的某个值在Ba存在 那么取出来。不知道怎么写 求大神提拔?
  • N)可以提取矩阵a符合M,N要求的部分最简单是M,N都是标量,就是个数例如a(1,1) a(2,3)分别返回a矩阵1行1的单元 和 2行3的单元M,N还可以是矢量,例如a([1 2 3 4],[2 3]) 返回 1 2 3 4行 2 3 数据这里...
  • python 如何将一列数据中冒号后面的三个字符提出来并赋值到新的一列 例子如下 ```摘要 新增:大大大 CPU:e52620v3 新增:嘻嘻嘻 CPU:e52620v3 新增:不不不 CPU:e52620v3 新增:哈哈哈哈 CPU:e52620v3 ...
  • %% 其他加载数据的命令: load "data.dat" %字符转换: % % % % % % 1、cell2mat:将cell转换为mat的char型 % % % % % % 2、str2num:将matchar转换为double型 % % % % % % 3、cellstr:将char转cell...
  • 对DataFrame一列数据进行修改的方法

    万次阅读 多人点赞 2018-07-12 18:47:35
    下面介绍一种更改DataFrame一列数据的方法: 现将这一列数据通过列索引提取出来(此时提出来的部分为Series对象), 然后用map方法进行修改. (DataFrame的applymap方法用得还不熟, 等研究过了再试试有没有另一种...
  • DataTable dt = new DataTable(); dt.Columns.Add("id",typeof(Int32)); dt.Columns.Add("UserName", typeof(string)); dt.Columns.Add("UserPwd",typeof(string...select 方法能根据条件获取行 无法获取

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 229,854
精华内容 91,941
关键字:

从一列数据中提取数据