精华内容
下载资源
问答
  • Pandas是Python的数据分析利器,...本文将介绍创建Pandas DataFrame的6种方法。创建Pandas数据帧的六种方法如下:创建空DataFrame手工创建DataFrame使用List创建DataFrame使用Dict创建DataFrme使用Excel文件创...

    Pandas是Python的数据分析利器,DataFrame是Pandas进行数据分析的基本结构,可以把DataFrame视为一个二维数据表,每一行都表示一个数据记录。本文将介绍创建Pandas DataFrame的6种方法。

    创建Pandas数据帧的六种方法如下:

    • 创建空DataFrame
    • 手工创建DataFrame
    • 使用List创建DataFrame
    • 使用Dict创建DataFrme
    • 使用Excel文件创建DataFrame
    • 使用CSV文件创建DataFrame

    1、创建空的Pandas DataFrame

    学编程,上汇智网,在线编程环境,一对一助教指导。

    首先我们看一下如何创建一个空的DataFrame(数据帧):

    pd.DataFrame(columns=['A', 'B', 'C'], index=[0,1,2])

    columns参数用来定义列名,index参数用来定义行号。上面的代码创建了一个3行3列的二维数据表,结果看起来是这样:

    189fa6d5e11e597b0ade21c83211e66a.png

    嗯,所有数据项都是NaN。

    2、手工创建Pandas DataFrame

    接下来让我们看看如何使用pd.DataFrame手工创建一个Pandas数据帧:

    df = pd.DataFrame(data=['Apple','Banana','Cherry','Dates','Eggfruit'])

    使用data参数来声明数据,结果看起来是这样:

    67e4eafcb163cd025b4ad0173a8f88ed.png

    由于我们没有定义数据帧的列名,因此Pandas默认使用序号作为列名。和原来一样,可以使用columns参数来声明列名:

    df = pd.DataFrame(data=['Apple','Banana','Cherry','Dates', 'Eggfruit'], 
                      columns=['Fruits'])

    结果如下:

    ff3a2df788ac27be55d350b1c49d54f0.png

    最左侧的列被称为索引,默认从0开始,和原来一样我们用index自行定义:

    df = pd.DataFrame(data=['Apple','Banana','Cherry','Dates','Eggfruit'], 
                      index = [1,2,3,4,5],
                      columns=['Fruits'])

    现在的数据帧看起来是这样:

    76cb9477be78efb0fd5255dfda03c2dd.png

    那么如果要添加一个Quantity列来表示水果数量该怎么做?

    pd.DataFrame(data=[['Apple',5],
                       ['Banana',10],
                       ['Cherry',8],
                       ['Dates',3],
                       ['Eggfruit',7]],
                 columns = ['Fruits','Quantity'],
                 index=[1,2,3,4,5])

    注意data参数和colums参数都进行了相应的调整。现在的DataFrame这样:

    73d03173a805d512a743d096c5370a04.png

    3、使用列表创建Pandas DataFrame

    学编程,上汇智网,在线编程环境,一对一助教指导。

    假设我们有一个列表:

    fruits_list = ['Apple','Banana','Cherry','Dates','Eggfruit']

    要把列表转换为DataFrame,直接将列表传入pd.DataFrame即可:

    pd.DataFrame(fruits_list)

    得到的数据帧结构如下:

    191e11b5d1b0c7ddbe2b054bfa15e788.png

    当然你可以用columns参数来定义列名,或者用index来声明行号:

    pd.DataFrame(fruits_list, 
                 columns = ['Fruits'], 
                 index = ['a','b','c','d','e'])

    结果如下:

    7004d254a3c379c1cad880ad1a34aa82.png

    4、使用字典创建Pandas DataFrame

    字典就是一组键/值对:

    dict = {key1 : value1, key2 : value2, key3 : value3}

    当我们将上述字典对象转换为DataFrame时,看起来是这样:

    b88b26cdd354bc238674977b3b554f69.png

    容易注意到,字段的键对应成为DataFrame的列,而所有的值对应数据。 记住这个对应关系。

    现在假设我们要创建一个如下形状的DataFrame:

    304c81a70f6662123d16afaf42c5898c.png

    由于列名为Fruits、Quantity和Color,因此对应的字典也应当 有这几个键,而每一行的值则对应字典中的键值,字典应该是 如下的结构:

    fruits_dict = { 'Fruits':['Apple','Banana','Cherry','Dates','Eggfruit'],
                    'Quantity': [5, 10, 8, 3, 7],  
                    'Color': ['Red', 'Yellow', 'Red', 'Brown', 'Yellow']}

    现在让我们将这个字典转换为DataFrame,一句话的事儿:

    pd.DataFrame(fruits_dict)

    结果如下:

    48ae3ab7f1b0a924919d562219386574.png

    5、将Excel文件转换为Pandas DataFrame

    如果你有一个excel文件,例如“fruits.xlsx“…

    7578049133f5bd7da28cdfaa9d57fa3e.png

    那么可以使用下面的代码将其转换为Pandas DataFrame:

    fruits = pd.read_excel('fruits.xlsx')

    得到的数据帧看起来是这样:

    95380ab7ad47f7d3636f056bf89b8e81.png

    6、将CSV文件转换为Pandas DataFrame

    假设你有一个CSV文件,例如“fruits.csv“,可以使用如下的代码 将其转换为DataFrame:

    fruits = pd.read_csv('fruits.csv')

    也是一句话的事儿。


    原文链接:Pandas数据帧的6种创建方法 - 汇智网

    展开全文
  • 1创建 Pandas Series 1.1我们先在 Python 中导入 Pandas。 1.2我们先创建一个 Pandas Series。 1.3和 NumPy ndarray 一样,通过 Pandas Series 的一些属性,我们可以轻松地获取 series 中的信息。 1创建 ...

    目录

    1  创建 Pandas Series

    Pandas series 是一个像数组一样的一维对象,可以存储很多类型的数据,例如数字或字符串。
    Pandas Series 和 NumPy ndarray 之间的主要区别之一是你可以为 Pandas Series 中的每个元素分配索引标签。
    换句话说,你可以为 Pandas Series 索引指定任何名称。
    Pandas Series 和 NumPy ndarrays 之间的另一个明显区别是 Pandas Series 可以存储不同类型的数据。

    1.1  我们先在 Python 中导入 Pandas。

    通常,我们使用 pd 导入 Pandas。因此,你可以在 Jupyter Notebook 中输入以下命令,导入 Pandas:

    In [1]:

    import pandas as pd
    

    1.2  我们先创建一个 Pandas Series。

    你可以使用 pd.Series(data, index) 命令创建 Pandas Series,其中 index 是一个索引标签列表。我们使用 Pandas Series 存储一个购物清单。我们将使用食品条目作为索引标签,使用购买数量作为数据。

    In [2]:

    groceries = pd.Series(data=[30,6,'yes','no'], index = ['eggs','apples','milk','bread'])
    groceries
    

    Out[2]:

    eggs       30
    apples      6
    milk      yes
    bread      no
    dtype: object

    可以看出 Pandas Series 的显示方式为:第一列是索引,第二列是数据。注意,数据的索引不是从 0 到 3,而是采用我们设置的食品名称,即鸡蛋、苹果、等…此外注意,我们的 Pandas Series 中的数据既包括整数,又包括字符串。

    1.3  和 NumPy ndarray 一样,通过 Pandas Series 的一些属性,我们可以轻松地获取 series 中的信息。

    我们来看一些属性:

    In [3]:

    groceries.shape
    

    Out[3]:

    (4,)

    In [4]:

    groceries.ndim
    

    Out[4]:

    1

    In [5]:

    groceries.size
    

    Out[5]:

    4

    我们还可以单独输出 Pandas Series 的索引标签和数据。
    如果你不知道 Pandas Series 的索引标签是什么,这种方法就很有用。

    In [6]:

    groceries.index
    

    Out[6]:

    Index(['eggs', 'apples', 'milk', 'bread'], dtype='object')

    In [7]:

    groceries.values
    

    Out[7]:

    array([30, 6, 'yes', 'no'], dtype=object)

    如果你处理的是非常庞大的 Pandas Series,并且不清楚是否存在某个索引标签,可以使用 in 命令检查是否存在该标签:

    In [8]:

    'banana' in groceries
    

    Out[8]:

    False

    In [9]:

    'bread' in groceries
    

    Out[9]:

    True
    展开全文
  • Pandas是Python的数据分析利器,...本文将介绍创建Pandas DataFrame的6种方法。创建Pandas数据帧的六种方法如下:创建空DataFrame手工创建DataFrame使用List创建DataFrame使用Dict创建DataFrme使用Excel文件创...

    Pandas是Python的数据分析利器,DataFrame是Pandas进行数据分析的基本结构,可以把DataFrame视为一个二维数据表,每一行都表示一个数据记录。本文将介绍创建Pandas DataFrame的6种方法。

    创建Pandas数据帧的六种方法如下:

    • 创建空DataFrame
    • 手工创建DataFrame
    • 使用List创建DataFrame
    • 使用Dict创建DataFrme
    • 使用Excel文件创建DataFrame
    • 使用CSV文件创建DataFrame

    1、创建空的Pandas DataFrame

    学编程,上汇智网,在线编程环境,一对一助教指导。

    首先我们看一下如何创建一个空的DataFrame(数据帧):

    pd.DataFrame(columns=['A', 'B', 'C'], index=[0,1,2])

    columns参数用来定义列名,index参数用来定义行号。上面的代码创建了一个3行3列的二维数据表,结果看起来是这样:

    4f1f7adbbb2d9a8701835708960da7c4.png

    嗯,所有数据项都是NaN。

    2、手工创建Pandas DataFrame

    接下来让我们看看如何使用pd.DataFrame手工创建一个Pandas数据帧:

    df = pd.DataFrame(data=['Apple','Banana','Cherry','Dates','Eggfruit'])

    使用data参数来声明数据,结果看起来是这样:

    8cf38e66bb7a8cf73b4c4322f28b29b0.png

    由于我们没有定义数据帧的列名,因此Pandas默认使用序号作为列名。和原来一样,可以使用columns参数来声明列名:

    df = pd.DataFrame(data=['Apple','Banana','Cherry','Dates', 'Eggfruit'], 
                      columns=['Fruits'])

    结果如下:

    e620f4fb6458460d2692f2913171030e.png

    最左侧的列被称为索引,默认从0开始,和原来一样我们用index自行定义:

    df = pd.DataFrame(data=['Apple','Banana','Cherry','Dates','Eggfruit'], 
                      index = [1,2,3,4,5],
                      columns=['Fruits'])

    现在的数据帧看起来是这样:

    5002df0cea7f1c257c62fe1ec9aeb1fc.png

    那么如果要添加一个Quantity列来表示水果数量该怎么做?

    pd.DataFrame(data=[['Apple',5],
                       ['Banana',10],
                       ['Cherry',8],
                       ['Dates',3],
                       ['Eggfruit',7]],
                 columns = ['Fruits','Quantity'],
                 index=[1,2,3,4,5])

    注意data参数和colums参数都进行了相应的调整。现在的DataFrame这样:

    dcc105f57dbf62ce284aaf7a016681f5.png

    3、使用列表创建Pandas DataFrame

    学编程,上汇智网,在线编程环境,一对一助教指导。

    假设我们有一个列表:

    fruits_list = ['Apple','Banana','Cherry','Dates','Eggfruit']

    要把列表转换为DataFrame,直接将列表传入pd.DataFrame即可:

    pd.DataFrame(fruits_list)

    得到的数据帧结构如下:

    236d75013bac44c372a408d195c43f9a.png

    当然你可以用columns参数来定义列名,或者用index来声明行号:

    pd.DataFrame(fruits_list, 
                 columns = ['Fruits'], 
                 index = ['a','b','c','d','e'])

    结果如下:

    db2fd873bc127a34735b36a4c77eb097.png

    4、使用字典创建Pandas DataFrame

    字典就是一组键/值对:

    dict = {key1 : value1, key2 : value2, key3 : value3}

    当我们将上述字典对象转换为DataFrame时,看起来是这样:

    168d1f1bdf31c40941cbab516043b98e.png

    容易注意到,字段的键对应成为DataFrame的列,而所有的值对应数据。 记住这个对应关系。

    现在假设我们要创建一个如下形状的DataFrame:

    7e90a061dcb623cd98e060b7571a1b59.png

    由于列名为Fruits、Quantity和Color,因此对应的字典也应当 有这几个键,而每一行的值则对应字典中的键值,字典应该是 如下的结构:

    fruits_dict = { 'Fruits':['Apple','Banana','Cherry','Dates','Eggfruit'],
                    'Quantity': [5, 10, 8, 3, 7],  
                    'Color': ['Red', 'Yellow', 'Red', 'Brown', 'Yellow']}

    现在让我们将这个字典转换为DataFrame,一句话的事儿:

    pd.DataFrame(fruits_dict)

    结果如下:

    50af0086b2ff11bfc0464aeeaec83548.png

    5、将Excel文件转换为Pandas DataFrame

    如果你有一个excel文件,例如“fruits.xlsx“…

    f435f73dfb9ce0699fe06a617759e7ea.png

    那么可以使用下面的代码将其转换为Pandas DataFrame:

    fruits = pd.read_excel('fruits.xlsx')

    得到的数据帧看起来是这样:

    a89d71b149731f42e14fcf7c1c09f193.png

    6、将CSV文件转换为Pandas DataFrame

    假设你有一个CSV文件,例如“fruits.csv“,可以使用如下的代码 将其转换为DataFrame:

    fruits = pd.read_csv('fruits.csv')

    也是一句话的事儿。


    原文链接:Pandas数据帧的6种创建方法 - 汇智网

    展开全文
  • 主要介绍了从列表或字典创建Pandas的DataFrame对象的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  • 创建pandas的DataFrame对象的5种方法 Pandas的DataFrame对象可以通过许多方式创建,这里举几个常用的例子。 通过Series对象创建 #1、通过单个Series对象创建。DataFrame是一组Series对象的集合,可以用单个...

    创建pandas的DataFrame对象的5种方法

    Pandas的DataFrame对象可以通过许多方式创建,这里举几个常用的例子。

    通过Series对象创建

    #1、通过单个Series对象创建。DataFrame是一组Series对象的集合,可以用单个Series创建一个单列的DataFrame
    import pandas as pd
    import numpy as np
    #先创建一个Series对象
    area = pd.Series({'California': 423967, 'Texas': 695662,
                      'New York': 141297, 'Florida': 170312,
                      'Illinois': 149995})
    #创建单列的DataFrame对象
    pd.DataFrame(area,columns=['area'])
    
    #输出如下:
                  area
    California  423967
    Texas       695662
    New York    141297
    Florida     170312
    Illinois    149995
    #2、通过多个Series对象的字典创建DataFrame对象
    #另外创建一个Series对象
    pop = pd.Series({'California': 38332521, 'Texas': 26448193,
                     'New York': 19651127, 'Florida': 19552860,
                     'Illinois': 12882135})
    #使用字Series对象字典方式创建DataFrame对象
    pd.DataFrame({'area':area, 'population':pop})
    
    #输出如下:
                  area  population
    California  423967    38332521
    Texas       695662    26448193
    New York    141297    19651127
    Florida     170312    19552860
    Illinois    149995    12882135

    使用字典列表创建

    #所有元素都是字典的列表可以变成DataFrame
    #创建一个元素为字典的列表
    data = [{'a':i, 'b': 2*i} for i in range(10)]
    #通过字典列表创建DataFrame
    pd.DataFrame(data)
    
    #输出如下:
       a   b
    0  0   0
    1  1   2
    2  2   4
    3  3   6
    4  4   8
    5  5  10
    6  6  12
    7  7  14
    8  8  16
    9  9  18

    通过Numpy二维数组创建

    #假入有一个二维数组,就可以创建一个可以指定行列索引值的DataFrame
    #创建一个numpy二维数组
    np.random.seed(0)
    a =np.random.randint(1,10,(3,2))
    #基于a数组建立DataFrame
    pd.DataFrame(a,columns=['foo', 'bar'],index=['a','b', 'c'])
    
    #输出如下:
       foo  bar
    a    6    1
    b    4    4
    c    8    4
    
    #假如不指定行列索引,那么行列默认都是整数索引值
    pd.DataFrame(a)
    
    #输出如下:
       0  1
    0  6  1
    1  4  4
    2  8  4
    展开全文
  • 介绍每当我使用pandas进行分析时,我的第一个目标是使用众多可用选项中的一个将数据导入Pandas的DataFrame 。对于绝大多数情况下,我使用的 read_excel , read_csv 或 read_sql 。但是,有些情况下我只需要几行数据...
  • 介绍每当我使用pandas进行分析时,我的第一个目标是使用众多可用选项中的一个将数据导入Pandas的DataFrame 。对于绝大多数情况下,我使用的 read_excel , read_csv 或 read_sql 。但是,有些情况下我只需要几行数据...
  • Pandas创建系列的方法有很多,但是,我们将以这两种方式进行练习: ——使用ndarray或numpy数组 ——使用Python字典 在本熊猫系列教程结束时,我确定您可以在系列上创建并执行任何任务。配套课程请点击这里: #...
  • name:stringSQL表的名称。con:sqlalchemy.engine.Engine或sqlite3.Connection使用SQLAlchemy可以使用该库支持的任何数据库。为sqlite3.Connection对象提供了旧版支持。schema:string,optional指定架构(如果...
  • 用Python的字典创建一个DataFrame 输出结果:字典的键是DataFrame的columns,index是range(0,3) 用Series创建DataFrame 输出结果:注意DataFrame的columns为数字,index为数字   用Series创建DataFrame...
  • 每当我使用pandas进行分析时,我的第一个目标是使用众多可用选项中的一个将数据导入Pandas的DataFrame 。 对于绝大多数情况下,我使用的 read_excel , read_csv 或 read_sql 。 但是,有些情况下我只需要几行数据或...
  • 从今天起,开启一个有关用 Python 做数据分析的 tricks 系列,致力于分享一些高效实用的小技巧,进一步了解那些你所熟知的库(Pandas、NumPy 等),也会分享一些冷门但好用的 Python 库,来帮你节省数据分析过程中写...
  • Pandas基础2 数据框体Dataframe的基本使用2.1 用 Dict创建 DataFrame2.2 用 CSV文件创建 DataFrame2.3 DataFrame的行列式访问2.4 DataFrame的常规操作(筛选,组合筛选)2.5 DataFrame的索引 Index 注:以下使用 ...
  • 从今天起,开启一个有关用 Python 做数据分析的 tricks 系列,致力于分享一些高效实用的小技巧,进一步了解那些你所熟知的库(Pandas、NumPy 等),也会分享一些冷门但好用的 Python 库,来帮你节省数据分析过程中写...
  • pandas创建Series

    2019-05-22 14:23:49
    如何创建Series对象 常见的创建Pandas对象的方式,都像这样的形式: pd.Series(data, index=index)1 其中,index是一个可选参数...
  • Pandas是Python的数据分析利器,...本文将介绍创建Pandas DataFrame的6种方法。创建Pandas数据帧的六种方法如下:创建空DataFrame手工创建DataFrame使用List创建DataFrame使用Dict创建DataFrme使用Excel文件创...
  • 创建pandas的DataFrame对象的5种方法 Pandas的DataFrame对象可以通过许多方式创建,举几个常用的例子。 通过Series对象创建 #1、通过单个Series对象创建。DataFrame是一组Series对象的集合,可以用单个Series创建...
  • Pandas DataFrame的6种创建方法

    千次阅读 2019-09-17 09:08:31
    Pandas是Python的数据分析利器,DataFrame...本文将介绍创建Pandas DataFrame的6种方法。 创建Pandas数据帧的六种方法如下: 创建空DataFrame 手工创建DataFrame 使用List创建DataFrame 使用Dict创建DataFrme 使用E...
  • 使用pandas之前要导入包: import numpy as np import pandas as pd ...一、dataframe创建 pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) data:numpy...
  • pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和...
  • Pandas的创建以及数据...通过pd.Series()列表创建pandas.core.series.Series s1 = pd.Series(['3','6','10','21'],index=['A','B','C','D']) s1 A 3 B 6 C 10 D 21 dtype: object #2.通过pd.Series()及...
  • pandas入门

    2019-01-08 18:02:27
    目录 ...创建 Pandas Series 访问和删除 Pandas Series 中的元素 对 Pandas Series 执行算术运算 创建 Pandas DataFrame 使用Pandas Series 字典创建 DataFrame 使用列表(数组)字典创建 Dat...
  • 参考链接: 创建Pandas Series 文章目录 1.什么是pandas2.查看pandas版本信息3.常见数据类型4.pandas创建Series数据类型对象1). 通过列表创建Series对象2). 通过numpy的对象Ndarray创建Series;3). 通过字典创建...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 10,953
精华内容 4,381
关键字:

创建pandas