精华内容
下载资源
问答
  • 想问一下类似菜鸟工具这样的在线Python编译网站,为什么import pandas时老是报错“no module name 'pandas' ”?应该怎么导入呢?可以推荐一下可以导入pandasnumpy模块的线上编程网站吗?
  • 最近在学习numpy,书上要求安装一个Ipythpn,可以自动导入Numpy,pandas等数据分析的模块,可是当我安装后,并不能自动导入numpy模块,还需要自己import。我就去查了一下ipython的官方文档。 Introduction to IPython...

    一、引言

    最近在学习numpy,书上要求安装一个Ipythpn,可以自动导入Numpy,pandas等数据分析的模块,可是当我安装后,并不能自动导入numpy模块,还需要自己import。我就去查了一下ipython的官方文档。

    Introduction to IPython configuration(Ipython配置说明):http://ipython.org/ipython-doc/stable/config/intro.html

    二、创建配置文件

    1.打开命令行工具:如果省略配置文件名称,将为配置文件创建 default文件。这些文件位于~/.ipython/profile_default/,(~为Home目录,Windows就是自己的用户目录)并且被命名 ipython_config.py

    ipython profile create [profilename]
    

    2.到刚刚创建的配置文件 目录,编辑ipython_config.py。

    ## lines of code to run at IPython startup.
    #c.InteractiveShellApp.exec_lines = []

    将上面修改为:

    ## lines of code to run at IPython startup.
    c.InteractiveShellApp.exec_lines = ['import numpy as np']

    或者:from numpy import *   这样可以直接使用numpy里面的函数,比如arange(),而不需要np.arange()

    3.重新进入ipython,就可以自动导入Numpy并直接使用了。

    转载于:https://www.cnblogs.com/luhuan/p/7878962.html

    展开全文
  • python学习笔记之pandas导入numpy数组 新手楼主前几天用pandas将CSV文件导入numpy数组的时候,遇到了一个问题,每次首行都会被去掉,后来发现是一个常识性的问题,首行会作为表头不被导入数组,CSV文件如下: 代码...

    python学习笔记之pandas导入numpy数组

    新手楼主前几天用pandas将CSV文件导入numpy数组的时候,遇到了一个问题,每次首行都会被去掉,后来发现是一个常识性的问题,首行会作为表头不被导入数组,CSV文件如下:

    5X5
    代码如下:

    import numpy as np
    import pandas as pd
    
    xxx= pd.read_csv("1234.csv")
    zzz = x.loc[:, :].to_numpy()
    print(zzz)
    

    结果如图:
    变成了4X5的数组
    为CSV添加表头(首行)之后如下:
    在这里插入图片描述
    新手学习不易,希望能帮到跟我一样被困扰的人。

    展开全文
  • import pandas as pd data = pd.read_csv('student.csv') print(data) 输出: ID Name Age Gender 0 1000 Dick 20 Male 1 1001 Kelly 21 Female 2 1002 Sasha 19 Female 3 1003 Tom 21 Male 4 10...

    使用read_csv来读取csv文件

    例:

    import pandas as pd
    data = pd.read_csv('student.csv')
    print(data)

    输出:

         ID      Name  Age  Gender
    0  1000      Dick   20    Male
    1  1001     Kelly   21  Female
    2  1002     Sasha   19  Female
    3  1003       Tom   21    Male
    4  1004  Michelle   20  Female

     

    使用data.to_pickle来存储文件

    例:

    data.to_pickle('student.pickle')

    展开全文
  • 大多数情况下,都是用 NumpyPandas 导入数据。 一、文本文件 1、纯文本文件 filename = 'test.txt' file = open(filename, mode='r') # 以只读方式读取文件 text = file.read() # 读取文件内容 print(file....

    大多数情况下,都是用 Numpy 或 Pandas 导入数据。

    Pandas 数据框:

    • df.head()   # 返回数据框的前几行,默认为5行
    • df.tail()   # 返回数据框的后几行,默认为5行
    • df.index    # 查看数据框的索引
    • df.columns  # 查看数据框的列名
    • df.info()   # 查看数据框各列的信息
    • data_array = data.values  # 将数据框转换为 Numpy 数组

    Numpy 数组:

    • data_array.dtype  # 查看数组元素的数据类型
    • data_array.shape  # 查看数组维度

    一、文本文件

    1、纯文本文件

    filename = 'test.txt'
    file = open(filename, mode='r')  # 以只读方式读取文件
    text = file.read()               # 读取文件内容
    print(file.closed)               # 查看文件是否已经关闭
    file.close()                     # 关闭文件
    print(text)# 关闭已经文件

    使用上下文管理器 with:

    with open('test.txt', mode='r') as file:
        print(file.readline())  # 读取一行
        print(file.closed)  # 查看文件是否已经关闭
    print(file.closed)      # 关闭已经文件

    2、表格数据:文本文件

    (1)用 Numpy 导入文本文件

    (a)单数据类型文件

    import numpy as np
    
    filename = 'iris.txt'
    data = np.loadtxt(filename, 
                      delimiter=',',   # 用于分割各列值的字符
                      skiprows=2,      # 跳过前两行
                      usecols=[0, 2],  # 读取并使用第1列和第3列
                      dtype=str)       # 使用的数据类型
    print(data)

    (b)多数据类型文件

    import numpy as np
    
    filename = 'iris.csv'
    # read the first 4 columns
    data = np.genfromtxt(filename, 
                         delimiter=',', 
                         names=True,            # 导入时查找列名
                         usecols=(0, 1, 2, 3))  # 读前四列
    print(data.dtype)  # [('sepal_length', '<f8'), ('sepal_width', '<f8'), ('petal_length', '<f8'), ('petal_width', '<f8')]
    # read the fifth column
    target = np.genfromtxt(filename, delimiter=',', usecols=(4, ), dtype=str)
    np.recfromcsv() 函数的 dtype 默认值为 None。
    
    data_array = np.recfromcsv(filename)

    (2)用 Pandas 导入文本文件

    filename = 'iris.csv'
    data = pd.read_csv(filename,
                       nrows=3,         # 读取的行数
                       header=0,        # 用哪一行做列名
                       sep=',',         # 用于分隔各列的字符
                       comment='#',     # 用于分割注释的字符
                       na_values=[""])  # 读取时,哪些值为NA / NaN
    print(data)
    #    sepal_length  sepal_width  petal_length  petal_width species
    # 0           5.1          3.5           1.4          0.2  setosa
    # 1           4.9          3.0           1.4          0.2  setosa
    # 2           4.7          3.2           1.3          0.2  setosa

    二、Excel表

    file = 'iris.xlsx'
    data = pd.ExcelFile(file)
    print(data.sheet_names)  # 使用sheet_names属性访问表单名称['iris', 'test']
    df_sheet1 = data.parse('iris',          # sheet名字
                           nrows=3,         # 读取的行数
                           skiprows=[0],
                           names=['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'species'])
    df_sheet2 = data.parse(1,               # # sheet序号
                           parse_cols=[0],
                           skiprows=[0])
    print(df_sheet1)
    #    sepal_length  sepal_width  petal_length  petal_width species
    # 0           4.9          3.0           1.4          0.2  setosa
    # 1           4.7          3.2           1.3          0.2  setosa
    # 2           4.6          3.1           1.5          0.2  setosa
    print(df_sheet2)
    #    1   wang   121424
    # 0  2     li  e341515
    # 1  3  zhang    53515
    # 2  4   tang   532525

    四、Pickled 文件

    import pickle
    
    in_data = [1, 3, 5, 7, 9]
    output_file = open("test.pkl", 'wb')
    pickle.dump(in_data, output_file)
    output_file.close()
    
    input_file = open("test.pkl", 'rb')
    out_data = pickle.load(input_file)
    print(out_data)  # [1, 3, 5, 7, 9]
    # 使用上下文管理器 with:
    with open('test.pkl', 'rb') as input_file:
        pickled_data = pickle.load(input_file)
        print(out_data)

    五、HDF5 文件

    import h5py
    filename = 'test.hdf5'
    data = h5py.File(filename, 'r')

    六、Matlab 文件

    import scipy.io
    filename = 'workspace.mat'
    mat = scipy.io.loadmat(filename)

    七、SAS 文件

    from sas7bdat import SAS7BDAT
    with SAS7BDAT('test.sas7bdat') as file:
        df_sas = file.to_data_frame()

    八、Stata 文件

    data = pd.read_stata('urbanpop.dta')

    九、关系型数据库文件

    from sqlalchemy import create_engine
    engine = create_engine('sqlite://Northwind.sqlite')
    table_names = engine.table_names()

    查询关系型数据库

    con = engine.connect()
    rs = con.execute("SELECT * FROM Orders")
    df = pd.DataFrame(rs.fetchall())
    df.columns = rs.keys()
    con.close()
    
    # 使用上下文管理器
    with engine.connect() as con:
        rs = con.execute("SELECT OrderID FROM Orders")
        df = pd.DataFrame(rs.fetchmany(size=5))
        df.columns = rs.keys()

    使用Pandas 查询关系型数据库
     

    df = pd.read_sql_query("SELECT * FROM Orders", engine)

    摘自DataCamp
    Learn Python for Data Science Interactively

    展开全文
  • 吴恩达机器学习笔记——踩了最多坑的Pycharm 导入numpy,pandas和matplotlib 在用python学习吴恩达的机器学习中(https://www.kesci.com/home/column/5dd7524c83b6ff002c786fff),ex1需要导入numpy,pandas,...
  • numpy pandas 学习

    2019-10-06 23:38:35
    数组比列表效率高很多 numpy高效的处理数据,提供数组的支持,python默认没有数组。pandas、scipy、matplotlib都依赖numpypandas主要用于数据挖掘,探索,分析 maiplotlib用于作图,可视化 scipy进行数值计算...
  • 使用pandas中的 read_csv 函数读取文件,其中csv为文件格式(后缀名) 使用pandas中的 to_pickle 函数存储文件,其中 pickle为...import numpy as np import pandas as pd data = pd.read_csv('student.csv') pr...
  • 在上文中,我们已配置好了Anaconda,由于Anaconda自带Python,因此Python的环境也一并配置完成了,是不是特别方便?!由于Mac本身自带的事python2.7版本... 接下来,我们就要开始安装pandasnumpy库。在下一章,我...
  • 文章目录前言用于导入导出数据的函数 前言 根据 莫烦Python的教程 总结写成,以便自己复习和使用,这里我就不哟林地挂原创了????。 用于导入导出数据的函数 read_csv read_pickle read_excel to_csv to_pickle to__...
  • pandasnumpy因为版本问题导入失败

    千次阅读 2020-03-26 19:55:01
    第一次写博客import pandas 错误第一个错误:第二个错误第三个错误功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容...
  • 在使用python语言中的pandas模块和numpy模块时,可以使用切片进行显示,还可以使用concat()方法进行拼接。...导入numpy模块和pandas模块,然后调用DataFrame()方法创建一个矩阵,如下图所示:2第二步,调用...
  • import pandas as pd data = pd.read_excel('1.xlsx') 导入excel文件 print(data) data.to_pickle('student.pick') 导出文件 有好多保存文件的形式,可以参考菜鸟教程
  • 可安装集成环境anaconda,anaconda集成了numpy,scipy,ipython,scikit-learn,matplotlib等机器学习所有的库。将其安装目录site-package下相对应的两个包复制到pycharm的site-package下即可。 方法二 用pycharm的...
  • pandasnumpy 谁是目标受众? (Who are the targeted audience?) This tutorial has been prepared for those who want to learn about the basics of NumPy, Pandas and Sklearn. It is specifically useful for ...
  • 包括 Python基Numpy础入门、文件导入NumpyPandas、Sklearn、Scipy、spaCy、matplotlib、keras等。
  • Numpy&Pandas

    2020-12-26 20:29:45
    一、Numpy numpy是以矩阵为基础的数学计算模块,提供高性能的矩阵运算,...首先在使用前要导入该模块(导入安装,方法自行搜索吧(*^-^*)),代码如下: import numpy as np 1. 通过原有列表转化为数组 2.
  • 代填的坑 如何把路径变成可输入的 解决增加列部分的疑问 ...1、导入库 import pandas as pd import numpy as np import xlwt import xlrd 2、读Excel文件内容 # 读 df1 = pd.DataFrame(pd.read_excel
  • python 科学计算环境配置,pandas,numpy
  • 转载请注明作者(独孤尚良...打开arcmap的python窗口,试着导入pandas,如下图: 这表明pandas这个模块没有被找到。 我曾多次尝试把anaconda和arcgis联系在一起。找了好多blog,做了好多尝试,遇到...
  • 昨天更新了pandas,今天在导入pandas时报错 ImportError: cannot import name ‘add_newdocs’ 网上查询说是很有可能是使用了anaconda作为开发环境后却自己卸载了anaconda自带的numpy,并且用pip重新安装了一个。 ...
  • numpypandas的区别 numpy:数值型,无索引,重点在于进行矩阵运算 pandas:多数据类型,有索引,重点在于进行数据分析 一、pandas 的基本用法 s = pd.Series([1,3,6,np.nan,44,1]) print(s) dates = pd.date_...
  • import numpy as np #loadtxt方法 ar2=np.loadtxt(r'J:\chapter2\numpy_data.txt' ,dtype='float32' ,delimiter=' ') #delimiter指定分隔符#默认为float64 ar2
  • ==================================== eval函数就是实现list、dict、tuple与str之间的转化。 str函数把list,dict,tuple转为为字符串。 # 字符串转换成列表 a = "[[1,2], [3,4], [5,6], [7,8]...
  • python pandas numpy matplotlib 常用方法及函数  转载▼ import numpy as np import pandas as pd import matplotlib.pyplot as plt ---------------numpy----------------------- arr = np.array...
  • python安装numpypandas

    2019-12-14 00:55:29
     最近对一系列数据做同比比较,需要用到numpypandas来计算,不过使用python安装numpypandas因为linux环境没有外网遇到了很多问题就记下来了。首要条件,python版本必须是2.7以上。 linux首先安装依赖包 yum -...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 29,237
精华内容 11,694
关键字:

导入pandas之前要导入numpy