精华内容
下载资源
问答
  • Python数据分析实例

    万次阅读 多人点赞 2019-06-14 22:13:37
    Python数据分析 Python爬取网页数据

    Python数据分析

    Python爬取网页数据

    // An highlighted block
    import requests
    if __name__=="__main__":
        response = requests.get("https://book.douban.com/subject/26986954/")
        content = response.content.decode("utf-8")
        print(content)
    
    // An highlighted block
    import requests
    url="https://pro.jd.com/mall/active/4BNKTNkRMHJ48QQ5LrUf6AsydtZ6/index.html"
    try:
        r=requests.get(url)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        print(r.text[:100])
    except:
        print("爬取失败")
    

    Python生成柱状图

    // An highlighted block
    import matplotlib.pyplot as plt  
      
    num_list = [1.5,0.6,7.8,6]  
    plt.bar(range(len(num_list)), num_list,color='rbgy')  
    plt.show()  
    

    在这里插入图片描述
    Python生成堆状柱状图

    // An highlighted block
    import matplotlib.pyplot as plt  
      
    name_list = ['Monday','Tuesday','Friday','Sunday']  
    num_list = [1.5,0.6,7.8,6]  
    num_list1 = [1,2,3,1]  
    plt.bar(range(len(num_list)), num_list, label='boy',fc = 'y')  
    plt.bar(range(len(num_list)), num_list1, bottom=num_list, label='girl',tick_label = name_list,fc = 'r')  
    plt.legend()  
    plt.show()  
    

    在这里插入图片描述
    Python生成竖状柱状图

    // An highlighted block
    import matplotlib.pyplot as plt  
      
    name_list = ['Monday','Tuesday','Friday','Sunday']  
    num_list = [1.5,0.6,7.8,6]  
    num_list1 = [1,2,3,1]  
    x =list(range(len(num_list)))  
    total_width, n = 0.8, 2  
    width = total_width / n  
      
    plt.bar(x, num_list, width=width, label='boy',fc = 'y')  
    for i in range(len(x)):  
        x[i] = x[i] + width  
    plt.bar(x, num_list1, width=width, label='girl',tick_label = name_list,fc = 'r')  
    plt.legend()  
    plt.show()  
    

    在这里插入图片描述
    Python生成折线图

    // An highlighted block
    import pandas as pd
    import numpy as np
     
    df = pd.DataFrame(np.random.rand(15, 4), columns=['a', 'b', 'c', 'd'])
    df.plot.area() 
    

    在这里插入图片描述
    Python生成柱状图

    // An highlighted block
    import pandas as pd
    import numpy as np
     
    df = pd.DataFrame(3 * np.random.rand(5), index=['a', 'b', 'c', 'd','e'], columns=['x'])
    df.plot.pie(subplots=True)
    

    在这里插入图片描述
    Python生成箱型图

    // An highlighted block
    #首先导入基本的绘图包
    import matplotlib.pyplot as plt
    import numpy as np
    import pandas as pd
    
    #添加成绩表
    plt.style.use("ggplot")
    plt.rcParams['axes.unicode_minus'] = False
    plt.rcParams['font.sans-serif']=['SimHei'] 
    
    #新建一个空的DataFrame
    df=pd.DataFrame()
    
    // An highlighted block
    df["英语"]=[76,90,97,71,70,93,86,83,78,85,81]
    df["经济数学"]=[65,95,51,74,78,63,91,82,75,71,55]
    df["西方经济学"]=[93,81,76,88,66,79,83,92,78,86,78]
    df["计算机应用基础"]=[85,78,81,95,70,67,82,72,80,81,77]
    df
    
    // An highlighted block
    plt.boxplot(x=df.values,labels=df.columns,whis=1.5)
    plt.show()
    

    在这里插入图片描述

    // An highlighted block
    #用pandas自带的画图工具更快
    df.boxplot()
    plt.show()
    

    在这里插入图片描述
    Python生成正态分布图

    // An highlighted block
    # -*- coding:utf-8 -*-
    # Python实现正态分布
    # 绘制正态分布概率密度函数
    import numpy as np
    import matplotlib.pyplot as plt
    import math
    
    u = 0  # 均值μ
    u01 = -2
    sig = math.sqrt(0.2)  # 标准差δ
    
    x = np.linspace(u - 3 * sig, u + 3 * sig, 50)
    y_sig = np.exp(-(x - u) ** 2 / (2 * sig ** 2)) / (math.sqrt(2 * math.pi) * sig)
    print(x)
    print("=" * 20)
    print(y_sig)
    plt.plot(x, y_sig, "r-", linewidth=2)
    plt.grid(True)
    plt.show()
    

    在这里插入图片描述
    喜欢的小伙伴可以尝试一下哦

    这是小编公众号,请动动您可爱的小手手,关注一下💓😘
    在这里插入图片描述

    展开全文
  • 实例内容来自《利用python进行数据分析》。 本文中可能使用的数据集来自:《利用python进行数据分析》数据集。 MovieLens 1M数据集 由GroupLens实验室从MoviesLens收集,内容是20世纪90年代末带21世纪初的电影评分...
  • 1.获取数据:想要获得道指30只成分股的最新股价importrequestsimportreimportpandas as pddefretrieve_dji_list():try:r= requests.get('https://money.cnn.com/data/dow30/')exceptConnectionError as err:print(err...

    1.获取数据:

    想要获得道指30只成分股的最新股价

    importrequestsimportreimportpandas as pddefretrieve_dji_list():try:

    r= requests.get('https://money.cnn.com/data/dow30/')exceptConnectionError as err:print(err)

    search_pattern= re.compile('class="wsod_symbol">(.*?).*?(.*?).*? .*?class="wsod_stream">(.*?)')

    dji_list_in_text=re.findall(search_pattern, r.text)

    dji_list=[]for item indji_list_in_text:

    dji_list.append([item[0], item[1], float(item[2])])returndji_list

    dji_list=retrieve_dji_list()

    djidf=pd.DataFrame(dji_list)print(djidf)

    整理数据, 改变列名, index等

    cols=['code','name','lasttrade']

    djidf.columns=cols #改变列名

    djidf.index=range(1,len(djidf)+1)

    最后结果为:

    1307805-20181127182817690-1698626124.png

    数据的选择

    djidf.code #获取code列+index

    djidf['code'] #获取code列 , 两者同功能

    djidf.loc[1:5,] #前5行

    djidf.loc[:,['code','lasttrade']] #所有行

    djidf.loc[1:5,['code','lasttrade']] #1-5行, loc表示标签index

    djidf.loc[1,['code','lasttrade']] #1行

    djidf.at[1,'lasttrade'] #只有一个值的时候可以用at

    djidf.iloc[2:4,[0,2]] #表示物理文职, 并且4取不到, 就只有第三行第四行

    djidf.iat[1,2] #单个值

    简单的数据筛选: 平均股价, 股价大于180的公司名

    djidf.lasttrade.mean() # 121.132

    djidf[djidf.lasttrade>=180].name

    1307805-20181127183508844-463758911.png

    找到股价前三名的公司 , 降序排列

    tempdf=djidf.sort_values(by='lasttrade',ascending=False)

    tempdf[:3].name

    如何根据index排序呢? 专门有函数sort_index()

    df=pd.DataFrame(np.random.randn(3,3),index=['c','b','a'],columns=list('xyz'))

    df.sort_index()#根据index 进行排序

    *获取AXP公司过去一年的股价数据获取

    importrequestsimportreimportjsonimportpandas as pdfrom datetime importdatedefretrieve_quotes_historical(stock_code):

    quotes=[]

    url= 'https://finance.yahoo.com/quote/%s/history?p=%s' %(stock_code, stock_code)try:

    r=requests.get(url)exceptConnectionError as err:print(err)

    m= re.findall('"HistoricalPriceStore":{"prices":(.*?),"isPending"', r.text)ifm:

    quotes= json.loads(m[0]) #m = ['[{...},{...},...]']

    quotes = quotes[::-1] #原先数据为date最新的在最前面

    return [item for item in quotes if not 'type' initem]

    quotes= retrieve_quotes_historical('AXP')

    list1=[]for i inrange(len(quotes)):

    x=date.fromtimestamp(quotes[i]['date'])

    y=date.strftime(x,'%Y-%m-%d')

    list1.append(y)

    quotesdf_ori=pd.DataFrame(quotes,index=list1)

    quotesdf_m= quotesdf_ori.drop(['adjclose'], axis = 1) #删除adjclose列

    quotesdf=quotesdf_m.drop(['date'],axis=1)print(quotesdf)

    上述需要对时间进行处理, 将时间转为'%Y-%m-%d'的格式, 并且将这个时间作为一个list 成为quotesdf的index.

    1307805-20181127183312427-898004346.png

    数据的筛选

    quotesdf[(quotesdf.index>='2017-03-01') & (quotesdf.index<='2017-03-31')]

    quotesdf[(quotesdf.index>='2017-11-30') & (quotesdf.index<='2018-03-31')&(quotesdf.close>=90)]

    简单计算

    (1) 统计AXP股价涨跌的天数 (close>open)

    len(quotesdf.close>quotesdf.open)

    (2) 相邻两天的涨跌

    importnumpy as np

    status=np.sign(np.diff(quotesdf.close))

    status#250 的长度, 比quotesdf 少1

    status[np.where(status==1)].size #np.where(status==1)是由下标构成的array#

    上述统计还可以直接用describe函数, 得到基本统计信息

    importpandas as pdimportnumpy as np

    index_df= pd.DataFrame(np.random.rand(3,3), index=['a','b','c'], columns=['index_1','index_2','index_3'])

    index_df.describe()#超级强大

    1307805-20181127183825487-363916830.png

    (3) 统计2018一月的交易日天数

    t=quotesdf[(quotesdf.index>='2018-01-01') & (quotesdf.index<'2018-02-01')]

    len(t) #21

    进一步, 如何统计近一年每个月的交易日天数?

    统计每个月的出现天数就行了, 如何提取月份信息? 要把时间的字符串转化为 时间格式,

    importtime

    list2=[]for i inrange(len(quotesdf)):

    temp=time.strptime(quotesdf.index[i],'%Y-%m-%d')

    list2.append(temp.tm_mon)#取月份

    tempdf=quotesdf.copy()

    tempdf['month']=list2 #新增一列月份的数据

    print(tempdf['month'].value_counts()) #计算每个月的出现次数

    注意:

    strptime 将字符串格式化为time结构, time 中会包含年份, 月份等信息

    strftime 将time 结构格式化一个字符串, 之前生成quotesdf中用到过

    上述方法略微麻烦, 如何快速知道每个月的交易日天数? groupby

    #统计每一月的股票开盘天数

    x=tempdf.groupby('month').count()#统计近一年每个月的成交量

    tempdf.groupby('month').sum().volume#先每个月进行求和, 但是这些对其他列也进行了求和, 属于无效计算, 如何避免?

    tempdf.groupby('month').volume.sum() #交换顺序即可

    引申: 一般groupby 与apply 在一起用. 具体不展开了

    deff(df):returndf.age.count()

    data_df.groupby('taste of mooncake').apply(f)

    (二) 合并DataFrame: append, concat, join

    #append

    p=quotesdf[:2]

    q=quotesdf['2018-01-01':'2018-01-05']

    p.append(q)#concat

    pieces=[tempdf[:5],tempdf[len(tempdf)-5:]]

    pd.concat(pieces)

    两个结构不同的DataFrame 如何合并?

    piece1=quotesdf[0:3]

    piece2=tempdf[:3]

    pd.concat([piece1,piece2],ignore_index=True)

    piece2有month 但是piece1中没有这个字段

    1307805-20181127184912238-642375928.png

    join函数中的各种参数, 可以用来实现SQL的各种合并功能.

    #join 两个dataframe要有共同的字段(列名)#djidf: code/name#AKdf: volume/code/month#合并之后的字段: code/name/volume/month

    pd.merge(djidf.drop(['lasttrade'],axis=1),AKdf, on='code')

    展开全文
  • Python进行数据分析的好处是,它的数据分析库目前已经很全面了,有NumPy、pandas、SciPy、scikit-learn、StatsModels,还有深度学习、神经网络的各类包。基本上能满足大部分的企业应用。用Python的好处是从数据...

    用Python进行数据分析的好处是,它的数据分析库目前已经很全面了,有NumPy、pandas、SciPy、scikit-learn、StatsModels,还有深度学习、神经网络的各类包。基本上能满足大部分的企业应用。用Python的好处是从数据抽取、数据收集整理、数据分析挖掘、数据展示,都可以在同一种Python里实现,避免了开发程序的切换。

    这里就和大家分享我做的一个应用实例。解决问题:自动进行销售预测,提高准确率,减少人工一个一个SKU进行预测分析。最终的效果如下图:

    20171208220919_49342.png

    1、用到的工具

    当然我们只需要用Python和一些库就可以了。

    pandas:数据整理

    numpy:pandas的前提,科学计算

    MySQLdb:mysql数据库链接

    statsmodels:统计建模

    pylab:图形处理

    flask:web框架

    2、Flask的安装

    请参考 http://docs.jinkan.org/docs/flask/,在Flask的app目录下建立一个forecasting.py的python文件,在Flask的app的templates目录下建立一个forecastin.html的模版文件,两个文件的内容如下:

    forecasting.py

    # -*- coding: utf-8 -*-

    from app import app

    from flask import render_template

    @app.route('/forecasting/')

    def forecasting(item=None):

    return render_template("forecasting.html")

    forecastin.html

    Hello World

    Hello World

    在DOS窗口运行

    python d:pyflaskrun.py

    在浏览器打开http://127.0.0.1:5000/就可以看到forecasting.html模版的内容显示了。

    20171208221016_31673.png

    接下来我们从头建一个预测模型。

    3、建立数据库并填写数据

    CREATE TABLE `sale` (

    `SaleMonth` datetime DEFAULT NULL,

    `Sale` float DEFAULT NULL

    ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

    数据自己录入啦。

    4、相关库的引入

    我们现在在之前第2点建立的文件的基础上进行修改,

    在forecasting.py的头部引入以下库

    # -*- coding: utf-8 -*-

    from app import app

    from flask import render_template

    import pylab

    import pandas as pd

    import numpy as np

    from pandas import Series,DataFrame

    import MySQLdb

    import pandas.io.sql as sql

    import statsmodels.api as sm

    import time

    import datetime

    from dateutil.relativedelta import relativedelta

    import random

    5、定义路由

    @app.route('/forecasting/')

    意思就是我们访问例如http://127.0.0.1:5000/forecasting/2的地址对于就是解析到forecasting.py文件,其中是可变的URL部分,如上面的URL的2

    6、定义函数

    def forecasting(lag=None):

    其中lag就是接受URL中的参数,我们定义lag是自回归函数的滞后期数

    7、数据库链接

    conn = MySQLdb.connect(host='127.0.0.1',user='root',passwd='123456',db='bi',charset='utf8')

    str_sql = "select SaleMonth as Month,Sale from sale order by SaleMonth"

    sale=sql.read_sql(str_sql,conn)

    8、数据处理

    我们整理数据以适合使用。

    ##//数据处理

    #转换数据中的月份为日期类型,并把它定义为pandas索引

    sale.Month = pd.to_datetime(sale.Month)

    sale = sale.set_index("Month")

    ##//提取最大月份和最小月份

    start = min(sale.index)

    end = max(sale.index)

    ##定义预测的月份,在最大月份的基础上加1-4

    pre_start =end+relativedelta(months=1)

    pre_end =end+relativedelta(months=4)

    #必要的转换

    pre_start =pre_start.strftime('%Y-%m-%d')

    pre_end =pre_end.strftime('%Y-%m-%d')

    #生成时间序列,从最小月份到最大月份

    i = pd.date_range(start, end, freq='MS')

    df = DataFrame(i,i)

    #定义列、定义索引index名

    df.columns = ['T']

    df.index.names =['Month']

    #把sale与df合并,通过索引

    rs = pd.merge(sale,df,left_index=True,right_index=True,how='outer')

    #删除临时列T,并把rs转换为html,方便后面输出到模版中

    del rs['T']

    data = rs.to_html()

    9、数据预测

    ##预测

    #对rs进行对数变换

    rs = np.log(rs)

    #对rs进行自回归,lag是自回归的滞后因子,来自函数的lag参数,即来自RUL的参数

    r = sm.tsa.AR(rs).fit(maxlag=lag, method='mle', disp=-1)

    #对未来四个月进行预测

    fcst_lg = r.predict(start,pre_end)

    #对预测的结果进行指数变换,因为之前做了对数变换

    fcst = np.exp(fcst_lg)

    #转换fcst为pandas的DataFrame格式

    fcst = DataFrame(fcst)

    #定义列名和索引,用于和原来的rs合并

    fcst.columns=['fcst']

    fcst.index.names =['Month']

    #合并fcst和rs到rs_out

    rs_out = pd.merge(sale,fcst,left_index = True,right_index = True,how='outer')

    #rs_out转换为记录格式,再转换为html格式,以方便输出到模版中显示

    #取得最后的4行作为预测的显示输出,不知道为什么rs_out[-4:-1]这个输出漏了最后一行

    rs_fcst = rs_out[-4:-1]

    rs_fcst = rs_fcst.to_html()

    rs2 = rs_out.to_records()

    rs_out = rs_out.to_html()

    10、数据整理

    我使用了echart web图标框架进行显示。

    ##以下是处理表格数据输出到echart的json格式

    tmp=u""

    tmp1=""

    tmp2=""

    tmp3=""

    for t in rs2:

    #tmp1 += "{'label':'" + str(t.Month.year)+"/"+str(t.Month.month) + "','value':'" + str(t.Qty) + "'},"

    #tmp1 += ""

    tmp1 += "'"+str(t.Month.year)+"/"+str(t.Month.month)+"',"

    #tmp2 += ""

    tmp2 += str('%.0f' % t.Sale) +","

    #tmp3 += ""

    tmp3 += str('%.0f' % t.fcst) +","

    tmp +=""+tmp1+""

    tmp +=u""+tmp2+""

    tmp +=u""+tmp3+""+""

    tmp1 = tmp1[:-1]

    tmp2 = tmp2[:-1]

    tmp2 = tmp2.replace('nan',''-'')

    tmp3 = tmp3[:-1]

    tmp=u'''{

    title : {text: '测试',subtext: '纯属虚构'},

    tooltip : {trigger: 'axis'},

    legend: {data:['实际销售','预测销售']},

    toolbox: {

    show : true,

    feature : {

    mark : {show: false},dataView : {show: true, readOnly: false},

    magicType : {show: true, type: ['line', 'bar']},

    restore : {show: true},saveAsImage : {show: false}

    }

    },

    calculable : true,

    dataZoom : {show : true,realtime : true,start : 0,end : 100},

    xAxis : [{type : 'category',data : [%s]}],

    yAxis : [{type : 'value',min : 5000,scale : true}],

    series : [

    {

    name:'实际销售',type:'bar',data:[%s],

    markPoint : {

    data : [{type : 'max', name: '最大值'},{type : 'min', name: '最小值'}]

    },

    markLine : {data : [{type : 'average', name: '平均值'}]}

    },

    {

    name:'预测销售',type:'line',data:[%s],

    }

    ]

    };''' %(tmp1,tmp2,tmp3)

    11、生成公式

    生成一个公式能更直观显示变量之间的关系。

    #生成动态公式图片

    rp = r.params

    ftext=''

    i=0

    for rp1 in rp:

    if (i==0) and (rp1>0) :const = '+' + str(("%.4f" % rp1))

    if (i==0) and (rp1<0) :const = str(("%.4f" % rp1))

    if (i==1):ftext = ftext + str(("%.4f" % rp1))+'y_{t-'+str(i)+'}'

    if (i>1) and (rp1>0):ftext = ftext + '+' + str(("%.4f" % rp1))+'y_{t-'+str(i)+'}'

    if (i>1) and (rp1<0):ftext = ftext + str(("%.4f" % rp1))+'y_{t-'+str(i)+'}'

    i +=1

    f = r'$y_{t}='+ftext+const + '$'

    f2 = r'$y=ln(w_{t})$'

    fig = pylab.figure()

    #设置背景为透明

    fig.patch.set_alpha(0)

    text = fig.text(0, 0, f)

    # 把公式用公式图片的方式保存

    dpi = 300

    fig.savefig('d:/py/formula.png', dpi=dpi)

    # Now we can work with text's bounding box.

    bbox = text.get_window_extent()

    width, height = bbox.size / float(dpi/4) + 0.005

    # Adjust the figure size so it can hold the entire text.

    fig.set_size_inches((width, height))

    # Adjust text's vertical position.

    dy = (bbox.ymin/float(dpi))/height

    text.set_position((0, -dy))

    # Save the adjusted text.

    url = 'D:/py/Flask/app/static/images/1.png'

    fig.savefig(url, dpi=dpi)

    12、输出到模版

    把py程序中的在模版中用到的结果输出到模版。

    return render_template("forecasting.html",r=r,rs_out=rs_out,tmp=tmp,lag=lag,f=f,f2=f2,rs_fcst=rs_fcst)

    13、设计模版

    我们可以用{{变量名}}来接受来自py程序的变量。

    分析结果

    // 路径配置

    require.config({

    paths:{

    'echarts' : '/static/ECharts/build/echarts',

    'echarts/chart/bar' : '/static/ECharts/build/echarts',

    'echarts/theme/macarons':'/static/ECharts/src/theme/macarons',

    }

    });

    require(

    [

    'echarts',

    'echarts/theme/macarons',

    'echarts/chart/bar', // 使用柱状图就加载bar模块,按需加载

    'echarts/chart/line' // 使用柱状图就加载bar模块,按需加载

    ],

    function (ec,theme) {

    // 基于准备好的dom,初始化echarts图表

    var myChart = ec.init(document.getElementById('main'),theme);

    var option = {{tmp | safe}}

    myChart.setOption(option);

    }

    );

    .right{text-align: right}

    body{font-size: 12px;background:white}

    Summary of AR Results

    Lag length:

    {{r.k_ar}}

    Samples:

    {{r.nobs}}

    Model:

    AR

    -----------------------------------------

    AIC:

    {{'%.4f' % r.aic}}

    BIC:

    {{'%.4f' % r.bic}}

    FPE:

    {{'%.4f' % r.fpe}}

    HQIC:

    {{'%.4f' % r.hqic}}

    ----------------------------------------------------------

    Results for equation

    ==========================================================

    X

    coefficient

    std.error

    t-stat

    p-value

    {% for i in range(lag+1) %}

    {% if i==0 %}

    const

    {% else %}

    Y(t-{{i}})

    {% endif %}

    {{'%.4f' % r.params[i]}}

    {{'%.4f' % r.bse[i]}}

    {{'%.4f' % r.tvalues[i]}}

    {{'%.4f' % r.pvalues[i]}}

    {% endfor %}

    ----------------------------------------------------------

    预测

    ==========================================================

    {{rs_fcst | safe}}

    1.png?"

    14、实际应用

    在这各例子中,我们只是对一个产品、一个模型、一个参数进行了预测。

    在实际应用中,可以批量对产品、多个模型、多种参数进行预测,写一个判定预测模型好坏的算法,自动确定每种产品的最优模型和参数,定期自动计算各产品的预测值。

    希望这个思路能帮到大家。

    展开全文
  • 对Excel数据进行读取并重新整理至新Excel,并绘制Excel中数据为图表
  • 无论是做机器学习还是做数据分析,都离不开获取数据后的第一步-数据清洗工作。据统计,数据清洗工作占据整个工作时间百分之50左右,有的甚至能达到百分之70。下面我将介绍我进行数据清洗得思路流程。 数据清洗整体...
  • 2021python数据分析实例教程 python数据分析与可视化教程
    展开全文
  • 最好使用notebook运行.如果直接用使用python运行,只会出现一张图片。
  • python数据分析参考案例,在线选房系统代码和数据,网络收集
  • python数据分析实例

    千次阅读 热门讨论 2017-10-08 19:02:24
    本文用到的数据在评论区留下邮箱即可。 本文通过对美国枪杀数据的探索,综合运用python做一些数据的提取和统计
  • 本课程以一个小项目带你快速上手 Python 爬虫和数据分析,主要分 3 部分: 第 1 部分是 Python 爬虫,主要使用 Urllib 3 和 BeautifulSoup 抓取天猫商城和京东商城胸罩销售数据,并保存到 SQLite 数据库中; 第 2 ...
  • 原标题:Python数据分析案例实战至今我们网站已经开设了多个数据分析系列的课程,大部分都是基于算法思路来开展的,课程中着重点在于算法的讲授、软件的使用,案例只是辅助学习。然而很多学员反映,希望可以在课程中...
  • Python数据分析的案例教程,不仅介绍了使用Python进行数据分析所涉及的常用知识,而且介绍了6个流行的数据分析方面的项目。包括数据分析基础、NumPy模块实现数值计算、Pandas模块实现统计分析、Matplotlib模块实现...
  • 两个学习道具:1)这个网页可以调用全球最大的搜索引擎(长按此处可以复制):事先准备:在notebook中想要导入Excel文件,要先安装一个读取Excel文件的包:xlrd安装步骤:1>现在conda中进入当前文件所在的Python环境...
  • 本课程是Python数据分析实战课程,从数据搜集、数据存取、数据清洗、数据分析、数据可视化一步一步完成北京二手房价数据分析过程。
  • 分析子串在母字符串出现次数 磁盘写入 列表转字典 拉链函数zip用法 分解质因数 def cal ( n ) : list = [ ] if not isinstance ( n , int ) or n 2 : return "not int or flag ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 106,050
精华内容 42,420
关键字:

python数据分析实例

python 订阅