精华内容
下载资源
问答
  • 乳腺癌恶性预测 使用Python预测乳腺癌属性数据集是否会变成恶性肿瘤 该材料仅用于教育目的。 我不承担任何赔偿责任。 使用我的代码,即表示您同意这些条款和条件。
  • df = df['2017']# 选取2017年数据画图 last_date = df.iloc[-1].name last_date # last_unix = last_date.timestamp() last_unix = time.mktime(last_date.timetuple()) one_day = 86400 next_unix = last_unix + ...
  • kaggle竞赛题目,关于房价预测和股票预测Python源码及课件说明
  • 使用Python和keras进行股票预测
  • python预测算整理集合

    2019-03-05 22:25:20
    python预测算整理集合,包含SVR回归预测详解及代码,AR/ARMA LSTM预测详解及代码 卡尔曼滤波,粒子滤波等算法
  • 使用Hadoop通过2007年和2008年的数据预测奥黑尔机场的航班延误。使用Pig脚本,构建了一个特征矩阵,通过该矩阵我们可以训练和预测航空公司的延误,准确度约为80% 项目详情 建立了一个预测航空公司延误的模型,准确...
  • python 预测之美

    2021-01-11 15:46:52
    数据分析与算法实战,全书代码都有。
  • DBN Python预测交通流

    2017-11-01 10:30:24
    python 实现的基于DBN的交通流预测系统,为方便验证已给出实验,绝对可用
  • Python预测股票走势

    万次阅读 多人点赞 2018-02-04 15:12:20
    本文介绍了如何利用时间序列模型ARIMA进行股票走势预测。 环境:windows 64 平台:Jupyter Notebook (Kernel python3) 库:tushare statsmodels pandas numpy seaborn matplotlib 先来看看效果吧  

    Python的功能可谓相当强大,在很多行业具有相当的优势,这种优势很大程度上来源于各种第三方库。本文介绍了如何利用时间序列模型ARIMA进行股票走势预测。

    环境:windows 64

    平台:Jupyter Notebook (Kernel python3)

    库:tushare  statsmodels pandas numpy  seaborn matplotlib

    先来看看效果吧

                                       

    图1 预测结果图

    图1中橙色线条为股票行情实际数据,蓝色线条为模型预测的行情走势,预测结果显示股票呈上涨趋势,从长期来看,还是符合实际走势的,证明了ARIMA模型具有一定的可信性。但是在这里还是要提醒大家一句,股市有风险,投资需谨慎。模型只能提供一个参考,并不能完全正确的指导用户投资。

    股票行情数据获取

    数据的获取利用第三方库tushare,tushare是一个免费、开源的python财经数据接口包, 具体的介绍点我。
    tushare的安装方法很简单, pip install tushare即可。

    import tushare  
    data=tushare.get_h_data('600000',start='2005-05-05') 
    data.to_csv('600000_2005.csv')
    导入库,然后调用get_h_data函数获取数据,‘600000’指定股票代码,start指定数据开始的日期,最后将获取的数据使用to_csv函数以csv格式保存到本地。
    注意:调用get_h_data时有时会出现错误,可能是由于服务器不稳定,重新执行即可。但两次调用之间要间隔一定时间。

    数据读取与预处理

    df=pd.read_csv('600000_2005.csv',index_col=0,parse_dates=[0])
    #index_col表示把第一列设为index,parse_dates=[0]表示把第一列按datetime格式解析
    使用pandas的read_csv函数进行读取数据,各指标意义见代码段中的注释。
                 
    图2 读取数据展示
    pandas读取出的数据如图2所示,我们将选取close,即收盘价作为考核指标来建立ARIMA模型。

    ARIMA模型建立


    stock_week=df['close'].resample('W-TUE').mean() 
    #将收盘价作为评判标准,resample指按周统计平均数据(可以指定哪天为基准日,此处是周二为基准)
    stock_train=stock_week['2005':'2017'].dropna()
    #选取2005-2017的数据
    原始数据是股票每天的行情,我们这里将数据进行重采样,按每周的平均行情来进行分析,‘W-TUE’表示按周为单位,指定周二为基准日,即周二到下个周二为一个计算周期。

    画图看一下现在的数据

        
    图3 重采样后的数据

    图3使用matplotlib和seaborn绘制,代码如下
    stock_train.plot(figsize=(12,8))
    # plt.legend(bbox_to_anchor=(1.25,0.5))
    plt.title('Close Price')
    sns.despine() #边框控制,默认没有上方和右方的框
    plt.show()

    由图3可以看出,数据波动比较大,而时间序列模型要求数据平缓,满足平稳性的要求。因此需要对数据进行差分处理。

    stock_diff=stock_train.diff().dropna() #对数据进行差分,目的使数据平缓,满足平稳性的要求
    plt.figure()
    plt.plot(stock_diff)
    font_loc=''
    plt.title('一阶差分',fontproperties=font_set)  #注意要设置字体,否则会乱码
    plt.show()

                                      
    图4 一阶差分结果图

    一阶差分的结果如图4所示,图4可以看出数据基本已经趋于平缓,为了确定一阶差分足以满足需求,再进行ACF和PACF检验,ACF和PACF可以直接调用statemodel里的函数进行求算。

    from statsmodels.graphics.tsaplots import plot_acf,plot_pacf
    acf=plot_acf(stock_diff,lags=20)
    plt.title('ACF')
    acf.show()
    plt.show()
    pacf=plot_pacf(stock_diff,lags=20)
    plt.title('PACF')
    pacf.show()
    plt.show()

                                        
    图5 ACF结果图

                                         
                                                                              图6 PACF结果图
    由图5和图6可以看出,进行一阶差分时,结果已经落在了置信区间内(图中蓝色区域),因此可以确定进行一阶差分是可靠有效的。

    接下来就可以进行ARIMA模型训练了
    model=ARIMA(stock_train,order=(1,1,1),freq='W-TUE')#训练模型,order表示(p,d,q)
    result=model.fit()
    参数order=(1,1,1)表示一阶差分,ACF和PACF的取值均为1,关于差分阶数、ACF、PACF取值详细介绍 点我

    最后一步就是利用建立好的result模型来预测走势了

    pred=result.predict('20160816','20180112',dynamic=True,typ='levels')#注意预测的起始时间要在训练时间的范围内,结束时间没有要求
    需要注意的是,预测数据起始时间必须在训练集内,而终止时间则没有限制

    plt.figure(figsize=(6,6))
    plt.xticks(rotation=45)
    plt.plot(pred)
    plt.plot(stock_train)
    plt.show()

    画图
    就可以看见文章开头的结果了

                                       




    注:第一次发博客,不足之处欢迎大家提意见,另外该博文主要参考了唐宇迪机器学习视频以及很多已有博客,在此予以声明。







    展开全文
  • Python 预测孩子身高

    千次阅读 2020-05-07 10:00:01
    Python 孩子身高预测: 源代码: # 创建死循环,直至 用户自行 选择 退出 while True : # 分割线 print('*'*60) print('*'*10,'欢迎来到 孩子身高 预测系统','*'*10) # 功能选择 print('\t1、预测查询') ...

    Python 孩子身高预测:

    源代码:


    # 创建死循环,直至 用户自行 选择 退出
    while True :
        # 分割线
        print('*'*60)
        print('*'*10,'欢迎来到 孩子身高 预测系统','*'*10)
        # 功能选择
        print('\t1、预测查询')
        print('\t2、退出系统')
        menus_select = input('请选择功能( 1、2 ):')
    
        # 对输入的内容进行判断
        if menus_select == '1' or menus_select == '预测查询' :
            father_height = float(input('请输入父亲身高:'))
            mother_height = float(input('请输入母亲身高:'))
            children_gender = input('请输入孩子性别(女 或 男):')
    
            if children_gender == '男':
                # 固定的计算公式
                boys_height_min = (45.99) + ((0.78 * (father_height + mother_height)) / 2) - (5.29)
                boys_height_max = (45.99) + ((0.78 * (father_height + mother_height)) / 2) + (5.29)
                boys_height_result = f'孩子的身高预估在: {boys_height_min}CM 与 {boys_height_max}CM 之间'
                print(boys_height_result)
            elif children_gender == '女':
                girls_height_min = (37.85) + ((0.75 * (father_height + mother_height)) / 2) - (5.29)
                girls_height_max = (37.85) + ((0.75 * (father_height + mother_height)) / 2) + (5.29)
                girls_height_result = f'孩子的身高预估在: {girls_height_min}CM 与 {girls_height_max}CM 之间'
                print(girls_height_result)
            else:
                print('请正确输入孩子性别')
        elif menus_select == '2' or menus_select == '退出系统' :
            break
        else :
            print('请选择正确的功能项')
        # 分割线
        print('*' * 60)
        print()
        print()

    运行效果:

    展开全文
  • StockPricePrediction:使用python实现股票价格预测
  • python预测房价

    千次阅读 2019-03-02 21:58:58
    欢迎使用Markdown编辑器 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。 新的改变 我们对Markdown编辑...

    (学习)python预测房价

    房价数据:
    https://pan.baidu.com/s/1eiCjwZKuI2E1eZ6wgMnCyA
    提取码:9glo
    代码:
    https://pan.baidu.com/s/1V3QUdEFo86fN7DAgjzBadA
    提取码:uw8x

    一:导入数据

    在这里插入图片描述

    二:显示前五行

    在这里插入图片描述

    建立线性模型

    (1)以上的数据虽然看起来不相关,其实反映了民生生活的各个方面;比如,失业率高会影响买房,贷款利率高也会影响买房。

    (2)建模时,主要是找到数据之间的相关性。同时,数据一定要打破数据孤岛,所以一定要关联起来数据。

    三:将四张表按时间“date”连接起来

    在这里插入图片描述
    在这里插入图片描述

    四:构建线性回归模型

    找到类似y=a1x1+a2x2+a3x3+…+anxn+b这种方程来拟合数据,表示对房价的预测问题; 其中x1,x2,x3,…,xn即为各种变量,如上面df矩阵中的housing_price_index,sp500,…等;y即为要预测的房价。
    在这里插入图片描述
    通过summary()函数,看这个模型的情况
    在这里插入图片描述
    在这里插入图片描述
    R-squared 如果是1是完全相关,是0是完全不相关; housing_price_index= a * total_unemployed +b b 即为 Intercept=313.3128,b为 当a为-8.3324 通过图形画出以上线性模型来看看

    五:画图

    在这里插入图片描述

    六:多变量的线性回归

    Y=a0+a1x1+a2x2+…+anxn+delta

    在这里插入图片描述
    (1)模型得到的R-squared=0.98,说明相关性比较大,换句话说,就是这些自变量可以有效的影响Y的值

    在这里插入图片描述
    (2) 该模型得到的方程是

    housing_price_index=-389.2234-0.1727total_unemployed+5.4326long_interest_rate +32.3750federal_funds_rate+0.7785consumer_price_index +0.0252*gross_domestic_product
    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • python预测中国GDP超过美国时期概率分布,中国多久能超过美国?哪一年的概率高?
  • 主要介绍了使用python进行广告点击率的预测的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  • 如何使用python做数据的预测和分析的代码和文档 如何使用python做数据的预测和分析的代码和文档
  • 链路预测 python

    2017-12-15 10:41:45
    链路预测 python
  • 使用python进行交通流量预测

    千次阅读 2021-01-30 11:31:04
    任务:短时交通流量预测

    项目流程

    项目地址

    仓库地址

    项目概述

    前几天(好吧,是前几个月—拖延症癌患者),从一个小客户哪里收到了一批数据,没错,就是很小批量的数据,然后目标适用于解决交通流量预测等的问题。这本来是一个非常小非常小的项目,不过既然是第一次接到做交通流量预测的,当然要尽情搞事情。

    首先是模型,什么SVM、LSSVM、SVR、BP等等传统,能上的都给他上上。然后使用模式,甭管是命令行工具还是绘图方式,能够写多少轮子就写多少轮子,所有的东西都是抽象抽象再抽象,我们的目标是没有最抽象只有更抽象。

    既然决定,不单单只是做一个项目,而是决定在这个项目的基础上搞点东西,那么就要从头开始,所以,一开始就是先做架构了。

    对象分析

    我们先看看有哪些可以抽象出来的对象,首先,这是一个用于预测的模型项目,然后就有了第一个对象,模型,模型应该是用于预测和学习的。

    然后,为了反馈预测,我们需要抽象一个残差对象,用于学习。

    为了能够直观检验学习的效果,我们可能还需要对于部分学习效果进行可视化,因此需要构建一个绘图对象,用于将数据对象绘制成对应的图形。

    由于拿到的数据比较参差,所以需要对数据进行预处理,按照时间聚合与分割,并且按照需要提取数据特征,因此需要构建数据提取过程的对象。

    最后,为了连接数据端到模型端再到可视化端,我们需要构建一个管道对象,让整个数据流串接起来。

    模块
    模型
    残差
    可视化
    管道

    此外,由于客户的需求,我们还需要定制一些东西,比如我们要在模型中使用遗传算法来进行模型优化,所以我们也会构建一些ga相关的对象,比如个体,群体等。

    然后,为了配置整个系统,要实现一个配置对象,去配置整个系统,可。

    模块介绍

    数据模块

    数据模块基本负责了几件事情,数据读取、数据预处理和数据特征抽取。

    数据
    数据读取
    数据预处理
    数据特征抽取

    数据读取

    参考data/xlsx_reader.py,按照需求,我会收到一批xlsx类型的数据,也就是超表格数据。这里直接使用pandas中的read_excel提供能力。然后,在此基础上,提供数据串联与数据索引变更的能力。

    数据预处理

    参考data/preprocess_data.py,对于已经读取的数据进行必要的预处理流程,这里做的只是简单的正则化。

    数据特征提取

    参考data/extract_feature.py,这里选取一些数据特征用于预测下一时刻的数据,包括了时间滑动窗口内的均值、方差、一阶导数、二阶导数等。

    残差模块

    残差模块主要用于计算,目标值和预测值之间的残差,这些残差用于模型训练。整体上基于BaseLoss(参考lib/loss.py)模块实现。

    loss
    mae_loss
    mse_loss

    mae_loss

    参考loss/mae_loss.py,计算均值残差。

    mse_loss

    参考loss/mse_loss.py,计算均方差残差。

    模型模块

    模型模块存储了主要的模型,这些模型负责了预测所使用的所有模型(至少是)。整体上,模型基于BaseModel(参考lib/model.py)实现。

    model
    BP
    lssvr
    svr
    ga_knn_lssvr

    BP

    参考model/bp.py,BP神经网络模型。包含了标准的BP神经网络模型和带有遗传算法优化的BP神经网络。

    SVR

    参考model/svr.py,支持向量机模型。包含了标准的支持向量机和带有遗传算法优化的支持向量机模型。

    LSSVR

    参考model/lssvr.py,最小二乘向量机模型,包含了标准的最小二乘向量机模型和带有遗传算法优化的支持向量机模型。

    GA_KNN_LSSVR

    参考model/ga_knn_lssvr.py,knn+lssvr联合预测模型,当然也包含了遗传算法对模型优化。

    可视化模块

    可视化模块包含了将指定数据进行可视化的主要流程,主要是用于将指定的数据变化成可视化的图形。所有的可视化都是基于BasePlotable(参考lib/plot.py)。目前主要实现了线性图和网格图。

    plot
    line
    wireframe

    line

    线性图,实现过程参考plot/line.py

    wireframe

    线框图,实现过程参考plot/wireframe.py

    任务模块

    主要的命令行任务过程,所有的task基于BaseTask模块(参考tasks/base_task.py)实现。主要是用于构建一系列的任务函数。主要实现的函数过程如下:

    task
    AggTask
    DataTask
    FeatureExtractTask
    ModelTask
    PlotTask

    AggTask

    聚合任务,参考tasks/agg_task.py实现,主要用于聚合不同数据文件中的数据。

    DataTask

    数据任务,参考tasks/data_task.py实现,主要处理数据任务,进行数据预测,获取数据残差。

    FeatureExtractTask

    特征提取任务,参考tasks/FeatureExtractTask实现,将原始数据按照时间进行聚合后,执行数据预处理和数据的特征提取。

    ModelTask

    模型任务,参考tasks/model_tasks.py,主要用于实现预测流程。

    PlotTask

    可视化任务,参考tasks/plot_tasks.py,主要用于实现可视化数据的流程。

    (未完待续)

    展开全文
  • Python预测成绩

    2019-09-12 14:20:30
    https://blog.csdn.net/wuzlun/article/details/80001746
  • 使用神经网络进行预测python

    万次阅读 多人点赞 2020-01-03 15:48:21
    先学习本篇文章之前,建议大家先学习我编写的上一篇“使用Python从头实现一个神经网络”,再来学习学习本篇使用神经网络进行房价预测。 介绍: 本次使用神经网络进行房价的预测,利用数据样本学习,得到相关因素...
  • LSTM构建使用Keras Python包来预测时间序列步骤和序列。 包括正弦波和股票市场数据

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 223,965
精华内容 89,586
关键字:

使用python预测

python 订阅