精华内容
下载资源
问答
  • Tushare金融数据实践 目前来看,除了爬虫玩的很好,又有精力自己去爬取数据并清洗的,要用到免费的数据源,有两个比较不错的推荐,tushare和baostock。这里介绍一下tushare的使用。 Tushare是一个免费、开源的...

    Tushare金融数据实践

        目前来看,除了爬虫玩的很好,又有精力自己去爬取数据并清洗的,要用到免费的数据源,有两个比较不错的推荐,tushare和baostock。这里介绍一下tushare的使用。

        Tushare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,并对外提供多种开放接口供使用。目前升级成金融大数据社区,即pro版,向下兼容老版本的一些api。

     

    (具体可以到官网了解详细使用方法 https://tushare.pro/register?reg=282123 )

    安装

    先安装一些依赖库

    # pip install anaconda

    # pip install pandas

    # pip install lxml

    # pip install tushare  (安装tushare)

     

    安装好可以直接使用:

    获取历史数据:

    # ts.get_hist_data('600183')

    另外方法 : ts.get_k_data('600183') 也一样,可以加时间段限制

     

    新版接口(建议使用):

    pro = ts.pro_api()

    df = pro.daily(ts_code='600183.SZ', start_date='20190920', end_date='20190930')

    建议使用pro版本,老版本不再维护。Pro版本接口更加丰富

    获取列表:pro.stock_basic 写成配置文件 codes

    获取交易日期:pro.trade_cal 写成配置文件 dates

    可以结合其他网络数据,合成后保存到数据平台供后续分析使用

     

    统计后的数据可以再存到关系数据库oracle等,这里不做详细说明,欢迎留言交流

    展开全文
  • 最近在研究Python的量化交易实现,因为需要股票相关的金融数据,自己动手,实在太麻烦了。于是在网上找找有没现成的数据接口,好做数据分析,发现了这个好东西,分享一下。Tushare介绍:Tushare是一个开发的的平台...

    最近在研究Python的量化交易实现,因为需要股票相关的金融数据,自己动手爬,实在太麻烦了。

    于是在网上找找有没现成的数据接口,好做数据分析,发现了这个好东西,分享一下。

    Tushare

    介绍:

    Tushare是一个开发的的平台,重点是免费的,免费的,免费的,重要的事情说三遍。

    现在是 Pro版了,数据会更稳定和完善。

    数据包含 ,股票、基金、期货、债券、外汇、行业大数据,为各类金融投资和研究人员提供适用的数据和工具。

    当然也为专业的人士提供收费的专业版本,是一个非常不错的平台。

    简单使用介绍

    这是个简单的使用教程,是基于你已经会使用Python 安装与使用的基础之上。如果没有Python基础,请自行google、百度学习。

    安装

    pip install tushare --upgrade

    使用*

    import tushare as ts

    ts.set_token("注册之后的Token")

    pro = ts.pro_api()

    df = pro.query('daily', ts_code='000001.SZ', start_date='20180701', end_date='20180718')

    #df = pro.daily(trade_date='20180810') #这样也可以查一天的全部数据

    print(df)

    数据结构:

    ts_code    trade_date  open high low close pre_close change pct_chg vol amount

    0  000001.SZ  20180718  8.75 8.85 8.69 8.70 8.72 -0.02 -0.23 525152.77 460697.377

    1  000001.SZ  20180717  8.74 8.75 8.66 8.72 8.73 -0.01 -0.11 375356.33 326396.994

    2  000001.SZ  20180716  8.85 8.90 8.69 8.73 8.88 -0.15 -1.69 689845.58 603427.713

    3  000001.SZ  20180713  8.92 8.94 8.82 8.88 8.88 0.00 0.00 603378.21 535401.175

    4  000001.SZ  20180712  8.60 8.97 8.58 8.88 8.64 0.24 2.78 1140492.31 1008658.828

    5  000001.SZ  20180711  8.76 8.83 8.68 8.78 8.98 -0.20 -2.23 851296.70 744765.824

    6  000001.SZ  20180710  9.02 9.02 8.89 8.98 9.03 -0.05 -0.55 896862.02 803038.965

    7  000001.SZ  20180709  8.69 9.03 8.68 9.03 8.66 0.37 4.27 1409954.60 1255007.609

    8  000001.SZ  20180706  8.61 8.78 8.45 8.66 8.60 0.06 0.70 988282.69 852071.526

    9  000001.SZ  20180705  8.62 8.73 8.55 8.60 8.61 -0.01 -0.12 835768.77 722169.579

    数据的结构是 pandas 的 dataframe格式,就一个表格,可以通过python 自由获取里面需要的行数据或者列数据。

    更多API

    展开全文
  • tushare 金融数据获取(R语言版)

    千次阅读 2020-07-28 21:42:08
    在上次 tushare正确爬取 指数数据文章后,看到后台有人留言说是希望能分享一个R语言版,那么好,你们要的R语言版今天来了。 首先,R语言只支持tushare pro,不支持tushare,因此在使用tushare获取数据之前,需要...

    在上次 tushare正确爬取 指数数据文章后,看到后台有人留言说是希望能分享一个R语言版,那么好,你们要的R语言版今天来了。

    首先,R语言只支持tushare pro,不支持tushare,因此在使用tushare获取数据之前,需要注册后才能使用。

    library(Tushare)
    pro <- pro_api(token = '********** token *********')

    股票数据

    以平安银行为例:

    > pro(api_name = 'daily', ts_code='000001.SZ', start_date='20200101', end_date='20200723')
     ts_code trade_date  open  high   low close pre_close change pct_chg       vol    amount1  000001.SZ   20200723 14.24 14.29 13.81 14.01     14.41  -0.40 -2.7759 2027525.9 2838535.22  000001.SZ   20200722 14.49 14.65 14.27 14.41     14.49  -0.08 -0.5521 1312951.6 1895447.23  000001.SZ   20200721 14.68 14.68 14.40 14.49     14.73  -0.24 -1.6293 1252865.7 1815570.34  000001.SZ   20200720 14.23 14.77 14.10 14.73     14.14   0.59  4.1726 1979632.0 2872758.1

    如果需要爬取指数的数据,需要200积分,这里就不演示了,原因你懂得。

    如果需要查看指数说明,可以使用index_basic接口。

    > pro(api_name = 'index_basic', ts_code='000001.sh', start_date='20200101', end_date='20200723')
        ts_code     name market publisher category base_date base_point list_date1 000001.SH 上证指数    SSE  中证公司 综合指数  19901219        100  19910715

    期货数据

    同样,因为积分问题,这里只以期货的交易日历为例,获取上海期货交易所的日历数据。

    > pro(api_name = 'trade_cal', ts_code='DCE', start_date='20200101', end_date='20200701')
       exchange cal_date is_open1        SSE 20200101       02        SSE 20200102       13        SSE 20200103       14        SSE 20200104       05        SSE 20200105       06        SSE 20200106       17        SSE 20200107       1

    IPO新股列表

    tushare提供了一个接口,可以查询新股上市列表数据。

    > pro(api_name = 'new_share', start_date='20200701', end_date='20200722')
         ts_code sub_code     name ipo_date issue_date amount market_amount price      pe limit_amount   funds ballot1  688311.SH   787311 盟升电子 20200722              2867          1092 41.58   68.31         0.80   5.850   0.032  002991.SZ   002991 甘源食品 20200722              2330          2097 38.76   22.99         0.90   9.033   0.023  002995.SZ   002995 天地在线 20200722              1617          1617 33.84   22.99         1.60   5.472   0.014  688586.SH   787586 江航装备 20200722             10094          2746 10.27   47.17         1.80   5.945   0.045  605318.SH   707318   法狮龙 20200721              3229          2906 13.09   22.99         1.20   4.227   0.036  605222.SH   707222 起帆电缆 20200721              5000          4500 18.43   22.98         1.50   9.215   0.047  601456.SH   780456 国联证券 20200721             47572         42815  4.25   19.60        14.20   0.000   0.15

    电影数据

    tushare提供了电影月度、周度、日度票房数据查询,奈何积分问题,这里就分享一个电影剧本备案数据吧。

    pro(api_name = 'film_record', start_date='201900131', end_date='20200722')# 数据太多,这里就看一下数据结构> str(pro(api_name = 'film_record', start_date='201900131', end_date='20200722')
    + )'data.frame':    500 obs. of  9 variables:
     $ rec_no       : chr  "影剧备字[2018]第175号" "影剧备字[2018]第2691号" "影剧备字[2018]第3140号" "影剧备字[2018]第3264号" ...
     $ film_name    : chr  "分裂" "远东特快" "春分夜" "一目了然" ...
     $ rec_org      : chr  "北京天工联合影业有限公司" "晶喜影业(北京)有限公司" "北京海润影业股份有限公司" "北京耳东明樾影业制作有限公司" ...
     $ script_writer: chr  "李菁菁" "罗登" "舒浩仑" "吴越刘诣" ...
     $ rec_result   : chr  "修改后同意拍摄" "同意拍摄" "修改后同意拍摄" "同意拍摄" ...
     $ rec_area     : chr  "北京市" "北京市" "北京市" "北京市" ...
     $ classified   : chr  "故事影片" "故事影片" "故事影片" "故事影片" ...
     $ date_range   : chr  "    2019年04月21日-04月30日" "    2019年04月21日-04月30日" "    2019年04月21日-04月30日" "    2019年04月21日-04月30日" ...
     $ ann_date     : chr  "2019-06-18 16:32 " "2019-06-18 16:32 " "2019-06-18 16:32 " "2019-06-18 16:32 " ...

    新冠疫情数据

    提供了两个接口,ncov_num和ncov_global,分别查询国内和国际的新冠疫情数据,不过根据公告日期,数据并不是每天的都有。

    首先来查看国内各个省份的数据

    > pro(api_name = 'ncov_num',level=3)
        ann_date        area_name parent_name level confirmed_num suspected_num confirmed_num_now suspected_num_now cured_num dead_num1   20200124           云南省    中国内地     3             5            NA                NA                NA         0        02   20200124     内蒙古自治区    中国内地     3             2            NA                NA                NA         0        03   20200124           北京市    中国内地     3            36            NA                NA                NA         1        0

    美国的感染速度可谓是飙升,现在来查一下美国数据。

    > pro(api_name = 'ncov_global',country='美国',update_time='20200723')# 由于数据太多,看一下结构> str(pro(api_name = 'ncov_global',country='美国',update_time='20200723'))'data.frame':    277 obs. of  12 variables:
     $ publish_date     : chr  "20200619" "20200618" "20200617" "20200616" ...
     $ country          : chr  "美国" "美国" "美国" "美国" ...
     $ country_enname   : chr  "United States of America" "United States of America" "United States of America" "United States of America" ...
     $ province         : chr  "美国" "美国" "美国" "美国" ...
     $ province_short   : chr  "美国" "美国" "美国" "美国" ...
     $ province_enname  : chr  "United States of America" "United States of America" "United States of America" "United States of America" ...
     $ confirmed_num    : int  2185873 2164071 2137731 2113366 2092850 2075840 2053606 2023347 2000464 1979971 ...
     $ confirmed_num_now: int  1468424 1454152 1437265 1420897 1415313 1403776 1391436 1369235 1354036 1343110 ...
     $ suspected_num    : int  0 0 0 0 0 0 0 0 0 0 ...
     $ cured_num        : int  599115 592191 583503 576334 561816 556606 547386 540292 533504 524855 ...
     $ dead_num         : int  118334 117728 116963 116135 115721 115458 114784 113820 112924 112006 ...
     $ update_time      : chr  "2020-06-19 10:01:28" "2020-06-18 22:33:33" "2020-06-17 15:58:45" "2020-06-16 09:30:34" ...

    好了今天就分享到这,希望能帮到你。

    另外,我爬取了官方网页,做了一个离线版帮助文档(叫官方文档应该没问题吧),方便大家找接口,可以在后台留言:tushare 即可获取下载链接。

    用了几次tushare pro版,总结一下:

    两个字:好用,

    三个字:真好用,

    四个字:积分不够。

    如果你也想使用pro版,可以点击阅读原文,用我的注册链接进行注册,顺便帮我也涨涨积分,哈哈哈。

     

    转载请注明:

    微信公众号:数据志

    简书:数据志

    博客园:https://www.cnblogs.com/wheng/

    CSDN:https://blog.csdn.net/wzgl__wh

    展开全文
  • 因为客户这边前期是不想花钱买数据的,只能自己想办法了,从sina和yahoo财经频道到一些数据,但是有些数据比较难找,看到了知乎上面的一个帖子,于是就尝试一下。 tushare的介绍。 使用前提,安装anaconda。 ...

    最近在做一个项目,主要是基于股票市场来验证一些model,看看能否做量化交易。那么如何获取数据呢?因为客户这边前期是不想花钱买数据的,只能自己想办法了,从sina和yahoo财经频道爬到一些数据,但是有些数据比较难找,看到了知乎上面的一个帖子,于是就尝试一下。

    • tushare的介绍。
    • 使用前提,安装anaconda
    • 按照好了之后,如何开发呢?选择什么样的IDE呢?如何基于anaconda搭建IDE环境。
    • 安装tushare:windows下打开cmd.exe,OS X下打开terminal,pip install tushare。
    • 使用mysql驱动的时候遇到了问题:ImportError: No module named 'MySQLdb'
    • 找出mysql所有的驱动:http://docs.sqlalchemy.org/en/latest/dialects/mysql.html#module-sqlalchemy.dialects.mysql.pymysql
    • 寻找其中合适的使用,pymysql:pip install pymysql
    import tushare as ts
    #import pandas as pd
    #import numpy as np
    #import matplotlib.pyplot as plt
    
    from sqlalchemy import create_engine
    
    engine = create_engine('mysql+pymysql://loginuser:loginuser@172.16.130.6/nevmiss?charset=utf8')
    
    df = ts.get_area_classified()
    df.to_sql('area_data_py',engine,if_exists='append')
    
    df = ts.get_industry_classified()
    df.to_sql('industry_data_py',engine,if_exists='append')

     好了,可以轻松地使用tushare的数据源了。

    转载于:https://www.cnblogs.com/allanli/p/5336901.html

    展开全文
  • 一直想将tushare的股票数据下载并储存到本地硬盘作为日后的量化分析,苦于自己菜鸟一个,经过在各大论坛学习,勉强写出了该功能,希望能起到抛砖引玉的作用得到各位大佬的建议跟改进,废话不多说了,放上代码了。...
  • 距离上次发布《python tushare股票数据的获取跟本地储存》几天后,发现本地储存化的数据表格还是缺少了些重要的指标数据,比如PE,总市值,流通市值等,于是决定在写篇文章补充下代码,如果觉得可以请给个素质三连,...
  • 在网上获取股票信息有非常多的方法,在此分享用几行Python代码就搞定想要的股票历史数据,一个是国外Yahoo的接口(缺点是比较慢),另一个是国内的tushare接口(速度快,但限制比较多); 相比之下用Python爬网获取...
  • 如何爬取Tushare数据并存入mongodb

    千次阅读 2018-03-31 15:45:43
    获取tushare中的数据可以通过tushare接口来实现首先使用tushare接口必须要先安装pymongo 、json、于tushare库可以用pip install tushare 之类的来安装来安装tushare 官网中直接就提供了调用接口代码,找到自己想要的...
  • Tushare简单的数据使用以及mysql存储 本人tushare ID:430903 由于某些特殊的原因,接触到了股票策略量化的那么一个项目,而这需要大量数据的支持。而我第一时间尝试的是爬虫,存在mysql中,随时调用。这样有个问题,...
  • tushare正确爬取 指数数据

    千次阅读 2020-07-28 21:49:41
    相信很搞金融数据分析的人,都知道Tushare,一个免费、开源的python财经数据接口包。可以非常简单爬取股票、宏观经济数据、新闻时事、银行间同业拆放利率、甚至电影票房数据都可以爬取,比起国外的雅虎财经,爬取的...
  • 在我自己早期使用tushare进行股票数据获取的时候遇到一个问题:如何快速获取全市场所有股票的行情数据呢? 一般来说,我们可以采用for循环的方式: def Get_stock_basicinfo(): stock_basicinfo = pro.stock_...
  • 通过tushare读取股票数据5.1. 切换pip3的源5.2. 获取股票数据5.2.1. 前复权和后复权5.2.2. 读取tushare数据,保存到csv文件5.2.3. 读取cvs文件,分析某价格所在区间5.2.4. 读取csv文件,汇总区间分布5.2.5. 读取db...
  • 在读取数据时候,需要输入你自己的token import pandas as pd import pymysql from sqlalchemy import create_engine engine = create_engine("mysql+pymysql://root:root@127.0.0.1:3306/stock1?charset=utf8") ...
  • 使用tushare获取股票历史交易数据

    千次阅读 2020-02-18 22:32:39
    因为前几年就写过java的爬虫,从新浪财经爬取相应股票的历史数据,所以我这里比较简单的调用了一下,获取所有的沪深A股的代码信息,然后调用tushare的get history data来获取历史数据(比java简单多了,tushare封装...
  • 上次分享了Tushare的注册流程,今天来实战一下,看看如何通过Tushare pro来获得历史股价数据
  • 描述:Shibor报价数据 限量:单次最大4000行数据,总量不限制,可通过设置开始和结束日期分段获取 积分:用户积累120积分可以调取,具体请参阅积分获取办法 输入参数 名称 类型 必选 描述 date ...
  • 为了获取到已复权数据,也是找了很多接口,最终发现tushare是一个不错的选择,不用存储在本地,程序运行时候保证联网,直接获取数据,最重要的是可以选择前复权或者后复权。 以下引用自官方网站...
  • 利用Tushare获取国内新冠肺炎数据

    千次阅读 2020-03-07 19:57:56
    最近,亦可以从tushare获取国内每日新冠肺炎的感染人数数据,包括日期,省市名称,累计确诊人数,累计疑似人数,累计治愈人数、累计死亡人数等,具体代码如下。 ```python import tushare as ts pro = ts.pro_api...
  • 待更新 转载于:https://www.cnblogs.com/cthon/p/9424568.html
  • TuShare是实现对股票/期货等金融数据从**数据采集**、**清洗加工** 到 **数据存储**过程的工具
  • 1. matlab 从 tushare 获取历史数据 1. matlab 从 tushare 获取历史数据 1.1. 引言 1.2. 准备工作 1.2.1. 注册 tushare 账号 1.2.2. 获取 token 1.2.3. 下载 tushare_matlab_sdk 1.2.4. 特别提示 1.3. 获取数据...
  • ![图片说明](https://img-ask.csdn.net/upload/201706/20/1497942580_905192.png)
  • 对量化投资策略进行研究,第一步就是获取我们需要的数据。...作为一个业余的量化投资爱好者,免费的数据来源主要有以下几种途径:Yahoo、Sina 财经的APIPython的Tushare包自己手工爬取 Tushare是一个免费、开源的P...
  • 本文的原文连接是: http://blog.csdn.net/freewebsys/article/details/50904965 未经博主允许不得转载。 ... 1,关于股票数据存储 股票数据比较特殊,需要做数据统计的。都需要一次进行批量查询多个数据,然后...
  • 安装tushare前还需要安装lxml,requests,pandas包。...刚注册时有100个积分,但这调取数据最低需要120个积分,所有可以填写资料获取20个积分,积分越高获取的信息越多。 官网上有详细的获取教程。 只有一个python...
  • 安装TuShare 方式1:pip install tushare 方式2:访问https://pypi.python.org/pypi/tushare/下载安装 方式3:将源代码下载到本地python setup.py install 升级TuShare 1、先查看本地与线上的版本版本号: ...
  • 安装tushare

    万次阅读 2016-05-30 22:02:53
    1.为了抓取大盘数据找了很久,开始想法是自己写爬虫取新浪或雪球网站抓数据,发现好麻烦没有自己直接方法,最后到处逛时发现有tushare库(哈哈不用麻烦,果然是人生苦短我用python) tushare 文档地址 ...
  • 环境配置 Python3+Pip环境配置 MongoDB环境配置 Redis环境配置 ...Scrapy+Tushare爬取微博股票数据 分布式篇 Scrapy分布式原理及Scrapy-Redis源码解析 Scrapy分布式架构搭建抓取知乎 Scrapy分布式的部署详解

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 452
精华内容 180
关键字:

tushare爬数据