精华内容
下载资源
问答
 • 同花顺行情软件的数据文件读取器和支持类库DLL,支持查看day文件
 • 同花顺、通达信数据格式

  热门讨论 2009-08-07 15:12:07
  同花顺、通达信数据格式 同花顺、通达信数据格式
 • 同花顺数据格式总览

  千次阅读 2019-07-14 22:09:19
  1D3811D0695B6887!172.entry 同花顺采用了简易的数据库组织方式。在同花顺的发布文件包中包括...基本上,对同花顺数据结构的解析不需要这么复杂,同花顺发布文件包中的SQLite文件被核新程序员重新编译过,不过就与S...

  原文:http://enterprisebeing.spaces.live.com/Blog/cns!1D3811D0695B6887!172.entry

  同花顺采用了简易的数据库组织方式。在同花顺的发布文件包中包括了SQLite 3的驱动,但不是很清楚同花顺是如何使用这个驱动的。基本上,对同花顺数据结构的解析不需要这么复杂,同花顺发布文件包中的SQLite文件被核新程序员重新编译过,不过就与SQLite Manager的简单配合使用来看,并不影响对标准数据库文件的读取,当然,也不支持把同花顺数据文件当成标准的数据库文件进行读取。

  基本上,同花顺的数据文件可以分为两类,一类是history\下行情数据文件,另一类是finance\下财务数据文件。

  在history\下的数据文件,通过子目录名称识别市场代码,通过子目录下的文件名称识别交易标的(包括股票、期货等等)。文件格式采用的是简单格式,每个数据文件分别由:

  • 文件头;
  • 列定义;
  • 内容;

  三个部分组成。

  在finance\下的数据文件,采用的是单文件容纳所有品种数据的方式,因此采用的是复合格式,每个数据文件分别由:

  • 文件头;
  • 列定义;
  • 填充区域;
  • 复合索引数据块;
  • 内容;

  五个部分组成。

  文件头

  文件头固定为16个字节,包括:

  • byte [6],6 字节长度,固定为 {0x68,0x64,0x31,0x2E, 0x30,0x00},用于识别数据文件类型;
  • dword,4 字节长度,记录“内容”区域的记录条数;
  • word,2 字节长度,记录“内容”区域的开始位置;
  • word,2 字节长度,记录“内容”区域每条记录的字节长度;
  • word,2字节长度,记录“列定义”的列个数;

  列定义

  列定义固定为4 个字节一组,标示一个列,第4 个字节为列内容的字节长度,由于是使用1 个字节表示,因此数据文件每列的最大长度为255个字节。

  填充区域

  在finance\目录下的数据文件,采用的是包括索引的复合格式存储。在列定义和符合索引数据块之间存在着一个未使用的填充区域,填充区域的长度总是列定义数量的两倍,即文件头偏移 0x0E 处 WORD 类型 * 2。

  就目前所知,这一区域基本上都使用 0x00 填充,可能是保留未来使用。

  复合索引数据块

  在finance\目录下的数据文件,文件的“内容”区域并不包含记录所隶属的证券品种,而是把此内容放置在一个单独的索引区域。索引区的开始位置 = 0x10 + 0x04 * 列定义数量 + 0x02 * 列定义数量。

  复合索引数据块由三个部分组成:

  • word,2 个字节,记录本索引数据区域的字节长度;
  • word,2 个字节,记录本索引数据区域中所包含的索引的条数;
  • byte[],不定长的索引记录,每条索引记录为18个字节长度,因此总长度 = 索引条数 * 0x12;

  索引

  每条索引的长度为18个字节,格式分别为:

  • byte,1 字节长度,标识证券品种类型,目前已知的包括3 类4 种标示,分别是:0x10,国内证券;0x48和0x50,港股;0x4A,基金。在“权息资料”中,使用0x50标示港股,在“现金流量”中,使用0x48标示港股,不知道是设计的 bug,还是存在其他用意;
  • byte [9],9 字节长度,标识交易品种的符号,目前已知是ASCII格式,从整个文件的多字节字符处理来看,文件的整体字符编码应该是GB2312编码,因此这一部分原始的处理应该是使用GB2312编码通读;
  • word,2 字节长度,标识隶属此交易品种的记录区域中实际上未使用的记录条数,有关的组织方式下面再详细解释;
  • dword,4 字节长度,标识隶属于此交易品种的记录的开始下标,注意是记录在数据文件中从0 开始排列的顺序号,而不是文件的偏移地址,其实际的偏移地址 = “内容”区域的开始地址 + 此开始下标 * 记录的长度;
  • word,2 个字节长度,标识隶属于此交易品种的记录的条数;

   总体来说,存在索引的文件其实际的完整数据由两个部分组成,一个就是索引数据区,另一个就是记录内容数据区。其与索引对应的记录内容数据采取分块的存储模式,即,每一个交易品种总是使用一个固定的、连续的内容数据区存储相对应的数据,因此在实际的数据存储过程中,存在着并未被实际使用的“空余”记录的数据区。

   复合文件通过两个方法来识别有效和无效的记录,首先,索引记录其所使用的数据区总容纳的记录条数和未被使用的、无效的记录条数,两者相减可知被实际使用的记录条数;其次,复合文件的记录总是使用一个类型为Int32的4 字节用于标识时间的列开始,如果这个列的值为<=0,则表明这是无效的数据记录。

  内容

  数据内容开始的地址偏移在文件头0x0A处的一个word类型的2字节数据指示,其有效长度 = 列长度 * 记录条数。

   

  附录 
  同花顺的数据文件读取器和支持类库在 https://sourceforge.net/projects/ociathena/

  展开全文
 • 关于同花顺数据格式

  千次阅读 2019-07-14 22:17:32
  由于有朋友在博客上提出同花顺day数据格式的需求,我这星期天(2005年5月20日)特地也整理出来 同花顺是很多传统软件中比较成熟的先进的,至少他目前用以开发程序的平台跟上了软件开发的前沿,尽管它存在着一些不稳定,但...

  由于有朋友在博客上提出同花顺day数据格式的需求,我这星期天(2005年5月20日)特地也整理出来 
  同花顺是很多传统软件中比较成熟的先进的,至少他目前用以开发程序的平台跟上了软件开发的前沿,尽管它存在着一些不稳定,但同花顺绝对是最具有生命力的,所以大家了解他的格式以后运用也有个稳定的数据来源,同花顺的各类数据整理的很工整也全面开放,这里先介绍它的日数据,大家可以先启动同花顺的工具>数据下载,选中打勾日数据,可以设置历史起始和终结点,目前无限制,只是不能在开市下载,可能是避免别人看行情的速度影响,唉这前几年作这类软件的人都快饿死了,目前虽然行情大好,连服务器都不给买多几台,呵呵,大家同病相怜,日数据为48个字节一天,文件头为64个字节n = (fs.Length - 64) / 48 '可得天数,详细代码如下 
   

  同花顺软件从开发技术上是走在最前头的,他的数据格式也用到无符号整型32位为主,
  日数据格式为
  64个字节的文件头,另外每48个字节为一天纪录
  日期 32位 4个字节
  开盘 32位无符号整型 4个字节
  最高 32位无符号整型 4个字节
  最低 32位无符号整型 4个字节
  收盘 32位无符号整型 4个字节
  跳过  32位 4个字节
  成交量 32位 4个字节
  跳过  20个字节

  以上跳过部分只有最后4个字节未使用
  跳过部分包含数值,涨幅,振幅,总成交金额,换手率。
  详细编程:http://www.cnblogs.com/same/archive/2007/05/18/752062.html

  VB.net 2005

        Case 3 '同花顺
                  n = (fs.Length - 64) / 48 '文件头占64个字节
                  LoadDayData = n
                  ReDim dr(n)
                  For i = 1 To 8
                      br.ReadInt64() '读8次64位内存块以越过文件头
                  Next
                  For i = 1 To n
                      Dim d As Integer = br.ReadInt32()
                      j = j + 1
                      dr(j).stockdate = DateSerial(d / 10000, (d Mod 10000) / 100, d Mod 100) '日期占4个字节
                      dr(j).openor = (br.ReadUInt32 And &HFFFFFFF) / 1000 '用无符号32位整型,目前只发现B0开头,所以只需除以1000,不判断,但最好做个异常分支
                      dr(j).hightor = (br.ReadUInt32 And &HFFFFFFF) / 1000
                      dr(j).lowor = (br.ReadUInt32 And &HFFFFFFF) / 1000
                      dr(j).endor = (br.ReadUInt32 And &HFFFFFFF) / 1000
                      br.ReadInt32() '越过数据,不影响对数据基本数据的获取
                      dr(j).changor = br.ReadInt32  '(单位手数),成交量,也是32位,可以用无符号整型去读
                      If dr(j).changor < 0 Then '以B0 开头
                          dr(j).changor = (dr(j).changor And &HFFFFFFF) / 1000
                      ElseIf dr(j).changor > 0 Then '这里需要改进 目前发现 90开头
                          dr(j).changor = dr(j).changor / 100
                      Else
                          ' ......
                      End If
                      br.ReadInt32() '把纪录尾端读完,共20个字节
                      br.ReadInt64()
                      br.ReadInt64()
                      '其实以上越过的数据包含信息为数值,涨幅,振幅,总金额,换手,其实一个日纪录48个字节就只要4个字节未用到的了
                  Next
                case 4 '大智慧level2
                           '.......

  展开全文
 • 参考网上的同花顺数据格式介绍,下面的代码用于在TMEMO控件中显示文件头和文件内容。长时间不用D7,生殊处请见谅。 procedure TForm1.btOpenClick(Sender: TObject); var TM:TMemoryStream; FHard:TDayRec; ...
 • 使用SqlServer读取同花顺数据
 • 同花顺日线数据文件读取器

  热门讨论 2015-07-25 22:29:55
  同花顺日线数据文件读取器,通过读取同花顺历史数据文件获取,适合盘后分析
 • 同花顺实盘数据API

  2019-02-27 23:24:51
  同花顺实盘API接口,可以抓取实盘账户的交易数据和资金数据
 • 同花顺或通达信日线数据转换成csv文件的小工具。 自动识别同花顺或通达信数据格式。 把*.day文件拖到可执行文件即可转换。 支持一次拖动多个日线文件批量转换。
 • 上市公司的数据同花顺能查到,尤其上市银行。我是想查银行不良资产率,别的数据库没有很全面的,但是同花顺能查到。 以建设银行为例:资产负债表、利润表、现金流量表以及银行专项指标都有。 ...

   上市公司的数据在同花顺能查到,尤其上市银行。我是想查银行不良资产率,别的数据库没有很全面的,但是同花顺能查到。

  以建设银行为例:资产负债表、利润表、现金流量表以及银行专项指标都有。

  展开全文
 • 利用同花顺下载盘后数据,利用matlab自动读取数据,股票以及指数的日线数据,并在历史形态中追踪最形似的形态,并预测未来走势。 源码
 • 核新同花顺数据结构[转] 很想了解一些交易软件的数据存储方式。看到了一篇好文章,Mark 一下。 核新同花顺数据结构(一):总览 同花顺采用了简易的数据库组织方式。在同花顺的发布文件包中包括...

  核新同花顺数据结构[转]

  很想了解一些交易软件的数据存储方式。看到了一篇好文章,Mark 一下。

  核新同花顺数据结构(一):总览

  同花顺采用了简易的数据库组织方式。在同花顺的发布文件包中包括了SQLite 3的驱动,但不是很清楚同花顺是如何使用这个驱动的。基本上,对同花顺数据结构的解析不需要这么复杂,同花顺发布文件包中的SQLite文件被核新程序员重新编译过,不过就与SQLite Manager的简单配合使用来看,并不影响对标准数据库文件的读取,当然,也不支持把同花顺数据文件当成标准的数据库文件进行读取。

  基本上,同花顺的数据文件可以分为两类,一类是history\下行情数据文件,另一类是finance\下财务数据文件。

  在history\下的数据文件,通过子目录名称识别市场代码,通过子目录下的文件名称识别交易标的(包括股票、期货等等)。文件格式采用的是简单格式,每个数据文件分别由:

  • 文件头;
  • 列定义;
  • 内容;

  三个部分组成。

  在finance\下的数据文件,采用的是单文件容纳所有品种数据的方式,因此采用的是复合格式,每个数据文件分别由:

  • 文件头;
  • 列定义;
  • 填充区域;
  • 复合索引数据块;
  • 内容;

  五个部分组成。

  文件头

  文件头固定为16个字节,包括:

  • byte [6],6 字节长度,固定为 {0x68,0x64,0x31,0x2E, 0x30,0x00},用于识别数据文件类型;
  • dword,4 字节长度,记录“内容”区域的记录条数;
  • word,2 字节长度,记录“内容”区域的开始位置;
  • word,2 字节长度,记录“内容”区域每条记录的字节长度;
  • word,2字节长度,记录“列定义”的列个数;

  列定义

  列定义固定为4 个字节一组,标示一个列,第4 个字节为列内容的字节长度,由于是使用1 个字节表示,因此数据文件每列的最大长度为255个字节。

  填充区域

  在finance\目录下的数据文件,采用的是包括索引的复合格式存储。在列定义和符合索引数据块之间存在着一个未使用的填充区域,填充区域的长度总是列定义数量的两倍,即文件头偏移 0x0E 处 WORD 类型 * 2。

  就目前所知,这一区域基本上都使用 0x00 填充,可能是保留未来使用。

  复合索引数据块

  在finance\目录下的数据文件,文件的“内容”区域并不包含记录所隶属的证券品种,而是把此内容放置在一个单独的索引区域。索引区的开始位置 = 0x10 + 0x04 * 列定义数量 + 0x02 * 列定义数量。

  复合索引数据块由三个部分组成:

  • word,2 个字节,记录本索引数据区域的字节长度;
  • word,2 个字节,记录本索引数据区域中所包含的索引的条数;
  • byte[],不定长的索引记录,每条索引记录为18个字节长度,因此总长度 = 索引条数 * 0x12;

  索引

  每条索引的长度为18个字节,格式分别为:

  • byte,1 字节长度,标识证券品种类型,目前已知的包括3 类4 种标示,分别是:0x10,国内证券;0x48和0x50,港股;0x4A,基金。在“权息资料”中,使用0x50标示港股,在“现金流量”中,使用0x48标示港股,不知道是设计的 bug,还是存在其他用意;
  • byte [9],9 字节长度,标识交易品种的符号,目前已知是ASCII格式,从整个文件的多字节字符处理来看,文件的整体字符编码应该是GB2312编码,因此这一部分原始的处理应该是使用GB2312编码通读;
  • word,2 字节长度,标识隶属此交易品种的记录区域中实际上未使用的记录条数,有关的组织方式下面再详细解释;
  • dword,4 字节长度,标识隶属于此交易品种的记录的开始下标,注意是记录在数据文件中从0 开始排列的顺序号,而不是文件的偏移地址,其实际的偏移地址 = “内容”区域的开始地址 + 此开始下标 * 记录的长度;
  • word,2 个字节长度,标识隶属于此交易品种的记录的条数;

  总体来说,存在索引的文件其实际的完整数据由两个部分组成,一个就是索引数据区,另一个就是记录内容数据区。其与索引对应的记录内容数据采取分块的存储模式,即,每一个交易品种总是使用一个固定的、连续的内容数据区存储相对应的数据,因此在实际的数据存储过程中,存在着并未被实际使用的“空余”记录的数据区。

  复合文件通过两个方法来识别有效和无效的记录,首先,索引记录其所使用的数据区总容纳的记录条数和未被使用的、无效的记录条数,两者相减可知被实际使用的记录条数;其次,复合文件的记录总是使用一个类型为Int32的4 字节用于标识时间的列开始,如果这个列的值为<=0,则表明这是无效的数据记录。

  内容

  数据内容开始的地址偏移在文件头0x0A处的一个word类型的2字节数据指示,其有效长度 = 列长度 * 记录条数。

  附录

  同花顺的数据文件读取器和支持类库在 https://sourceforge.net/projects/ociathena/ 项目下的对应分类。

  posted @ 2010-01-15 16:34 暮夏 阅读( ...) 评论( ...) 编辑 收藏
  展开全文
 • C#读取股票日线数据同花顺版),先要下载同花顺软件,然后再下载本地数据
 • perl 爬取同花顺数据

  千次阅读 2016-04-01 15:36:20
  use LWP::UserAgent; use utf8; use DBI; $user="root"; $passwd='xxx'; $dbh=""; $dbh = DBI->connect("dbi:mysql:database=zjzc_vote;...port=3306",$user,$passwd) or die "can't connect t
 • 最新同花顺日线格式

  2010-10-11 08:55:00
  与以前网站上找到的有变化,特此更新。 日线文件位于history\...每个数据文件分别由: 文件头,固定为16个字节,包括: byte [6],6 字节长度,固定为 {0x68,0x64,0x31,0x2E, 0x30,0x00},用于识别数据文件类型...
 • 同花顺数据爬取

  千次阅读 2019-09-21 01:30:05
  https://www.jianshu.com/p/fa2527e607b2 转载于:https://www.cnblogs.com/fh-fendou/p/11226841.html
 • 最近试图从财经网站上积累数据,选中了同花顺财经的数据中心的数据。 插一句话,个人认为同花顺可能是目前财经领域掌握着最先进的机器学习技巧与人工智能算法的网站了。我自己最近也在做金融领域的问答与对话系统,...
 • A股所有上市公司年报财务表,包括现金流量表、资产负债表、利润表及其集合对齐数据,从同花顺网站下载的,每股对应cash debt benefit .xls的表格。避免大家一个个下载,节省时间
 • 爬取同花顺网站中上市公司财务报表数据(可用)
 • 同花顺

  千次阅读 2017-05-07 11:21:42
  同花顺 题目描述 所谓同花顺,就是指这些扑克牌,它们花色相同,并且数字连续。 现在我手中有 n 张扑克牌,但它们可能并不能凑成同花顺。我现在想知道,最 少更换其中的多少张牌,我能让这 n 张牌都凑成同花顺...
 • 使用htmlUnit抓取同花顺股票数据

  千次阅读 2019-06-15 16:53:14
  网站地址 http://q.10jqka.com.cn/ 请求地址 ... 其中的 page/4 就是页码 访问网站 抓取每一页的股票数据 private String crawler(String url) { ...
 • 爬取了同花顺上概念板块的成分股 主要是发现了各个量化的网站没有这个数据源,很多策略无法展开。这份数据应该挺多人需要的吧。把链接挂这里了,需要的阔以下载 http://pan.baidu.com/s/1eSGSS5W 数据有4列,分别...
 • 通过python操作同花顺客户端下单程序。在win7,python2.7,pywinauto0.6.5,同花顺网上股票交易系统5.0环境下测试通过。
 • 同花顺导出股票数据 进入个股K线图界面 菜单栏: 分析>历史成交 右键>数据导出>导出所有数据 选择路径>下一步>完成
 • Python网络爬虫数据采集实战:同花顺动态网页爬取

  千次阅读 多人点赞 2020-03-09 12:42:31
  之后对源代码进行信息提取进而存储即可,本文则针对动态网页进行数据采集,首先介绍Ajax相关理论,之后实战爬取同花顺动态网页,获取个股相关信息。 目录 一、Ajax理论 1.Ajax简介 2.Ajax分析 3.Ajax提取 二...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 16,002
精华内容 6,400
关键字:

同花顺数据格式