精华内容
下载资源
问答
  • 我用抓包工具抓取了天眼查小程序的接口,然后自己简单封装了一下,查询结果以Json形式返回,可以按照自己的需要提取更多的字段。这次只封装了两个接口,一个是搜索的接口,另一个是查询公司基本信息的接口,其他的...
  • 最新天眼查python爬虫

    2020-06-08 15:53:36
    因公司需求,需要根据公司名称爬取天眼查详细信息,先从工商局抓取需要的公司名称,然后根据名称抓取天眼查数据,2020年6月8号最新抓取天眼查python爬虫
  • 实现天眼查POST查询

    2019-08-04 13:18:19
    由于工作原因,需要在天眼查网站上查询大约九百个公司的工商信息。数量有点多,所以手动查询是不可能的了,因此写了个程序进行自动查询并且把获取到的信息导入到Excel表格中。我们通过用易语言写一个天眼查POST查询...
  • 天眼查.py自动下载企业信用报告
  • 天眼查每次能到处5000条数据,模板暂时看是固定的,,,特地发上来一个给大家。没有数据。不过本人有个可以批量管理天眼查excel的简单通用企业信息共享软件正在开发中。。。已经可以在线更新,所以想了解和提建议的...
  • java天眼查爬虫

    2018-05-19 20:58:39
    使用jsoup做的java爬虫, 登录自己的天眼查账号, 爬取公司详细数. 不足: 大概执行100次请求之后会被识别为机器人.
  • 天眼查数据抓取

    2018-03-14 17:30:27
    天眼查公司数据抓取 自动登陆 跳转抓取 翻页 写入数据库
  • tianyancha 重申一遍,不卖接口,不开放源码,谢谢。 公众号“编码天空”,可以一起学习技术。
  • 根据天眼查最新的xpath写的天眼查爬虫,亲测可以用,爬数据十分方便
  • 天眼查-2020电商行业企业数据报告精品报告2020.pdf
  • 天眼查抓取脚本tianyancha.py
  • 一,因为某个ip延长内查询次数过多,所以查询时会自动跳到登陆界面,这种情况需要使用一个手机号进行三,假如短时间呢使用很多很多次查询的话,天眼查有人机判断的验证码,需要手动打开天眼查网站进行一下人机验证。...
  • d3+jQuery制作类似天眼查企查查的股权穿透图代码,组织架构图代码,支持鼠标拖动和鼠标滚轮控制放大缩小。
  • 天眼查、企查查 公司信息爬虫 使用说明 设置数据源 MysqlConfig = { 'develop': { 'host': '192.168.1.103', 'port': 3306, 'db': 'enterprise', 'username': 'root', 'password': 'root@123' } } 执行db/...
  • 一,因为某个ip延长内查询次数过多,所以查询时会自动跳到登陆界面,这种情况需要使用一个手机号进行三,假如短时间呢使用很多很多次查询的话,天眼查有人机判断的验证码,需要手动打开天眼查网站进行一下人机验证。
  • 此资源仅供学习用途,当前selenium都是基于无头模式的firefox或者chrome等浏览器进行爬虫抓取,天眼查的反爬技术算是很不错的,仅仅用于个人学习用,并不可以进行大数据的爬取 技术: python selenium 爬虫 模拟登陆...
  • scrapy+selenium+tor+privoxy ,python3.完美获取知乎,拉勾,天眼查整站内容,包含我对天眼查爬取过程中的一些经验和想法
  • 天眼查企查查辅助工具(辽宁省),电销公司必备利器!
  • 天眼查POST查询源码
  • 天眼查.zip

    2019-06-04 17:04:01
    天眼查破解版。手机安装即可使用,安全无毒。内有可用账号。
  • 天眼查POST例程
  • 天眼查爬虫学习demo

    2019-01-22 10:33:14
    天眼查爬虫,用到了Python的各种解析及IP池技术,仅供学习使用
  • 此资源仅供学习用途,当前selenium都是基于无头模式的firefox或者chrome等浏览器进行爬虫抓取,天眼查的反爬技术算是很不错的,仅仅用于个人学习用,并不可以进行大数据的爬取 技术: python selenium 爬虫 模拟登陆...
  • 此资源仅供学习用途,当前selenium都是基于无头模式的firefox或者chrome等浏览器进行爬虫抓取,天眼查的反爬技术算是很不错的,仅仅用于个人学习用,并不可以进行大数据的爬取 技术: python selenium 爬虫 模拟登陆...
  • 天眼查接入清单.zip

    2021-06-07 11:08:58
    天眼查接入清单.zip
  • 【行业了解】天眼查、企查查、启信宝、爱企查 前言 今天写《【行业分析】矿泉水行业》的时候,简单从两个三方平台获取信息,不过毕竟是第三方平台,我不了解的话我心里不放心,于是简单了解一下查企业的第三方平台。...

    【行业了解】天眼查、企查查、启信宝、爱企查

    前言

    今天写《【行业分析】矿泉水行业》的时候,简单从两个三方平台获取信息,不过毕竟是第三方平台,我不了解的话我心里不放心,于是简单了解一下查企业的第三方平台。

    11月22写《【企业分析】索菲亚》的时候用了三个平台查数据,于是先从这三家展开了解。

    爱企查》、《天眼查》、《企查查》、《启信宝

    目前我简单从爱企查以及萝卜投研,这两个渠道来获取信息。虽然借助了这两个第三方平台,但是这些第三方平台是整合了不错的一手数据的平台,我自己去搜集一手数据会花费大量时间。

    笔记

    自媒体文章

    信息来源:天眼查、企查查、启信宝“三查”大战,谁能抢夺C端市场?

    2019年7月30号写。

    商业查询,硝烟再起。

    近日,北京市海淀法院网发布一则消息,商业信息查询平台“天眼查”运营商将“企查查”运营商告到法院,并索赔520.45万元,原因是企查查在广告中用到了“查公司,查老板,查关系”这句广告语,而这句广告语的首创者正是天眼查。

    作为商业查询领域两家头部平台,企查查和天眼查的战争自2014年开始。2014年成立的国内第一家商业查询平台企查查,在2015年便宣布率先盈利。晚于其半年成立的天眼查直到2017年才开始商业化。而到了2018年3月,有数据称,天眼查的用户已经超过一亿,全面实现细分市场第一的成绩,后来者反而居上。另一家也于2014年成立的公司启信宝则称在B端市场占有绝对的优势。

    伴随着行业白热化,一场“三查大战”正在上演。

    2018年之后,在北京、上海、广州等全国各地城市的地铁、楼宇等广告位,天眼查和企查查轮番上演着广告大战。有数据称,天眼查投入的宣传资金近2亿元,企查查则与新潮传媒合作霸屏全国100个城市的新潮电梯电视。

    广告竞争的背后,是商业查询这个小众行业的C端市场争夺战。一位业内人士告诉燃财经(ID:rancaijing),企业征信本身就是一个非常小众的市场,而这其中又分企业信用评级、企业大数据、企业信息查询等不同维度的细分领域。绝大部分做企业征信的公司均面向B端开展业务,B端激烈的竞争,倒逼着商业信息查询公司必须做出差异化,向C端争夺市场。

    小众的商业查询生意

    2014年3月,在国家宣布计划公开政府层面企业工商信息之后,做体育SaaS类产品的杨京在主业外研发了一款引流工具,并改名企查查,开始推出商家工商信息查询服务。

    这是国内出现的第一家商业信息查询类创业公司。其核心原理是通过爬虫技术从国家工商信息网站等政府机构官方网站,以及互联网公开数据中爬取企业信息,进而形成商业信息报告,提供给B端企业和C端用户使用。

    2个月后,即2014年5月,启信宝也在苏州成立。到了同年10月,拥有海外工作背景和著名大厂工作经验的科学家柳超创办天眼查。

    柳超曾是河南省理工科高考第一名,2003年毕业于北京大学计算机系,拥有美国伊利诺伊大学计算机硕士与博士学位,后担任美国自然科学基金数据挖掘方向的专家评委。相比另外两家同类型公司的创始团队,柳超的背景足够耀眼,也使得日后其公司的发展路线有别于另外两家。

    img

    “三查”历次融资信息 单位:元 制图 / 燃财经

    在最初的几年,争夺战似乎更多是在企查查和启信宝之间展开。

    2015年9月,杨京接受猎云网采访时称,企查查当时已积累C端用户150万,平台的DAU查询量已达到15万,系统自查询量达到200万。就在这一年,企查查也摸索出一条商业化变现道路,即面向C端的查询基本是免费的,而盈利点在B端,企查查会给金融机构提供服务,并收取服务费。

    杨京称,2015年6月份,其B端销售额已突破150万元,自2015年公司就开始盈利。这也是三家公司中最早盈利的。2016年,企查查的用户量已在1800多万,日活在100万以上。

    启信宝则是在2015年9月被合合信息以3000万元价格收购。彼时,启信宝市场总监张康祥透露,启信宝已有全国7500万家企业的信用信息,基本可以覆盖所有在工商局注册过的企业,排名其后的公司仅拥有3000万家数据。启信宝已为1000多家客户提供企业信息查询服务,其中不乏京东万象、四大银行之一。

    尽管公布的数据维度不同,但都有领先对手的意思。

    相比而言,天眼查的系统直到2015年底、2016年初才上线。成立后的天眼查并没有着急进行商业化,而是做了一些技术上的改进。用柳超的话来说,天眼查投入了大笔资金在核心技术——ACID图数据库的研发上。或许这是柳超作为技术出身的强项。

    此后,天眼查追赶而至。2017年8月,柳超在接受媒体采访时称,拿百度指数来做衡量,天眼查已是行业第二名的5倍,第三名的9倍,日均访问在千万级。天眼查从2017年4月开始商业化,5月份便实现月盈亏平衡,柳超称当年底其营收达到6000万元。

    实际上,在2016年初,国内企业信用信息查询平台曾多达四十多家,此后行业开始分化,并逐渐发展成天眼查、企查查、启信宝“三足鼎立”的局面。

    但相比个人征信市场号称有千亿市场规模,国内的企业征信市场规模不足百亿。甚至根据前瞻产业研究院的数据,2017年我国信用服务市场规模仅为37.3亿元。

    一位征信行业从业者徐然告诉燃财经,企业征信本身是一个小众市场,这个小众市场又分为企业信用评级、企业大数据公司、企业信息查询等几个维度。仅企业信用领域,国内持企业征信牌照的公司就达130多家,企业大数据公司更是为数众多。这样来看,留给企业信息查询这个细分领域的市场少之又少。

    “绝大多数企业征信持牌企业都是做B端业务,就连作为美国三大征信巨头之一的益博睿征信公司在中国扎根十几年后,目前在中国一年的营业额也就一两个亿。B端的竞争非常激烈。”徐然说。

    而目前随着B端竞争的加剧,此前靠B端业务进行商业化的商业信息查询平台,也需要考虑差异化的方式。

    争夺C端市场

    在商业信息查询这个小众的市场里,各公司的商业模式差别并不大。所有商业信息查询公司均是通过爬虫技术在公开网站爬取商业信息,然后进行分析加工,形成商业信息报告对外出售。数据来源、技术模式、商业变现方式、客户群体均呈现同质化状态。这意味着,竞争在进一步加剧。

    2018年,这场竞争开始进入白热化。

    2018年初,媒体在报道中称,天眼查收录了全国超1.4亿家社会实体信息(公司、社会组织、律所等),包含上市信息、企业背景、企业发展、司法风险、经营风险、经营状况、知识产权等80种数据维度。而彼时百度统计,天眼查用户已经超过1亿。

    当时天眼查已经形成两条收入线:C端收入主要是会员费形式,用户充值后可查看详细搜索结果,包括企业联系方式等信息;在B端则多为大客户定制或者接口调用费。天眼查称,其C端占比略大,而B端的代表性客户有银行(中国人民银行)、金融机构(KPMG毕马威)以及互联网中的58赶集等,大客户客单价在几百万元。

    柳超称,这些数据采集自开放和共享的政府公共数据,覆盖2000多个数据源网站,然后再经历数据清洗、数据聚合、数据建模等流程,包含数千项数据指标与上万个数据模型,最后可视化的呈现出来。

    此前曾主要依靠B端带来收入的企业信息查询平台,又发现了一座宝藏——C端付费用户。

    获得C端市场,最好的方式便是打广告。

    也正是此时,天眼查、企查查和启信宝的商业广告开始霸占各大城市地铁广告位、电梯广告位。

    img

    天眼查在地铁里的户外广告

    在起诉文件中,天眼查运营公司北京金堤公司称,其于2014年11月首创“查公司,查老板,查关系”这句广告语,随后在北京、上海、广州等全国各地城市,投入了近2亿的资金,进行大范围宣传和推广。

    而在企查查以往的报道中称,其在全国28座城市投放了楼宇广告、地铁广告,整合多媒体资源头条、抖音、网红等投放。2019年,企查查还与新潮传媒合作,在全国100座城市的新潮电梯电视上上演了霸屏广告。

    img

    img

    天眼查和企查查的广告对比

    尽管启信宝的广告投放数据并未公开,但燃财经发现其同样在地铁、楼宇等广告位进行了大量投放。而且依靠背后公司的“全能名片王”等产品的带动,也获得了一波用户。

    广告投入的竞争得益于C端市场对商业数据的需求加大。实际上,随着新经济公司出现,C端用户在求职、业务推销、商业合作等等场景下均对此有较高需求。

    然而,这种模式也引发一些质疑。此前,有公司因名誉纠纷将企查查告上法庭,原因是企查查因数据错误擅自添加“疑似实际控制人”、“自身风险1条”等警示信息,放大了错误信息的负面影响。

    还有媒体报道称,天眼查、企查查等将企业电话甚至公司法人的手机号放在显眼位置,让一些公司法人遭遇电话骚扰。互联网上还有声称可以处理天眼查等平台上判决文书的信息,并且按照处理难度的不等给出不同的价格,价格在几千元不等。对此,天眼查回应称,平台上不存在任何付费删除数据的业务,内部也不存在漏洞。

    这些质疑并不影响“三查”用户的快速扩张。

    根据前瞻产业研究院发布的《2018-2023年中国征信行业市场前瞻与投资战略规划分析报告》,截至2018年6月,我国信用服务应用活跃用户规模已达872万。其中天眼查的活跃用户规模为275.2万,占总活跃用户的比重为31.6%;企查查的活跃用户规模为245.1万,占总活跃用户的比重为28.1%;启信宝的活跃用户规模为125.2万,占总活跃用户的比重为14.4%。三家企业为行业前三,在总活跃用户中合计占比超过74%。

    到2019年,企查查在对外宣传中称其个人注册用户近2亿,累计打开数量超过千万次。

    而对于天眼查,2018年3月底其公布的用户已经超过一亿,但此后的情况并未公布。在另一份数据中,截至2019年2月,天眼查企业客户累计6.48万家,其中,小微企业为2.08万家,占比32%。在另外一个维度,天眼查则公布其收录了1.8亿家社会实体信息。

    2018年9月,在启信宝成立三周年时,其对外宣称2018年用户量突破2亿,日活跃用户数突破100万。

    尽管公布的数据维度眼花缭乱,但可以看出三家企业似乎都把“2亿”看成一个竞争点。

    此次官司,也正是天眼查与企查查在广告投放领域的交锋,也是抢夺C端市场的“后遗症”。

    有专家在接受媒体采访时认为,此类诉讼通常从两个角度考虑维权,一是著作权侵权,即企查查使用与其相同的广告语,但前提是该广告语有独创性,属于作品,而“查公司、查老板、查关系”表达的是产品的基本功能,认定有独创性有难度,故天眼查未按照著作权侵权进行起诉。二是不正当竞争,即企查查使用的广告宣传页面与其相似、广告语相同,导致误导了消费者,有悖诚信原则和商业道德。

    至于判决如何,还要看相关证据证明。

    商业查询走向差异化

    面对颇为狭窄的市场规模,对于天眼查、企查查和启信宝们来说,走出差异化几乎是其必然的选择。

    2018年1月底,天眼查APP正式上线“商业头条”功能,切入信息流领域。除专业媒体的深度资讯之外,“商业头条”还细分了创投、文娱、科技、商业、职场等多个板块,通过图文、快讯的方式,推送给用户有价值的商业信息,实现从“搜索引擎”到“推荐引擎”的“商业信息获取闭环”。

    据悉,天眼查“商业头条”功能将采用机器推荐和用户推荐两种机制。一方面基于用户经常查询、浏览的数据,推送用户感兴趣的内容给他。另一方面,也将通过数据挖掘和机器学习,推送有价值的商业信息。

    此外,天眼查还与百度联合,对企业推出联合名片。在天眼查认证的公司,企业名片将在百度大幅展示。

    企查查则从商业信息查询切入知识产权查询。2018年8月,由企查查孵化的新项目权查查上线,它是一家“互联网+大数据+知识产权”的服务平台,包含PC端、H5页面以及第三方开放平台。

    权查查的创始团队和技术团队均出自于企查查,为企业和专业代理人提供知识产权交易撮合服务与管理,目前平台的主要盈利模式是通过知识产权交易获取佣金。得益于企查查的数据积累,权查查能够借助商业大数据资源库,打通知产与企业的关联关系。

    而启信宝把目光放眼全球。2019年3月,启信宝运营公司上海合合信息科技有限公司与商安信(上海)企业咨询管理股份有限公司宣布战略合作,推出企业信息查询行业内首款打通境内外企业数据查询业务的应用工具——全球版启信宝(双语版)。

    启信宝称,其以国内超过1.8亿家企业及组织机构数据为基础,同时纳入全球超过60个国家的海外企业的一整套信用信息查询结果。相比国内一些征信机构主要业务是个人信用,全球版启信宝针对的主要是企业征信和企业信用,更多的还是做企业信用和风险管理。

    在商业信息查询之外,今年4月,央行开闸企业征信牌照。5月份天眼查对外宣布,在公布新一批3家企业名单中,天眼查名列榜首。这也是商查领域第一家获得企业征信牌照的企业。

    2个月后,企查查运营主体——苏州朗动网络科技有限公司也对外宣布,其已经获得了央行企业征信机构备案。

    从小众的商查领域,再到企业征信领域,这场战火仍在蔓延。

    爱企查

    数据来源

    国家企业信用信息公示系统 信用中国 中国裁判文书网

    中国执行信息公开网 国家知识产权局 商标局

    版权局 上海合合信息科技发展有限公司

    企业介绍

    在北京,百度网讯?和百度有啥关系?

    image-20201124211823583

    融资情况

    image-20201124211922069

    咋感觉是假的。2001年融资A轮,1千万美元;

    刚刚看那个自媒体文章,天眼查、企查查、启信宝都2014年才开始;

    感觉这个在偷换概念。也许是幽默。

    企业产品

    image-20201124212110992

    北京百度网讯科技有限公司

    image-20201124212216505

    股东信息

    image-20201124212241061

    开玩笑吧,百度这么有钱,认缴一百多亿人民币。

    股权穿透

    image-20201124212337509

    幕后老板

    人物简介:

    2005年6月加盟百度,2011年6月晋升为副总裁,并担任总法律顾问,现任集团资深副总裁。曾在2013年初至2018年2月任CEO助理。梁志祥负责百度大法务审核监察体系工作,具体包括法务部、交易及合规法律部、政策研究部、专利事务部、业务监察部、刑事法务侦查部、风控体系产品技术部、在线管理部、业务审核管理部、法务体系糯米业务审核部等。 梁志祥毕业于美国耶鲁大学法学院,获得硕士学位。之前,梁志祥曾获得北京大学法学院,澳大利亚新南威尔士大学法学院法律学位。梁志祥曾供职于中国国务院法制办公室、君合律师事务所,并曾在美国达维律师事务所Davis Polk & Wardwell LLP纽约总部进行工作交流。梁志祥为公司在各种新业务、新模式的探索中提供了有力的政策法律支持和保障。梁志祥也曾直接参与百度2005年在美国纳斯达克IPO进程,完成了百度历年的收购兼并和国内外商务合作项目当中的政策和法律支持工作。

    image-20201124212446599

    貌似我get到了,原来爱企查的公司就是百度。那么百度才一百多亿,感觉少了(比腾讯、阿里)。

    天眼查

    数据来源

    数据来源:

    全国企业信用信息公示系统

    中国裁判文书网

    中国执行信息公开网

    国家知识产权局

    商标局

    版权局

    友情链接:全国城市企业排名站长之家BOSS直聘纷享销客看准网企鹅直播新网大街网搜狐游戏网易CC直播重庆购物狂19楼快科技喜马拉雅FM黄页88辣妈帮电子发烧友顺企网孔夫子旧书网亿欧雷锋网户外资料网斗米中国招标投标网天涯社区猎聘网什么值得买猪八戒爱站工具专利查询齐家网华律网慧聪网千里马招标网

    企业介绍

    image-20201124212736766

    融资

    image-20201124212750415

    北京金堤科技有限公司

    image-20201124212850044

    股权穿透

    image-20201124212920647

    幕后老板

    人物简介:

    柳超,天眼查CEO。中国大数据专家委员会委员,北京海外高层次人才,。出生于河南,于1999年获得河南省理工科高考第一名,2003年毕业于北京大学计算机系,2007年在韩家炜老师的指导下,获得美国伊利诺伊大学(UIUC)计算机硕士与博士学位。2008-2012年,柳超博士曾任职于美国微软研究院,正研究员,主管数据智能团队,在信息检索,数据挖掘,和机器学习等诸多领域的研究有突出贡献。2012年,柳超博士回国加入腾讯科技(北京)有限公司,领导“腾讯搜索”的相关数据挖掘与机器学习业务。2013年,腾讯与搜狗的战略合并之际,柳超博士加入搜狗科技,出任首席科学家。2014年离职创业。

    大佬都不简单啊

    image-20201124213037325

    企查查

    数据来源

    数据来源:

    全国企业信用信息公示系统

    中国裁判文书网

    中国执行信息公开网

    国家知识产权局

    商标局

    版权局

    企业介绍

    位于江苏

    image-20201124213338937

    核心人员

    image-20201124213401413

    融资

    image-20201124213428038

    之前看许多研报的数据来源都是wind,感觉wind应该是行业龙头

    企查查科技有限公司

    image-20201124213644569

    股权穿透

    image-20201124213703202

    主要人员

    image-20201124213722266

    变更记录

    image-20201124213803857

    幕后老板

    人物简介:

    陈德强, 担任企查查科技有限公司苏州企查查网络科技有限公司苏州知彼信息科技中心(有限合伙) 等法定代表人, 担任企查查科技有限公司苏州企查查网络科技有限公司苏州知彼信息科技中心(有限合伙) 等股东, 担任企查查科技有限公司苏州企查查网络科技有限公司苏州知彼信息科技中心(有限合伙)等高管。

    image-20201124213853494

    启信宝

    数据来源

    数据来源

    全国企业信用信息公示系统

    中国裁判文书网

    中国执行信息公开网

    国家知识产权局

    商标局

    版权局

    友情链接:

    合合信息名片全能王扫描全能王国务院发展研究中心信息网蝉大师权大师数据观象台中国加盟网中国比地招标网网络非法金融信息举报专区

    企业介绍

    也是江苏的,创建年份2006?

    image-20201124214117002

    融资

    image-20201124214152075

    企业产品

    image-20201124214211596

    没想到扫描全能王是他们家的产品!!!!!

    上海合合信息科技股份有限公司

    有点意思,产品是江苏的,公司是上海的。(上海是金融中心)

    image-20201124214324255

    股东信息(部分)

    image-20201124214347612

    股权穿透(密密麻麻,没看到重点)

    image-20201124214425187

    幕后老板

    人物简介:

    镇立新, 担任上海合合信息科技股份有限公司 等法定代表人, 担任上海合合信息科技股份有限公司端临(上海)科技发展合伙企业(有限合伙)上海狮吼投资管理有限责任公司 等股东, 担任上海合合信息科技股份有限公司上海狮吼投资管理有限责任公司等高管。

    这个人物图谱还好不密密麻麻。

    image-20201124214546718

    竞品

    序号竞品项目名称最新融资轮次成立时间所属地项目简介所属企业
    1联合征信联合征信-2019-06-26南京企业征信服务商江苏省联合征信有限公司
    2名企科技名企科技-2017-02-09北京会计服务和企业工商注… 展开北京名企科技有限公司
    3企查猫企查猫-2016-12-28深圳企业信息查询数据服务商深圳企查宝数据科技有限公司
    4三眼风控三眼风控天使轮2016-05-19上海企业工商信息查询平台上海焕彬信息科技有限公司
    5惠信易达惠信易达-2015-03-10北京B2B大数据征信服务商惠信易达征信服务(北京)有限公司
    6卫诚征信卫诚征信-2015-01-23上海个人及企业征信服务商上海卫诚企业征信有限公司
    7中胜信用中胜信用-2014-12-11北京信用风控第三方信用机构中胜信用管理有限公司
    8天眼查天眼查Pre-B轮2014-10-30北京企业信用信息查询平台北京金堤科技有限公司
    9水滴信用水滴信用A轮2014-10-16上海企业大数据信用评价平台上海凭安征信服务有限公司
    10企+企+A轮2014-09-15北京企业大数据查询平台北京企嘉科技有限公司
    11启信宝启信宝被收购2014-05-28苏州企业信息查询平台-
    12网信集团网信集团C轮2013-10-17北京信用管理和咨询服务征信机构网信集团有限公司
    13元素征信元素征信A轮2013-02-19北京征信服务运营商元素征信有限责任公司
    14简信简信天使轮2011-07-14上海企业定制移动互联网APP产…展开上海快库电子商务有限公司
    15北北京微视角天使轮2011-07-04北京企业级数据查询服务提供商北京微视角软件技术有限公司
    16维氏盾征信B轮2011-06-08上海企业在线征信平台上海维氏盾企业征信有限公司
    17工商管理一站通-2009-02-20武汉企业信息服务平台武汉一站通工商管理咨询有限公司
    18商安信商安信新三板2008-09-23上海信用信息提供商和信用风…展开商安信(上海)企业发展股份有限公司

    总结

    随便写写。感觉每次花个一个小时整理这些龙头企业的信息的时候能发现不少有意思的地方。

    比如上面四家企业的数据来源,那些数据的确有一手数据来源,回头了解一下。

    全国企业信用信息公示系统

    中国裁判文书网

    中国执行信息公开网

    国家知识产权局

    商标局

    版权局

    此外没想到爱企查是百度的,扫描全能王和启信宝是一家的等等;

    还有发现互联网企业和金融密切相关。像之前我了解阿里和腾讯的时候就发现有好多投资公司在里面套娃,一些小互联网公司也是这样。

    更新地址:GitHub

    更多内容请关注:CSDNGitHub掘金

    展开全文
  • 类似天眼查-企业工商分布式爬虫系统(含爬虫端+mongdb数据库+前端展示系统)
  • 天眼查询

    千次阅读 2017-11-23 17:13:34
    天眼查官方网址:...天眼查是一款 “都能用的商业调查工具”,实现了企业信息、企业发展、司法风险、经营风险、经营状况、知识产权等40种数据维度查询(企业工商信息、法律诉讼、法院公告、商标专利、向外投资、

    天眼查官方网址:https://www.tianyancha.com/

    国家企业信息信息公开系统:http://www.gsxt.gov.cn/corp-query-homepage.html


    介绍:

    天眼查是一款 “都能用的商业调查工具”,实现了企业信息、企业发展、司法风险、经营风险、经营状况、知识产权等40种数据维度查询(企业工商信息、法律诉讼、法院公告、商标专利、向外投资、分支机构、变更信息、债券、网站备案、著作权、招投标、失信、经营异常、企业年报、招聘及新闻动态等),深度商业“关系梳理”,专业信用报告呈现等功能。适合金融、投资、律师、咨询、记者、商务等人士。


    查看指标:

    1.天眼评分

           天眼查评分系统的逻辑极其复杂,是综合考量了企业自身、投资、股权等因素后,设计的独家评分模型,极具参考价值,分数越高,表明该企业综合实力越强。




    展开全文
  • 那么采集天眼查数据的方法有哪些呢?我给大家分享一下,我爬虫的个人经验,我们在采集类似天眼查网站数据的时候会遇到什么技术问题,然后再根据这些问题给大家分享采集方案. 一、写爬虫采集网站之前: 为什么经常...

    天眼查的企业数据、工商信息、法人号码、人员名录、网页抓取数据、网页爬虫、采集网站数据、网页数据采集软件、python爬虫、HTM网页提取、一站式网站采集技术、BI数据的数据分析、数据标注等成为大数据发展中的热门技术关键词。那么采集天眼查数据的方法有哪些呢?我给大家分享一下,我爬虫的个人经验,我们在采集类似天眼查网站数据的时候会遇到什么技术问题,然后再根据这些问题给大家分享采集方案.

    一、写爬虫采集网站之前:

    为什么经常听到有些网站的域名被劫持、服务器被heikegongji、数据库被盗等大家平时登录一个网站,记的都是类似www.tianyancha.com这样的网址。这叫做域名(domain name)。输入域名后是需要先通过DNS服务器来解析识别这个域名对应的服务器IP地址,每家公司网站的程序和数据都是放在自己服务器上的(如阿里云服务器或者自己购买的服务器),每个服务器有一个IP地址,只要知道这个IP地址,就可以访问到这个网站(特殊情况除外,比如设置了禁止IP访问权限)。

    (1)域名解析过程:输入www.tianyancha.com这网址(域名)怎么就可以访问到对应的网站呢?那是因为如果需要让您域名可以正常使用,就必须先把域名和您网站的服务器IP地址绑定在一起,以后用户在浏览器只要输入这个域名就等于输入您这个服务器IP地址了,这个绑定的过程叫做域名解析,互联网有13台DNS根服务器,专门来做域名解析,其中10台在美国(包括一台主根服务器),另外3台根服务器分别在英国、瑞典、日本,而中国一台都没有,那么,大家的担忧随之而来:很多朋友问我,如果美国的根服务器不为中国提供服务了,中国是不是就从网络上消失了?网站还能访问吗?其实域名服务器只是解析域作用而已,如果没有域名我们可以用IP访问网站,只是用IP访问记起来不方便而已,域名也就一个别名容易记住的简称的作用而已,例如103.235.46.39。这叫做IP地址,即Internet Protocol Address,互联网协议地址。比如输入 ping  www.tianyancha.com可以查到天眼查这个网址解析绑定到的是哪个服务器的IP地址

     

     从上面可以知道天眼查的IP地址为:103.235.46.39。当您知道这个网址的服务器IP地址时候,您在浏览器输入网址和您在浏览器输入这个IP地址 都是可以访问到这个网站的(除非有些禁止IP访问),通过这个手段,我们后面在做网站数据采集爬虫的时就可以直接请求IP地址去采集数据了,可以绕过网址直捣皇宫了,就算网址更换了,但是服务器是不变的,我们一样找到它网站老巢,采集它的数据。

    (2)域名劫持爬虫技术: 域名劫持是互联网gongji的一种方式,通过gongji域名解析服务器(DNS),实现劫持,因为如果要访问www.tianyancha.com 就必先经过DNS域名解析服务器来解析这个网址对应那台服务器IP地址。如果在这个过程有heike想攻您网站,比如heike想gongji天眼查,就可以在这个DNS解析域名环节做手脚,比如我想让所有用户打开www.tianyancha.com 直接访问的是我的广告网站,而不是天眼查自己服务器里面的网站网页。那很简单,那只要在DNS 解析天眼查这个网址的时候把对应的天眼查服务器IP地址 修改解析到您自己的网站服务器IP地址去,那么所有人打开这个www.tianyancha.com网址就实际就是打开您的网站了。这个过程就叫域名劫持,这种技术已经不是爬虫技术是高级的heike技术了。

    (3)钓鱼网站爬虫技术:通过域名劫持技术,很多人heike去劫持银行网站、支付宝网站、充值交易的网站等,比如他们先做一个和银行一模一样的网站,功能和长相和银行的一模一样,这个网站我们称呼钓鱼网站,用户打开银行网址时候,其实已经被劫持走了,真正访问的是他们提供的钓鱼网站,但是因为网址是一样的,网站长相也是一样的,用户压根不会识别出来,等您输入银行账号密码后,您的银行卡的钱估计就自动被转走了,因为已经知道您的账号密码了。对技术感兴趣朋友欢迎交流我扣扣:2779571288

    二、网站数据采集的10个经典方法:

     我们平时说的采集网站数据、数据抓取等,其实不是真正的采集数据,在我们的职业里这个最多算是正则表达式,网页源代码解析而已,谈不上爬虫采集技术难度,因为这种抓取主要是采集浏览器打开可以看到的数据,这个数据叫做html页面数据,比如您打开:www.jintancn.com这个网址,然后键盘按F12 ,可以直接看到这个网址的所有数据和源代码,这个网站主要是提供一些爬虫技术服务和定制,里面有些免费新工商数据,如果需要采集它数据,你可以写个正则匹配规则html标签,进行截取我们需要的字段信息即可。下面给大家总结一下采集类似这种工商、天眼、商标、专利、亚马逊、淘宝、app等普遍网站常用的几个方法,掌握这些访问几乎解决了90%的数据采集问题了。

     方法一: 用python的request方法

           用python的request方法,直接原生态代码,python感觉是为了爬虫和大数据而生的,我平时做的网络分布式爬虫、图像识别、AI模型都是用python,因为python有很多现存的库直接可以调用,比如您需要做个简单爬虫,比如我想采集天眼查 几行代码就可以搞定了,核心代码如下:

    import requests  #引用reques库

    response=request.get(‘https://www.tianyancha.com’)#用get模拟请求

    print(response.text)  #已经采集出来了,也许您会觉好神奇!

    方法二、用selenium模拟浏览器

    selenium是一个专门采集反爬很厉害的网站经常使用的工具,它主要是可以模拟浏览器去打开访问您需要采集的目标网站了,比如您需要采集天眼查或者企查查或者是淘宝、58、京东等各种商业的网站,那么这种网站服务端做了反爬技术了,如果您还是用python的request.get方法就容易被识别,被封IP。这个时候如果您对数据采集速度要求不太高,比如您一天只是采集几万条数据而已,那么这个工具是非常适合的。我当时在处理商标网时候也是用selenum,后面改用JS逆向了,如果您需要采集几百万几千万怎么办呢?下面的方法就可以用上了。

    方法三、用scrapy进行分布式高速采集

    Scrapy是适用于Python的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。scrapy 特点是异步高效分布式爬虫架构,可以开多进程 多线程池进行批量分布式采集。 比如您想采集1000万的数据,您就可以多设置几个结点和线程。Scrapy也有缺点的,它基于 twisted 框架,运行中的 exception 是不会干掉 reactor(反应器),并且异步框架出错后 是不会停掉其他任务的,数据出错后难以察觉。我2019年在做企业知识图谱建立的时候就是用这个框架,因为要完成1.8亿的全量工商企业数据采集和建立关系,维度比天眼还要多,主要是时候更新要求比天眼快。对技术感兴趣朋友欢迎交流我扣扣:2779571288

    方法四:用Crawley

    Crawley也是python开发出的爬虫框架,该框架致力于改变人们从互联网中提取数据的方式。它是基于Eventlet构建的高速网络爬虫框架、可以将爬取的数据导入为Json、XML格式。支持非关系数据跨、支持使用Cookie登录或访问那些只有登录才可以访问的网页。

    方法五:用PySpider

    相对于Scrapy框架而言,PySpider框架是一支新秀。它采用Python语言编写,分布式架构,支持多种数据库后端,强大的WebUI支持脚本编辑器、任务监视器、项目管理器以及结果查看器。 PPySpider的特点是ython脚本控制,可以用任何你喜欢的html解析包,Web界面编写调试脚本、起停脚本、监控执行状态、查看活动历史,并且支持RabbitMQ、Beanstalk、Redis和Kombu作为消息队列。用它做个两个外贸网站采集的项目,感觉还不错。

    方法六:用Aiohttp

    Aiohttp 是纯粹的异步框架,同时支持 HTTP 客户端和 HTTP 服务端,可以快速实现异步爬虫。坑比其他框架少。并且 aiohttp 解决了requests 的一个痛点,aiohttp 可以轻松实现自动转码,对于中文编码就很方便了。这个做异步爬虫很不错,我当时对几个淘宝网站异步检测商城里面的商品和价格变化后处理时用过一段时间。

    方法七:asks

    Python 自带一个异步的标准库 asyncio,但是这个库很多人觉得不好用,甚至是 Flask 库的作者公开抱怨自己花了好长时间才理解这玩意,于是就有好事者撇开它造了两个库叫做 curio 和 trio,而这里的 ask 则是封装了 curio 和 trio 的一个 http 请求库。

    方法八:vibora

    号称是现在最快的异步请求框架,跑分是最快的。写爬虫、写服务器响应都可以用,用过1个月后 就很少用了。

    方法九:Pyppeteer

    Pyppeteer 是异步无头浏览器(Headless Chrome),从跑分来看比 Selenium + webdriver 快,使用方式是最接近于浏览器的自身的设计接口的。它本身是来自 Google 维护的 puppeteer我经常使用它来提高selenium采集的一些反爬比较厉害的网站 比如裁判文书网,这种网站反爬识别很厉害。

    方法十:Fiddle++node JS逆向+request  (采集APP必用)

    Fiddler是一个蛮好用的抓包工具,可以将网络传输发送与接受的数据包进行截获、重发、编辑、转存等操作。我们在采集某个app时候,一般是先用Fiddler抓包 找到这个app请求这个数据时候调取的是后台的那个接口地址,找到这个地址和请求的参数然后再模拟request。今年在处理快手、抖音的粉丝、评价、商品店铺销量时候就用到了Fiddle。某些APP 和网站的参数是通过js加密的,比如商标网、裁判文书网、抖音快手等这些。您如果需要请求它的源api地址就的逆向解析破解这些加密参数,可以使用node解析混淆函数。因为平时需要经常采集一些app,所以和Fiddler打交道的比较多。

    前面主要是对网站和APP 数据采集和解析的一些方法,其实对这种网站爬虫技术说无非就解决三个问题:首先是封IP问题,您可以自建代理IP池解决这个问题的,第二个问题就是验证码问题,这个问题可以通过python的图像识别技术来解决或者是您直接调取第三方的打码平台解决。第三问题就是需要会员账号登录后才看到的数据,这个很简单直接用cookie池解决。对技术感兴趣朋友欢迎交流我扣扣:2779571288。

    展开全文

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,744
精华内容 1,497
关键字:

天眼查